nnpc.net
当前位置:首页 >> 如何用Python输出PPT中的文字信息 >>

如何用Python输出PPT中的文字信息

代码如下:import win32comfrom win32com.client import Dispatch, constantsppt = win32com.client.Dispatch('PowerPoint.Application')ppt.Visible = 1pptSel = ppt.Presentations.Open(r"C:\Users\Victor\Desktop\1.ppt")win32com.client.gencache.EnsureDispatch('PowerPoint.Application')

#coding =utf-8 reader = open('test.txt').readlines() n=0 for len in reader: writer=open(str(reader.index(len)+1)+'.txt','w') if (len.find('\n')>0): for n in range(0,10): writer.write(len[:-1]+reader[n]) else: for n in range(0,10): writer.write(len+reader[n]) writer.close() 这个基本能满足你要的功能,你把输入和输出的文件名改一下就行了

因为在发现新词时,你没有存入unique_list.改为unique_list = []for words in word_list: if words not in unique_list: unique_list.append(words) output_file.write(words + '\n')事实上整个脚本有些风格上的问题需要修改,不过我就不管了=~=顺带一提,在认定代码逻辑没有错误却发现输出不符合预期时,可以考虑简单地将过程中涉及的关键数据print出来,能发现出问题的代码片段,再进行修改.

可以用正则或者切片.处理大文本用正则,效率高.简单提取的话用切片就行了.取出“test”四个字母,需要找前后的标识符,这里可以看做是“one”和“text”中间的字符.1、切片使用方法(注意冒号):text = 'onetesttext123'right = text[

程序导出word文档的方法将web/html内容导出为world文档,再java中有很多解决方案,比如使用Jacob、Apache POI、Java2Word、iText等各种方式,以及使用freemarker这样的模板引擎这样的方式.php中也有一些相应的方法,但在python中将

下载第三方模块beautifulsoup,结合内建的urllib、urllib2模块.

提取pdf文字可以推荐一个工具 第一种文字型PDF比较简单,可以采用格式转换的方式直接转换PDF文件为文本.打开PDF文字识别软件,执行“文件”-“打开图像”导入PDF文件,然后执行“输出”-“PDF文件转换为TXT文件”第二种图像型PDF,有的PDF都是扫描图片,这个就不能复制文字了,可以采用OCR识别的方式,将PDF文件转换为可编辑文档.这也是本文主要讲的pdf文字识别方法.还是打开PDF文字提取软件,执行“文件”-“打开图像”导入PDF文件.然后执行“识别”-“开始识别”.

视图-工具栏-大纲(点普通视图)可以打开然后显示的就是你这个PPT的所有文字了

for z in zi.decode('utf-8'): print(z.encode('utf-8'))

ax.set_ylabel('a')

网站首页 | 网站地图
All rights reserved Powered by www.nnpc.net
copyright ©right 2010-2021。
内容来自网络,如有侵犯请联系客服。zhit325@qq.com