Python获取word表格数据怎么做?Python如何获取word文件中表格
罗西汉
优草派
word文件之中是可以去添加表格这种特殊格式数据的,而python中虽然有方法可以将文件内容读取出来,但是对于表格数据还是要单独提取才可以。下面这篇文章主要介绍的内容就是python获取word文件表格数据的方法,对你有帮助的话就继续向下阅读吧。
一、安装库
那么python标准库以及内置模块之中没有能够对word文件进行操作的方法,所以需要去下载安装python-docx这个模块才可以。而它也只能够对docx后缀名的文档进行操作,也就是说使用WPS保存出来的文档无法使用该模块操作。
点击屏幕左下角调出开始菜单,然后输入命令并在最佳匹配下右键选择以管理员身份运行,再执行如下命令即可:
pip install python-docx
二、获取表格数据
而在python程序内使用它则是需要用docx这个名称,直接用下载安装时的模块名无法导入。而也只需要导入其中的方法Document()就可以了,该方法可以读取一个指定路径的word文件并将其打开。打开之后用返回的对象点tables属性即可获取该word文档中所有表格,示例如下:
from docx import Document path = r'C:\Users\word.docx' document = Document(path) tables = document.tables
而这些表格都是按照顺序保存起来的,所有用切片方式就可以获取到指定位置的表格。而将表格数据取出来则是通过循环再加上行号以及列表,详细代码示例如下所示:
table0 = tables[0] n = 0 for i in range(0, len(table0.rows) + 1, 3): date = table0.cell(i, 1).text title = table0.cell(i + 1, 1).text.strip() dfn = tables[j].cell(i, 3).text.strip() print(n, date, tite, dfn)
以上就是关于“Python获取word表格数据怎么做?Python如何获取word文件中表格”的全部内容了,希望对你有所帮助。
【原创声明】凡注明“来源:优草派”的文章,系本站原创,任何单位或个人未经本站书面授权不得转载、链接、转贴或以其他方式复制发表。否则,本站将依法追究其法律责任。