跳转到主要内容

docx模块可以创建、读取和写入Microsoft Office Word 2007 docx文件

项目描述

简介

docx模块可以创建、读取和写入Microsoft Office Word 2007 docx文件。

这些文档被Microsoft称为“WordML”、“Office Open XML”和“Open XML”。

这些文档可以在Microsoft Office 2007/2010、Microsoft Mac Office 2008、Google Docs、OpenOffice.org 3和Apple iWork 08中打开。

它们也可以作为有效XML进行验证

该模块是在寻找对MS Word .docx文件的Python支持时创建的,但只能找到涉及COM自动化、调用.Net或Java或自动化OpenOffice或MS Office的各种黑客技巧。

docx模块具有以下功能

制作文档

制作文档的功能包括

  • 段落

  • 项目符号

  • 编号列表

  • 文档属性(作者、公司等)

  • 多个级别的标题

  • 表格

  • 章节和分页符

  • 图片

http://github.com/mikemaccana/python-docx/raw/master/screenshot.png

编辑文档

多亏了lxml模块的神奇之处,我们可以

  • 搜索和替换

  • 提取文档的纯文本

  • 在文档的任何位置添加和删除项目

  • 更改文档属性

  • 在文档的特定位置运行xpath查询 - 对于从用户完成的模板中检索数据非常有用。

入门

制作和修改文档

  • 只需下载python docx

  • 使用pipeasy_install获取lxmlPIL模块。

  • 然后运行

    example-makedocument.py

恭喜,您已成功创建并修改了一个Word文档!

从文档中提取文本

如果您只想从Word文件中提取文本,请运行

example-extracttext.py 'Some word file.docx' 'new file.txt'

想法与待办事项列表

  • 进一步改进图像处理

  • 文档健康检查

  • 鸡蛋

  • Markdown转换支持

我们热爱分支、更改和pull请求!

  • 查看[HACKING](HACKING.markdown),添加您自己的更改!

  • 对于此GitHub项目

  • 通过GitHub发送pull请求,我们将添加您的更改!

想聊天吗?需要帮助?

电子邮件python-docx@googlegroups.com

许可证

根据MIT许可证授权。

简而言之:此代码的版权归我(Mike MacCana)所有,我允许您随意使用,但不得从致谢中删除我的名字。有关具体条款,请参阅LICENSE文件。

项目详情


下载文件

下载适用于您的平台的文件。如果您不确定选择哪个,请了解安装包的更多信息。

源分布

docx-0.2.4.tar.gz (54.9 kB 查看哈希)

上传时间

由以下机构支持