docx模块可以创建、读取和写入Microsoft Office Word 2007 docx文件
项目描述
简介
docx模块可以创建、读取和写入Microsoft Office Word 2007 docx文件。
这些文档被Microsoft称为“WordML”、“Office Open XML”和“Open XML”。
这些文档可以在Microsoft Office 2007/2010、Microsoft Mac Office 2008、Google Docs、OpenOffice.org 3和Apple iWork 08中打开。
它们也可以作为有效XML进行验证。
该模块是在寻找对MS Word .docx文件的Python支持时创建的,但只能找到涉及COM自动化、调用.Net或Java或自动化OpenOffice或MS Office的各种黑客技巧。
docx模块具有以下功能
制作文档
制作文档的功能包括
段落
项目符号
编号列表
文档属性(作者、公司等)
多个级别的标题
表格
章节和分页符
图片
编辑文档
多亏了lxml模块的神奇之处,我们可以
搜索和替换
提取文档的纯文本
在文档的任何位置添加和删除项目
更改文档属性
在文档的特定位置运行xpath查询 - 对于从用户完成的模板中检索数据非常有用。
入门
制作和修改文档
使用pip或easy_install获取lxml和PIL模块。
然后运行
example-makedocument.py
恭喜,您已成功创建并修改了一个Word文档!
从文档中提取文本
如果您只想从Word文件中提取文本,请运行
example-extracttext.py 'Some word file.docx' 'new file.txt'
想法与待办事项列表
进一步改进图像处理
文档健康检查
鸡蛋
Markdown转换支持
我们热爱分支、更改和pull请求!
查看[HACKING](HACKING.markdown),添加您自己的更改!
对于此GitHub项目
通过GitHub发送pull请求,我们将添加您的更改!
想聊天吗?需要帮助?
许可证
根据MIT许可证授权。
简而言之:此代码的版权归我(Mike MacCana)所有,我允许您随意使用,但不得从致谢中删除我的名字。有关具体条款,请参阅LICENSE文件。
项目详情
docx-0.2.4.tar.gz的哈希
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 9d7595eac6e86cda0b7136a2995318d039c1f3eaa368a3300805abbbe5dc8877 |
|
MD5 | 9ef0cd4157edcf37ee789bc0f98a9114 |
|
BLAKE2b-256 | 4a8e5a01644697b03016de339ef444cfff28367f92984dc74eddaab1ed60eada |