有状态的、程序化的网页浏览
项目描述
主要功能
使用Python进行有状态的程序化网络浏览
浏览器类mechanize.Browser实现了urllib2.OpenerDirector的接口,因此可以打开任何URL,而不仅仅是http。
简单的HTML表单填写。
方便的链接解析和跟踪。
浏览器历史记录(.back()和.reload()方法)。
Referer HTTP头被正确添加(可选)。
自动遵守 robots.txt。
自动处理 HTTP-Equiv 和 Refresh。
安装
为正常使用安装
pip3 install mechanize
为开发安装
git clone https://github.com/python-mechanize/mechanize.git
cd mechanize
pip3 install -e .
手动安装,只需将 mechanize 子目录添加到您的 PYTHONPATH 上的某个位置。
文档
致谢
python-mechanize 由 John J. Lee 创建。自 2017 年起由 Kovid Goyal 维护。
大量代码最初源自以下人员的作品
Gisle Aas – [libwww-perl]
Jeremy Hylton(以及许多人)– [urllib2]
Andy Lester – [WWW::Mechanize]
Johnny Lee(巧合地同名)– 来自 MSIE CookieJar Perl 代码,mechanize 的支持由此代码派生。
此外
Gary Poster 和 Benji York 在 Zope Corporation – 对 HTML 表单代码做出了重大贡献
Ronald Tschalar – 提供了有关 Netscape Cookies 的帮助
还要感谢那些提交了错误报告和补丁的许多人。
项目详情
下载文件
下载适用于您的平台的文件。如果您不确定选择哪个,请了解有关 安装包 的更多信息。
源代码发行版
mechanize-0.4.10.tar.gz (218.3 kB 查看哈希值)
构建发行版
mechanize-0.4.10-py2.py3-none-any.whl (110.4 kB 查看哈希值)