关于python post自动发帖的问题。。。

Python015

关于python post自动发帖的问题。。。,第1张

不大明白你描述的情况。随便说几点:

1.

修改urllib2的agent。因为许多机器人发帖程序都用了urllib2,默认agent可能会被屏蔽。你可以通过改agent把自己伪装成IE或者firefox之类的浏览器。

2.

什么叫投递到发贴框中?难道你所谓的发帖是通过修改DOM节点实现的???正确的发帖程序应该先分析页面form的组成,然后组装出合适的http

request,通过POST或者GET方法发出去。

去年在公司写过一个爬虫工具,用于抓取自动化报告通过率、自动发送报告。由于当时是第一次接触爬虫,难免会遇到各种问题,解决方案全都是按照网上的一些爬虫文章示例,照猫画虎写的。虽然能正常使用,但其实很多地方都没弄明白。最近学习了一些前端和后台的原理,了解了cookie与session的机制,总算弄明白了爬虫登录过程中的一个疑问。

编写爬虫第一步,在登录公司的自动化平台时就遇到了一个难题,登录请求中必须包含一个authenticity_token字段。令人头大的是,完全不知道这个字段从何而来,而且该字段还每次都不一样,参考的爬虫登录示例也没教啊!真是急坏苯宝宝了