1用dryscrape库动态抓取页面
js脚本是通过浏览器来执行并返回信息的,所以,抓取js执行后的页面,一个最直接的方式就是用python模拟浏览器的行为。WebKit 是一个开源的浏览器引擎,python提供了许多库可以调用这个引擎,dryscrape便是其中之一,它调用webkit引擎来处理包含js等的网页!
2 selenium web测试框架
selenium是一个web测试框架,它允许调用本地的浏览器引擎发送网页请求,所以,它同样可以实现抓取页面的要求。
Js脚本写不对,你先在浏览器控制中调试js,正确后再粘贴到脚本中执行。document.getElementById方法返回的是一个element对象,我记得它好象没有value这个属性,你再查查DOM手册看看。如果你要获取对象的内容,应该使用innerHTML这个属性。