想用python编写一个脚本,登录网页,在网页里做一系列操作,应该怎样实现?

Python016

想用python编写一个脚本,登录网页,在网页里做一系列操作,应该怎样实现?,第1张

python编写一个脚本的具体操作:

1、首先,打开python并创建一个新的PY文件。

2、其次,import os,因为涉及系统文件的路径,因此首先在此处导入系统模块。

3、随后,可以双击打开HTML文件,然后就可以看到书写的网页,如下图所示。

4、最后,添加html.close(),需添加此行代码以关闭,否则将占用大量内存,如下图所示。这样,用python简单的制作一个网页的所有操作就完成了。完成。

1.绝大部分都可以,不过如今有个别基于localStorage的登陆,这套做法似乎不能很好处理;websocket的会话维持自然也不行。各个网站登陆逻辑可能各有差异,但是绝大部分还是围绕cookie为核心的,毕竟HTTP本身无状态,要做区分总得靠一些本地存储的玩意来保持,而cookie最常见。基本上原样保留cookie就能解决绝大多数此类问题。

2.基本上主要流程还是浏览器访问一下,跟一跟收发的request/response。登录行为不可或缺的一部分工作就是需要post个请求来送用户名和密码,然后根据response拿到个会话标记(之前说了大部分是cookie)。如果要自动发这个post,要分析一下究竟发的是个多段表单还是json或者别的什么东西。传统风格的页面里一般都是表单跳转,因此掏出表单填好内容post出去就好。不过很多登陆中密码是做过些处理的,比如在前端先跑个hash之类,需要看看js;此外还有可能有csrf之类的玩意。把相应的response里的cookie维持下来一般就好。当然如果只考虑单用户情况,浏览器登录一遍找到cookie原样保存也是个办法。个别网站甚至会动态刷cookie里保存的会话标记,那就另一说了。

3.对于大多数人,其实还是推荐requests包(不是urllib.request),通过requests.session维持会话的cookie信息,节省工作量同时也减少出错可能,比urllib+cookiejar其实方便得多。至于其他人说到的伪造UA之类,反正只是改改HTTP header,啥库都能做到。