比如一系列的破解带验证码的网站,python的图形库有自带识别验证码的库,你只需要负责使用。负责把破解的逻辑写下来就差不多。
网站有专门的条款说明用户应当遵守的规定,比如百度知道就对其内容拥有知识产权,在未经允许不能转载传播。网站虽然不知道你是否会去传播,但是可以通过访问网页的速度判断你是否是一个机器人。要想避免网站发现你在爬内容,可以适当限制爬去网页的速度。
比如一系列的破解带验证码的网站,python的图形库有自带识别验证码的库,你只需要负责使用。负责把破解的逻辑写下来就差不多。
网站有专门的条款说明用户应当遵守的规定,比如百度知道就对其内容拥有知识产权,在未经允许不能转载传播。网站虽然不知道你是否会去传播,但是可以通过访问网页的速度判断你是否是一个机器人。要想避免网站发现你在爬内容,可以适当限制爬去网页的速度。