如何使用python将以下信息入库

Python013

如何使用python将以下信息入库,第1张

如何用python实现 注意:密码中会出现双引号、单引号和逗号

Python code

#!/usr/bin/env python sfile = ( '{ "_id" : ObjectId( "4ad9469045343000008" ), "passwd" : "passwd1", "mail" : "", "id" : "", "src" : "weibo" }', '{ "_id" : ObjectId( "4ad9469045343000009" ), "passwd" : "passwd2", "mail" : "", "id" : "", "src" : "weibo" }', ) import re pat = re.compile('{ "_id" : ObjectId\( (.*) \), "passwd" : (.*), "mail" : (.*), "id" : (.*), "src" : (.*) }')for line in sfile: rs = pat

抓取每一页的所有a标签,采集所有href属性,分离域名,把此网站域名下的地址标记为采集入库条件,然后计算第一次采集到的地址的hash,如果hash重复,则不入库,否则入库再迭代二次采集,直到所有href的hash都复为结束条件,程序则认为数据库中已采集到此域下的所有地址,即可以开始抓站