这个脚本其实在模拟一个提交表单的过程(使用POST方法, 无法在跳转后的页面的url中看出你提交了什么)...这个表单的数据全都提交给了url, 而values是想提交的数据, 他是一个字典, 他的键通常对应的是想要提交的表单中的input标签的name值, 而键对应得值就是你想给这个input标签填充的数据.
而百度搜索则不同, 他的表单以GET方式提交, 这也就意味着你不需要上述脚本中的方式, 只需要打开 http://www.baidu.com/s?wd=你想要搜索的值 这个url就可以看到搜索结果
因此大概脚本应该是这样:
import urllib
import urllib2
url = 'http://www.baidu.com/s?wd={0}'.format('希望搜索的东西')
req = urllib2.Request(url)
res = urllib2.urlopen(req)
res.read()
#coding:utf-8def checknum(l,n=1):
#计算列表中连续=n的数目,返回最大连续数
res=[]
count=0
for i in l:
if i == n:
count+=1
else:
res.append(count)
count=0
return max(res)
d=[
[1, 0, 0,1],
[1, 1, 1,1],
[1, 1, 0,0],
[1, 1, 1,1],
[0, 0, 0,1]
]
d2=[[i[j] for i in d] for j in range(len(d[0]))] #转为列形式
print [i.count(1) for i in d2] #每列中含有1的数目
print [checknum(l) for l in d2] #每列中连续出现1的数目
输出:
[4, 3, 2, 4][4, 3, 1, 2]