python爬取付费音乐并没有违反相关法律,因为这个软件所获得的数据是在公开网络里可以访问的数据,如果不是公开数据,是无法进行访问的。
python爬虫指的是Python网络爬虫,又被称为网页蜘蛛,是按照一定规则自动抓取网络信息当中的程序或者是脚本。
最简单的办法,不需要任何第三方库,获取网页源代码,进行正则匹配:import urllib,re
url = "" #网页地址
wp = urllib.urlopen(url) #打开连接
content = wp.read() #获取页面内容
m = re.match(r"^你的单词$", content)
len(m)
m就是匹配到所有单词的列表,len(m)就是该单词的个数了