为什么python中用正则.*?输出为空列表

Python034

为什么python中用正则.*?输出为空列表,第1张

1、选取正则表达式的方式不对。

2、你爬取的内容是动态的,返回的html里没有相应的信息,例如京东的价格,评论,这样就不能用正则表达式来匹配,你需要从接口里爬取。

3、以上两种可能都没有的话,就只有可能你爬的网址有十分强大的反爬虫,就是不让你爬。

正好我也在做这题。

如果把%22替换为""的话,就会出现errno:1的情况,也就是没有novel数据,只需要url = 原来的链接就能得到正确的答案了

由于我是新手,感觉挺怪的不知道其原理