scrapy 中的css 选择器怎么看

html-css025

scrapy 中的css 选择器怎么看,第1张

//通过 名为 video_part_lists 的Class 中下面的 li 标签

liList = response.css('.video_part_lists li')

for li in liList:再通过li 标签获取 a 标签中得 href 属性

name= li.css('a::attr(href)').extract()

爬虫跟踪下一页的方法是自己模拟点击下一页连接,然后发出新的请求。请看: item1 = Item()yield item1item2 = Item()yield item2req = Request(url='下一页的链接', callback=self.parse)yield req 注意使用yield时不要用return语句。