liList = response.css('.video_part_lists li')
for li in liList:再通过li 标签获取 a 标签中得 href 属性
name= li.css('a::attr(href)').extract()
方式1:我曾经看到过有一个人写了一个小程序,可以把网站的所有图片以及css下载到本地。你可以一下,我忘记哪里的了。方式2:使用迅雷,安装的时候选择安装浏览器右键增强。然后重启浏览器打开网页,右键中选择“下载所有链接”,然后会出来一个筛选框,选择后缀为“jpg,gif,png”,然后点击下载,这个时候迅雷会把网页上所有的图片下载下来。
方式3,。。。。不高兴打字了。
xpath 如果返回的是多个元素的话,比如你这里就是多个<p> 那就要用到循环
content=""for selector in sel.xpath('//div[@class="document"]//p'):
content=content+ selector.xpath("/text()").extract()