src = movie #取出它的url
r = requests.get(src) #去获取这个url
fname = url.split('/')[-1] #从url里面获取这个文件名
with open(fname, 'wb') as f: #应答的内容写进去并且使用二进制
f.write(s.content)
movie['poster-path'] = fname res = requests.get(url)
img_url = res.xpath('//img[@class="q-img-item"]/@src')
movie = img_url
download_poster_image(movie) #执行函数
这让我想到了一个应用场景,在实时网络征信系统中,通过即时网络爬虫从多个信用数据源获取数据。并且将数据即时注入到信用评估系统中,形成一个集成化的数据流。
可以通过下面的代码生成一个提取器将标准的HTML DOM对象输出为结构化内容。
图片来自集搜客网络爬虫官网,侵删。