怎么用Python爬取抖音高点赞高收藏的短视频?

Python07

怎么用Python爬取抖音高点赞高收藏的短视频?,第1张

用scrapy框架,但是你这样做侵犯了知识版权,如果用于商用,会面临起诉。

记者从北京市海淀区人民法院获悉,因认为刷宝APP采用技术手段或人工方式获取抖音APP短视频及评论并向公众提供的行为构成不正当竞争,北京微播视界科技有限公司(下称微播公司)将北京创锐文化传媒有限公司(下称创锐公司)、成都力奥文化传播有限公司(下称力奥公司)诉至法院。在案件审理过程中,微播公司提出行为保全申请,要求创锐公司、力奥公司立即停止采用技术手段或人工方式获取来源于抖音APP中的视频文件、评论内容并通过刷宝APP向公众提供的行为。北京海淀法院于6月28日依法做出行为保全裁定,支持了微播公司的行为保全申请。

微播公司称,其为抖音APP的开发者和运营者,通过投入高额的运营成本、提供优质的原创内容在同类产品中形成竞争优势,微播公司对抖音APP中的短视频及评论享有合法权益。二被申请人作为同业竞争者,在其共同运营的刷宝APP中向公众提供非法抓取自抖音APP的短视频及用户评论,已取证的短视频数量达5万余条。二被申请人的上述行为削弱了微播公司的竞争优势,违反了反不正当竞争法第二条的规定,构成不正当竞争。

可以使用selenium+ phantomjs

PhantomJS是一个基于webkit的JavaScript API。它使用QtWebKit作为它核心浏览器的功能,使用webkit来编译解释执行JavaScript代码。任何你可以在基于webkit浏览器做的事情,它都能做到。它不仅是个隐形的浏览器,提供了诸如CSS选择器、支持Web标准、DOM操作、JSON、HTML5、Canvas、SVG等,同时也提供了处理文件I/O的操作,从而使你可以向操作系统读写文件等。PhantomJS的用处可谓非常广泛,诸如前端无界面自动化测试(需要结合Jasmin)、网络监测、网页截屏等。