百度蜘蛛爬行CSS和JS很多,这会不会浪费了蜘蛛的资源

JavaScript021

百度蜘蛛爬行CSS和JS很多,这会不会浪费了蜘蛛的资源,第1张

百度爬虫能识别css和js里的内容,而且一般查看服务器日志里,都会有对js、css以及图片的抓取,不用担心浪费爬虫资源,一般来说百度都会派出一些爬虫去抓取样式表script等,主要是为了确保快照的正常展示,我自己也尝试过屏蔽,对百度快照的影响比较大。

如果听过N年前阿里巴巴前SEO负责人张国平的培训课程,就知道目前阿里系SEOer,基本上不建议屏蔽对静态文件的抓取的。

查看百度蜘蛛爬行记录的方法:

第一,前往空间服务器,下载网站日志。

第二,打开网站日志文件,搜索:Baiduspider。

百度(Baidu)爬虫名称:Baiduspider

第三,鉴别百度蜘蛛的真伪。

由于很多站长工具会模拟百度蜘蛛的名称来爬抓网站,因此,需要我们鉴别百度蜘蛛的真伪。

鉴别方法:

开始—运行—输入 cmd ,用命令nslookup +ip

只要是百度的IP段,代码中会有出现:name:baiduspider,如果没有出现,那就不说不是真的百度IP段

第四,可以通过日志工具来查看网站日志。例如:光年日志。