html 后面的参数影响爬虫抓取吗

html-css06

html 后面的参数影响爬虫抓取吗,第1张

答案是肯定的,url后面带有参数以及特殊符号(?、&、%等)的属于动态网址,对于网站优化来说(也就是爬虫)有很大的局限性,常常一些表单提交才需要动态网址,这样是为了防止用户提交的信息泄露。所以动态的网址是对爬虫抓取是有影响的;

静态化之后的url。html本身不具有传参数的能力,这个页面我假定它是php做的后台,那他的页面实际上url是这样的XXXX.php?utm_source=RTB&utm_medium=BANNER_R.....静态化之后会把最后的文件.php映射成html的形式,结果会使人一下反应不过来。这个就是个单纯的GET传值,只不过混合了静态化技术而已。