百度收录问题:百度爬虫抓取的是页面的字符串原代码还是页面浏览器显示后的代码

2025-05-19 23:42:55
推荐回答(2个)
回答1:

百度爬虫爬到的是你在浏览器上右键鼠标,点击源代码看到的内容,ajax动态写入的内容抓不到。

爬虫是很古老的技术了,那时还没有ajax这种概念。

回答2:

代码:User-agent: Baiduspider
Disallow: /
操作方法:
第一步骤:登陆网站后台
第二步骤:找到根目录里的robots.txt文件并打开
第三步骤:把上面的代码复制黏贴到robots.txt文件里
第四步骤:保存及更新
代码的意思是:禁止百度蜘蛛抓取的意思,禁止百度蜘蛛抓取网站信息的意思