巧用robots规避蜘蛛黑洞

发布时间：2023-04-03 10:15:52 所属栏目：搜索优化来源：

导读： 对于百度等搜索引擎来说，蜘蛛黑洞特指网站通过极低的成本制造出大量参数过多，以及内容雷同但具体参数不同的动态URL ，就像一个无限循环的“黑洞”将spider困住，Baiduspider浪费了大量资源，抓取的

对于百度等搜索引擎来说，蜘蛛黑洞特指网站通过极低的成本制造出大量参数过多，以及内容雷同但具体参数不同的动态URL ，就像一个无限循环的“黑洞”将spider困住，Baiduspider浪费了大量资源，抓取的却是无效网页。

比如很多网站都有筛选功能，通过筛选功能产生的网页经常会被搜索引擎大量抓取，而这其中很大一部分检索价值不高，如“500-1000之间价格的租房”，首先网站（包括现实中）上基本没有相关资源，其次站内用户和搜索引擎用户都没有这种检索习惯。这种网页被搜索引擎大量抓取，只能是占用网站宝贵的抓取配额。那么该如何避免这种情况呢？

同样是条件筛选结果，当用户选择不同排序条件后，会生成带有不同参数的动态链接，而且即使是同一种排序条件（如：都是按销量降序排列），所以生成的参数也都是各种各样的不同的。

robots.txt的文件用法中有这样一条规则：Disallow: /*?* ，即禁止搜索引擎访问网站中所有的动态页面。该网站恰是通过这种方式，对Baiduspider优先展示高质量页面、屏蔽了低质量页面，为Baiduspider提供了更友好的网站结构，避免了黑洞的形成。同时，对于一些不需要优化的网站，可以直接跳过seo优化，节省了大量的时间成本。

（编辑：银川站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

解决文章采集反而排名	网站SEO和网商SEO有啥
网站SEO优化的关注点有	怎么利用视频打造外链