什么样的网站结构容易被收录

2025-03-06 18:11:03
推荐回答(3个)
回答1:

扁平结构容易被收录,首页到详情页的层次少,搜索引擎容易抓取

回答2:

  • 扁平or树型:一说到网站结构,大家都会提到扁平结构和树型结构,言必称“结构扁平化”,这些指的是物理结构,即基于内容聚合的目录及文件位置决定的结构。其实对于百度搜索引擎来说,只要结构合理、有逻辑性、内容有规律可循都可以,都是友好的。

  • 链接结构:相对于物理结构,就要说到逻辑结构:即通过内部链接形成的链接结构,逻辑结构才是搜索引擎最关注的。对于一个网站来说,网页仅仅可以通过首页——目录1——目录2一层一层follow到是远远不够的,一个优秀的链接结构应该是网状的。

  • 首页链接应该链向重要的频道页,频道页再链向下面的节点页或普通页面。同时,频道页、节点页和普通页面都应该可以链回到首页

  • 无论哪些页面之间互相链接,都需要一个描述恰当的锚文本

  • 链接不要放在JS、FLASH等搜索引擎不可见的位置,使用图片做链接入口应该完善alt标签

  • 百度搜索引擎目前仅支持对部分JS和FLASH进行解析,绝大多数放在JS和FLASH里的链接都是获取不到的

  • 为重要页面留更多入口。百度搜索引擎认为,获得更多内部投票的网页相对来说更加重要

  • “离首页越近”的网页,越容易受到百度重视。这个“近”指的是页面离首页的点击距离。即使URL所在目录层级较深,只要在首页有入口,百度也认为这是一个非常重要的页面。

  • 不要产生可怕的孤岛页面。虽然百度在提交入口、社会化挖掘方面做了许多工作,但链接抓取依然是百度获得新页面的最重要渠道

回答3:

以下网站结构容易被收录:

  1. 简单明了的网站结构

    Spider抓取相当于对web这个有向图进行遍历,那么一个简单明了结构层次分明的网站肯定是它所喜欢的,并尽量保证spider的可读性。

    (1)树型结构最优的结构即“首页—频道—详情页”;

    (2)扁平首页到详情页的层次尽量少,既对抓取友好又可以很好的传递权重。

    (3)网状保证每个页面都至少有一个文本链接指向,可以使网站尽可能全面的被抓取收录,内链建设同样对排序能够产生积极作用。

    (4)导航为每个页面加一个导航方便用户知晓所在路径。

    (5)子域与目录的选择相信有大批的站长对此有疑问,在我们看来,当内容较少并且内容相关度较高时建议以目录形式来实现,有利于权重的继承与收敛;当内容量较多并且与主站相关度略差时建议再以子域的形式来实现。

  2. 简洁美观的url规则

    (1)唯一性网站中同一内容页只与唯一一个url相对应,过多形式的url将分散该页面的权重,并且目标url在系统中有被滤重的风险;

    (2)简洁性动态参数尽量少,保证url尽量短;

    (3)美观性使得用户及机器能够通过url即可判断出页面内容的主旨;

    我们推荐如下形式的url:url尽量短且易读使得用户能够快速理解,例如使用拼音作为目录名称;同一内容在系统中只产生唯一的url与之对应,去掉无意义的参数;如果无法保证url的唯一性,尽量使不同形式的url301到目标url;防止用户输错的备用域名301至主域名。

  3. 其他注意事项

    (1)不要忽略倒霉的robots文件,默认情况下部分系统robots是封禁搜索引擎抓取的,当网站建立后及时查看并书写合适的robots文件,网站日常维护过程中也要注意定期检查;

    (2)建立网站sitemap文件、死链文件,并及时通过百度站长平台进行提交;

    (3)部分电商网站存在地域跳转问题,有货无货建议统一做成一个页面,在页面中标识有无货即可,不要此地区无货即返回一个无效页面,由于spider出口的有限性将造成正常页面无法收录。

    (4)合理利用站长平台提供的robots、sitemap、索引量、抓取压力、死链提交、网站改版等工具。