首页技术seo文章详细

百度为什么不包括你的网站?

原创2019-11-17 10:54:20 48

 百度为什么不包括你的网站?

 2019-01-05 13:03

 

 

 对于新网站来说,还有什么比该网站没有被百度收录或索引更麻烦的呢?这篇文章的目的是帮助你找出百度不能索引你的网站的可能原因。

 

 如何检查百度的网站索引

 

 如果您想确保您的网页(或整个网站)没有在百度上建立索引,请按照以下步骤操作:

 

 1.使用“站点:ww.simcf.cc”进行查询,这将显示百度在搜索引擎中索引域的大致网址,如下图所示:

 

 

 

 2.登录百度网站管理员管理平台,转到索引数量,查看近似索引数量,如下图所示:

 

 

 

 百度不包括网站的九个常见原因

 

 1.200以外的响应代码

 

 如果页面没有生成200个服务器响应代码,那么不要期望搜索引擎对它们进行索引(或者保留索引,如果它们已经被索引的话)。有时网址会被意外重定向,导致404 0r 500错误,这取决于内容管理系统问题、服务器问题或用户错误。请快速检查以确保页面的网址加载正确。

 

 Txt块

 

 网站的/robots.txt文件(主要位于网站的根目录)为百度提供了抓取命令。如果网站上的某个特定网页缺少百度没有索引的索引,robots.txt文件是首先要检查的地方之一。如果你想检查网址是否被robots.txt文件屏蔽,请跳转到百度网站管理员管理平台进行“爬行诊断”测试,如下所示

 

 

 

 3.“noindex”元机器人标签

 

 网站上的网页在百度上不被索引的另一个常见原因是,它可能在网页上有一个“不索引”的元机器人标签。当百度看到这个元机器人标签时,这清楚地表明它不应该索引页面。百度将永远尊重这个命令,它可以采取多种形式,这取决于它的编码方法:

 

 以下是页面内容的截屏:

 

 

 

 要检查网页是否有“noindex”元机器人标签,请检查源代码并在中查找代码。如果网站是用java渲染的,您可能需要使用谷歌浏览器的“检查元素”功能来正确查看它。

 

 4.“no index”x机器人标签

 

 与元机器人标签相似,X机器人标签通过页面级标签提供控制百度索引的功能。但是,该标签用于特定页面或文档的标题响应。它通常用于不存在的非超文本标记语言页面,如PDF文件、文档文件和网站管理员希望远离百度索引的其他文件。“no index”X机器人标签不太可能被意外应用,但是你可以使用Chrome的搜索引擎优化站点工具扩展来检查它。如下所示:

 

 

 

 5.重复内容

 

 内容复制是任何搜索引擎优化工作的风险。内容的重复可能会使你的网页远离百度的索引,如果网页上重复内容的比例很大,可能会导致其排名不佳。如果你的网站有大量内容相似的特定网页,这可能是你的网页没有在百度上建立索引的主要原因(例如,所有的收集站都会非常慢)。

 

 6.整体指数缺乏价值

 

 一个特定的页面或者整个网站可能非常糟糕,以至于它不能为百度的索引提供足够的价值。例如,只有动态生成广告的联盟网站对用户没有什么价值。百度改进了算法,以避免排名(有时是索引)等网站。

 

 7.该网站仍是新的,未经证实

 

 百度和其他搜索引擎不会很快对新网站进行索引。它需要链接和其他信号,以使百度能够在其搜索结果(可见)中对网站进行索引和排名。这就是为什么链接建设对新网站如此重要。对于刚刚上线的网站,他们可以在上线后直接向百度提交链接请求,通常会在一个小时左右包含该网站的主页。

 

 

 

 8.页面加载时间

 

 如果网页加载缓慢且未修复,百度可能会随着时间降低排名,甚至可能被搜索引擎从索引中删除。正常情况下,索引卷将会下降。

 

 9.孤儿页面

 

 百度将抓取你的网站(和可扩展标记语言网站地图)以找到内容链接,更新其索引,并影响网站在搜索结果中的排名(和其他因素)。如果百度在你的网站或外部网站上找不到内容链接,那么百度就没有这些链接,所以它不会被索引。没有内部链接的页面被称为“孤立页面”,这可能是减少百度索引的原因之一。

 

 结论

 

 如果你认为这些东西太技术性,你最好咨询搜索引擎优化专家。如果你遇到困难,你需要确定你的时间有多宝贵。试图解决百度指数和排名的深夜花费将变得无聊。记住,指数不等于排名。百度对你的网站进行索引后,网站的内容质量、链接结构和品牌信号将决定网站的排名。然而,索引是搜索引擎优化旅程的第一步。

 

 


快审推荐