前端时间,百度屏蔽新浪博客炒的沸沸扬扬,本人也在当天写了新浪博客屏蔽搜索引擎是喜是忧,在这里宿迁SEO郑重跟大家道歉,其实新浪博客到底屏蔽百度了吗现在外界说法还是不统一,今天我可以在这里跟大家说,其实新浪博客根本没有屏蔽百度蜘蛛。
我们来仔细看下新浪的代码:
#开放百度的搜索引擎的User-Agent代码 User-agent: Baiduspider #限制不能搜索的目录,Disallow: 为空时开放所有目录#### Disallow: /admin/ Disallow: /include/ Disallow: /html/ Disallow: /queue/ Disallow: /config/ #开放bing.com的搜索引擎的User-Agent代码 User-agent: msnbot #限制不能搜索的目录,Disallow: 为空时开放所有目录#### Disallow: /admin/ Disallow: /include/ Disallow: /html/ Disallow: /queue/ Disallow: /config/ User-agent: bing #限制不能搜索的目录,Disallow: 为空时开放所有目录#### Disallow: /admin/ Disallow: /include/ Disallow: /html/ Disallow: /queue/ Disallow: /config/ #限制的搜索引擎的User-Agent代码,*表示所有########### User-agent: * #临时限制对所有目录的禁止抓取 Disallow: / #限制不能搜索的目录,Disallow: 为空时开放所有目录#### ##Disallow: /admin/ ##Disallow: /include/ ##Disallow: /html/ ##Disallow: /queue/ ##Disallow: /config/ #开放搜索的目录有#################################### # / # /advice/ # /help/ # /lm/ # /main/ # /myblog/ #搜索引擎User-Agent代码对照表######################## # 搜索引擎 User-Agent代码 # AltaVista Scooter # Infoseek Infoseek # Hotbot Slurp # AOL Search Slurp # Excite ArchitextSpider # Google Googlebot # Goto Slurp # Lycos Lycos # MSN MSNBOT # Netscape Googlebot # NorthernLight Gulliver # WebCrawler ArchitextSpider # Iwon Slurp # Fast Fast # DirectHit Grabber # Yahoo Web Pages Googlebot # Looksmart Web Pages Slurp # Baiduspider Baidu
从这些代码中我们可以看到,新浪只是限制了百度搜索其中的某些文件。限制目录外的文件是允许抓取的。robots.txt不是继承关系。是并的关系。所以用一些robot工具来搜索是不准确的。我们可以在百度输入:site:blog.sina.com.cn 就知道到底有没有屏蔽了,如果搜不到文章,那才是被屏蔽了,但是我们可以看到搜的文章多的一塌糊涂!
但是有人来反驳了,为什么我的博客百度搜不到了?这个怎么解释?宿迁网站优化认为这有可能是百度顺势炒作一把,把新浪博客降权了,从而来推广百度空间。之前我也提到用新浪建立唯一名称百度是秒收的。那么这样的话 大量垃圾的博客就产生了。所以百度给降权,造成很多博客搜不到!
但是具体是怎么情况,胜利的成功日记不敢断言,但是我可以肯定的是,新浪博客没有屏蔽百度蜘蛛!

