远方的海
远方的海,WordPress,免费
2015 Sep 07 23 : 22

网站开启SSL(HTTPS)后 百度SEO的完美解决方案

您当前的位置: 首页 > 建站资源 > SEO > 正文
欢迎光临远方的海!您可能还对 WordPress建站免费资源最新IT动态 感兴趣,点击开启 悦读 模式。CTRL+D 快捷收藏本文,我们期待您再次光临!
[文章目录]

远方的海开启SSL后经过不少的折腾终于找到了完美解决百度对SSL站点不友好的问题了。还是谷歌好,直接就收录SSL站点,而且真正的提高了https网站的权重。来看看Sven研究出来的方案吧!

问题所在

问题一,百度蜘蛛不给力,经常抓取超时

为什么说百度对SSL不友好,经过百度站长中心的抓取诊断测试,我发现了百度虽然通过这个模拟测试可以抓取到网页,但是显示跳转而且时间颇长。

没有加HTTPS的网页(按照远方的海为例),抓取时间在0.2秒左右;而加上了HTTPS跳转,百度的抓取时间则快在三秒,慢则十几秒。这个十几秒是什么概念?如此慢的抓取速度,在网络高峰期再慢点就可以导致抓取超时了!

来看看网站异常数据统计,开启了SSL后百度的蜘蛛一直显示我的网站抓取超时,其出错率已经超过10%,我们来看图片里面潮起潮落的绿色线条,它表示着抓取超时次数:

网站开启SSL(HTTPS)后 百度SEO的完美解决方案

问题二,sitemap文件不能抓取

远方的海已经获取了百度的sitemap提交权限,我打开百度的sitemap提交更新了一下sitemap,发现了如下所示:

网站开启SSL(HTTPS)后 百度SEO的完美解决方案

我们来看看这些问题:

  • 呵呵哒了,网站居然华丽丽的不能抓取sitemap.xml文件。
  • 既然不能抓取sitemap.xml文件,那好吧,百度出了一款baidu submit的插件,这款插件的效果如何呢?Sven也郑重的告诉大家,这款插件提交的网址也是https的,所以百度一样不能抓取。
  • 最近很火的代码版提交网页,按照上面的节奏估计多半也是不可以正常抓取的。

百度SEO解决方案

让我们一起来看看解决方案吧!

第一步,首先在WordPress设置 – 常规设置 中把WordPress的两个网址全部改回http开的。

第二步,修改.htaccess文件来重定向到https网站。代码如下:

RewriteEngine On
RewriteCond %{HTTPS} !on [NC]
RewriteCond %{HTTP_USER_AGENT} (chrome|googlebot|safari|opera|firefox) [NC]
RewriteRule ^(.*)$ https://www.seavia.com/$1 [R=301,L]

这里已经包括了很多浏览器和谷歌爬虫的UA了,把这些UA定向到https页面,其余的基本可以让它去抓http的网页。

或者给出类似于V2EX这种网站的解决方法,V2EX据我分析是百度的spider定向到http上,谷歌的spider定向到https上,其余的不作处理,以下是Apache主机的.htaccess重定向写法:

RewriteEngine On
RewriteCond %{HTTPS} !on [NC]
RewriteCond %{HTTP_USER_AGENT} (googlebot) [NC]
RewriteRule ^(.*)$ http://www.seavia.com/$1 [R=301,L]
RewriteCond %{HTTPS} on [NC]
RewriteCond %{HTTP_USER_AGENT} (baiduspider) [NC]
RewriteRule ^(.*)$ http://www.seavia.com/$1 [R=301,L]

第三步,把主题里面的http://www.seavia.com类似的网址全部换成http://www.seavia.com,这样就可以自动识别http和https了。

设置完之后,我们来看看现在的情况:

  • 用chrome等浏览器打开网站,依然显示小绿锁;
  • 百度抓取也成功缩短到0.2s,sitemap也可以成功提交了。

网站开启SSL(HTTPS)后 百度SEO的完美解决方案

于是,度娘对SSL不友好的问题就这么解决了,也不指望百度那边的SSL给我的网站加多少权重,只希望不影响我网站的排名。

好文!分享给朋友,或者点个赞吧~

文章信息

分类:SEO

您可能也会喜欢

发表回复

Post Comment


  1. 老杨 :

    度娘的支持 SSL 也是醉了,就只会说说……

    2015-9-11
    • Sven水神 :

      确实,连https的网址都不收录。

      2015-9-12
  2. Billyfu :

    @sven 搜索引擎还没这么智能吧,百度之前也说https优先收录展示来着。博主先试试水,有结果写文告诉大家下啊

    2015-9-8
  3. Billy Fu :

    百度可能会识别为作弊

    2015-9-8
    • sven水神 :

      @Billy Fu 没有理由啊,作弊的原因是什么呢?百度已经把https和http视作同一网址对待了。

      2015-9-8
  4. 厘米 :

    不错的思路,http留给百度抓!

    2015-9-8