解密军情

资讯排行

推荐阅读

2017如何加速百度对新站的收录速度

2017-10-19 15:01

  我的网站(精选特惠360)5月底上线,上线后的第一时间,我就把网站提交到了百度,然后等待收录,截止目前,百度已收录3250个页面。

  在做网站之前,除了建站其他的我一无所知,SEO对我来说只是一个传说,到底该怎么讨好搜索引擎、加速收录我是真不知道。我想可能很多跟我是一样的,抱着一腔热血辛苦建站,结果等了很久热情都冷了还不见搜索引擎收录,所以我写了这篇文章,与各位同道中人分享建站收录。

  在网站上线之前,我为网站填充了第一批数据,主要分两个部分:一部分是通过淘宝API采集的特价优惠商品,比如9块9包邮、淘宝/天猫优惠券商品以及特价女装,这部分数据每天大概有几千条,但是基本两三天之后就过期了;另一部分是自己写了一个爬虫,从其他同类资讯网站上采集一些文章,放到自己的购物头条频道,这个一般每天有几十到几百,个别时候一天采集了几千条,这样在等待网站正式上线的这段时间里(大概两周),我的网站已经有大概2W+的页面了。网站正式上线后,我把网站提交到了百度,第三天首页就收录了,然后我怀着激动的心情,一边继续更新网站内容,一边时不时的看一下百度的收录量,结果这一等,就是两个星期。

  早听说百度对新站的审核和收录越来越严格了,最长可能会有3-6个月的审核期,审核期内除了首页不会有任何其他内页放出来。虽然对于百度这种为了搜索结果质量而加强收录标准的做法表示理解,但这个等待的过是啊。在这样的忐忑和中,等了大概两个星期,然后有一天早上突然发现,网站的收录量从1变成了300+,好激动有木有!但是接下来又是好长一段时间没动静!我开始在网站学习一些SEO的基本技巧,网上都在说内容为王,本着这一原则,我每天定时定量更新特价商品信息和购物头条资讯,基本每天的特价商品我会更新10000+,头条资讯我会更新30+,就这样一直了两周,突然发现百度收录量到了1000+,瞬间感觉自己找对了方向,人生有了希望,然后继续,继续每日更新,直到前天发现收录量已经到了3240,今天变成了3250,首页快照保持在7-21,(估计这两天该更新了)。

  对于这个收录情况,我个人还是挺满意的,毕竟没有出现传说中新站审核3-6个月甚至更久的现象,两个月不到收录3000+个页面,我觉得已经很不错了。值得一提的是,这些收录并没有带来流量,毕竟是新站,而且页面SEO也没怎么做,所以估计页面权重太低,后续要在页面SEO优化以及提升网站权重方面再努力了。

  5、接入百度统计、百度站内搜索,按照百度要求的格式生成sitemap,使用百度主动推送和自动推送功能,每日定时定量更新伪原创数据

  8、只放最近一天内新产生的链接到sitemap,减轻爬虫压力(原先是把所有链接都放在sitemap中,发现爬虫每次来都在爬取老页面,新页面不闻不问)

  回顾这两个月的心历程,总结了以下几点可以加快百度收录新站的办法供各位参考:

  1、提交网站之前,确定好网站的架构和页面结构,后续(尤其是审核期内)不要随意调整(小范围、小幅度可以)

  2、提交网站之前,最好初始化一批数据到网站内,这样爬虫过来的时候看到有数据,会留下一个好印象,否则爬虫会认为你的网站没内容,下次再来,就得好几天之后了

  3、优化网站性能,提高网页打开速度,尽可能不要出现500和404之类的问题

  4、定时定量更新内容,最好是原创,其次是伪原创,最次是完全采集。采集后二次加工一下,变成伪原创会好很多,另外,我的网站内容都是采集的,但是采集的是百度没有收录过的内容,所以其实也算是原创了

  5、使用百度统计,这个是百度自己的产品,百度会借助他们更深入的了解你的网站内部的情况,如果你的流量大,百度会提升网站权重,加速收录,这个算是加分项

  6、使用百度站内搜索,百度搜索和百度站内搜索用的是同一套索引库,所以如果能加速站内搜索对网站的收录,那么其实也就加快了百度搜索对网站的收录

  7、提供百度站内搜索要求的格式的sitemap并提交给百度,这个格式比较丰富,带有很多额外数据,对百度爬虫非常友好

  8、百度新链接推送有三种方式:主动推送、自动推送和sitemap,效果最好的是主动推送,自动推送次之,sitemap最差

  9、如果你是资讯类网站或有资讯类栏目,那么接入百度推荐,也是百度自家的产品,好处跟一样

  10、加强站内链接,把网站做成扁平化的,这样在每个页面都能看到整个网站的各主要栏目的链接,爬虫在任何页面爬虫都有机会链接到其他重要栏目或页面,便于爬取和收录

  11、sitemap每日定期更新,但不要把全站链接放进去,每次只放最近一天或几天产出的新的、优质的链接即可,否则sitemap中链接太多会让爬虫不堪重负,导致新的链接迟迟无法收录

  1、互联网上太多资讯了,有优质的但更多是垃圾的,什么是优质资讯?合适的字体大小和颜色、图文并茂、篇幅适中、与网站或栏目主题相关、能为用户提供帮助,照这个标准去做数据,百度一定喜欢,具体可以参考我的购物头条栏目,这里为了配合我的商品栏目中的商品类目,设计了几个资讯分类,基本是一一对应的,所以内容与主题呼应,每篇文章都是图文混排,看起来比较舒服。

  2、关于资讯数据采集,没几个有时间每天挖空心思写原创,而且就算写得出来被人家大站采集了,百度还是不认为我们是原创,所以采集是唯一最可行的办法,怎么采集呢?最好采集一些冷门的或者是封闭的网站的内容,这样百度从你的网站上看到了之前从来没有看到过的内容,自然就认为是你的原创了,百度对原封不动的采集深恶痛绝,对原创则是爱不释手,所以,同学,花点心思采集原创资讯,还是很有价值和意义的

  3、谨慎使用CDN,我在网站图片和静态资源上用了七牛的CDN,但是页面还是网站直出的没用CDN,因为刚开始我用过免费的百度CDN,发现很多时候页面打不开而且错误页面非常不友好,就取消了,鉴于CDN的工作原理,新站审核收录期间谨慎使用CDN,最好不要用,过了审核期收录稳定之后再用

  4、如果你按照百度赞同的做法在更新和运营网站,那么在看到收录量上升之前一定要有耐心,百度会根据网站内容的更新频率抓取网页,但不放出来,如果网站的表现足够好,百度会每隔2-3周一次,每次的量会逐次增加

  5、千万不要100%采集百度已收录的内容,尤其是低质量内容,否则百度会认为你这是一个垃圾镜像站,轻则延长审核期,重则直接打入底层库,以后再想升上来可就难了