百度最新调整分析
百度的收录数量直接反映了一个站的内容和地位,虽然和流量没有直接的关系。但至少也是一个指数。特别是当你网站的百度收录少于100或者只有一个首页的时候,你就得认真对待了,否则,你的网站就面临被K无法翻身的窘境.
1、仿站,采集等被K
尤其是对于普通企业站、小说站、下载站等处罚比较厉害。企业站都不会用同一类型的模板,内容都是来自于采集,特别是现在做小说网站的非常多,采来采去的都是那几个程序模版,试问有几万个内容相同的站,叫百度那个机器怎么收录?
...
robots.txt是什么?
有没有想过,如果我们某个站点不让百度和google收录,那怎么办?
搜索引擎已经和我们达成一个约定,如果我们按约定那样做了,它们就不要收录。
这个写约定的的文件命名为:robots.txt。
robots.txt是一个最简单的.txt文件,用以告诉搜索引擎哪些网页可以收录,哪些不允许收录。
关于robots.txt一般站长需要注意以下几点:
如果你的站点对所有搜索引擎公开,则不用做这个文件或者robots.txt为空就行。
...
百度用于抓取网页的程序叫做Baiduspider - 百度蜘蛛,我们查看网站被百度抓取的情况主要是分析,网站日志里百度蜘蛛Baiduspider的活跃性:抓取频率,返回的HTTP状态码。
查看日志的方式:
通过FTP,在网站根目录找到一个日志文件,文件名一般包含log,下载解压里面的记事本,这即是网站的日志,记录了网站被访问和操作的情况。
因为各个服务器和主机的情况不同,不同的主机日志功能记录的内容不同,有的甚至没有日志功能。
...
经常会碰到这样的情况,其他网站链接你的站点时,会用下面的链接:
bjteam.com/
bjteam.com/index.php
而这样导致:你站点主域名的pr值分散到其他几个URLs了。
...
假设你的站点域名是www.bjteam.org,
先看下你网站“首页”所对应的链接是www.bjteam.org或是www.bjteam.org/index.html、www.bjteam.org/index.php或其他。如果你的域名pr值大于0,而首页在浏览器pr值插件上显示为0,则是因为你网站首页链接设置问题。现在基本上80%的网站,因为没有这个意识,网站的“首页”往往不是设置为域名,而是以index等为后缀。
...