小议SEO的数据分析I开头收录部份
SEO要数据化,目前在国平和光年论坛的推动下,已有很多朋友开始开始认识到SEO数据分析的重要性。其实SEO的数据分析,其实不是什么时兴新概念了,很早开始,就有一批专家们提倡,我们要分析数据,分析对手来做SEO。
回头看看之前的那些SEO数据分析。有这么几个常见的条目
首页PR
Alexa排名
site收录数
首页快照
外链数量
核心关键词排名
和等等等
先来点评一下,为何以往的SEO数据分析,不能做到从数据驱动SEO。我们逐条分析一下以往做条目。
在其他因素不变的情况下,PR高,流量一定高吗?很明显不是,而且还只是首页的PR值,对任意一个网站来讲,首页的流量仅仅是一小部分,对超级大站来讲,首页的流量所占比例小到可以疏忽。(由于基数大,小比例的数据也比很多网站可观了)。由于第一条的数据,完全没必要分析。
alexa的数据还有一定的参考性,但是对国内网站来讲,几近可以疏忽,除弄IT的,基本没人会装这货。Alexa统计的流量是所有流量,并不是单纯的SEO流量,所以对SEO没太大关系,不过alexa的数据获得比较容易,就作为一个参考吧。
site收录准不准先不说。问题是site出来的数据有甚么意义呢?如果我一个网站有1个亿的页面,我site出来100万,是好还是坏?我一个网站有1万个页面,我site出来是1万,是好还是坏。因此,除site的数据,你最少得知道这个网站有多少页面量,否则site的数据毫无意义。
首页快照,网页有更新了,爬虫可能拍个照,快照时间更新一下。更多时候你页面动都没动。你期望快照变化对你SEO有甚么影响呢?而且和首页PR同理,首页只是一个页面而已,没那末特殊。
外链数量,OMG,外链为王,外链数量肯定是重要的。外链真的是越多越好吗?有的query很明显排名第1的比排名第10的外链少很多的多。其实外链的整体质量很难衡量,反正你也统计不全,何必要用这个数量作为一个结果,如果相干外链多,则排名会提高,这不是我说的,是Google百度说的。所以我们统计排名这个直接因素就好了
说到排名,这边说说核心关键词的排名与网站整体排名的问题。相信各位站长手头都有自己的网站,看看流量报告吧,那些核心关键词能带来的流量占所有流量的比例是多少?但是一般做SEO优化的时候,大家都习惯于把资源集中在几个核心词上,而大量的关键词流量,都是属于没人要的,随意分配一些资源过去,流量就上来了。只看核心词的排名做SEO,属于捡了芝麻,丢了西瓜。两手都要抓,两手都要硬,平均分配资源,才能收益最大化。
从上几个数据我们可以看出,过往的SEO数据分析,分析的数据大都是不靠谱,不准确的。自然对SEO没什么影响,而且从这些数据中,也很难发现核心问题。SEO数据分析,常常就成了一个噱头,花了大量时间精力,却连一点效果和指点也没有。
那如何做SEO的数据分析,我这边先推荐一些前人的智慧:
(前阿里巴巴SEO人员)国平
详解《光年SEO日志分析系统2.0》
网页加载速度是如何影响SEO效果的
(前天极网SEO人员)废小米
百度收录抽查
任重而道远-it垂直类门户搜索引擎关键词排名比较
虽然有些文章很老,但是到现在已很有指导性作用。我这边也先不借用谁的理论,我们从事实动身,好好回想一些用户是如何通过搜索引擎来到我们网站的?
用户在搜索框中输入一个关键词
用户在搜索结果页面中浏览大量结果
用户点击进入某个它满意的结果
OK,这是最简单的一次用户访问,事实上用户还有一些其他情况,本文先不展开讨论。
我们还是针对每一条用户操作,设定一些问题,然后再对应的问题,我们来找一些数据出来解决这个问题。
我们想知道用户搜索了甚么关键词?这个关键词的目的是什么?我们的页面能不能满足用户的这类需要呢?
我们的页面,如何出现在搜索结果页面中?
如何在搜索结果页面中脱颖而出,让用户点击你?
如果把这三点做好,我相信一个网站的SEO流量绝对不会低。我们如何开始做?(夜息注:本文没有一步速成的方法,如果想平步青云可以绕道)
就拿第二个问题来看,我们的页面,如何出现在搜索结果中?
这是一个看似很愚昧的问题,哈哈,不就是收录的问题吗?,有人会说,我的网站早就被百度收录了,但是甚么流量也没有。我们来看看下面这个例子。
这个网站百度收录有7百多万页面,看起来不错,我们到这个网站上去看看。
有一个叫国际酒店的频道,上面写有13万酒店预订服务信息。换句话说,我最少有13万个不重复页面,来描写这些酒店信息。
百度收录1770,Google收录18200,如果算上一些索引页,那整体收录比率只有1%,乃至更少。(夜息注:inurl的查询方法并不是很准确,所以还有待考证,本文只是做一个例子)
再换言之,如果我在百度,Google上搜索大部分的国际酒店预订信息,这个网站的页面可能不会出来在搜索结果中。由于根本还没被收录。
看到一个10年的数据,说中国10年的时候有5000多万人次出境。如果估算30%人需要订酒店入住,那这就是一个巨大的流量机会了。很明显,这个网站这这块细分蛋糕上还有很大的提升空间。如果作为SEO集中精力解决这个频道的收录问题,相信对网站业务有很明显的提升。
如何解决收录问题,我相信很多人已很有办法了。我也就不老声长谈了,很多东西都能在上面推荐的文章中找到,就总结一下我自己分析的SEO数据。
某频道爬虫逐日抓取量
某频道爬虫逐日不重复抓取量
某频道爬虫单页下载时间
某频道网页响应速度
某频道逐日爬虫到访次数
某频道Top目录
某频道收录比例抽查
某频道响应代码统计
依托这些数据,我们很清楚的就能了解到某频道的网站收录情况如何,问题出在哪里。
是压根没爬到?还是爬太少?还是爬不全?还是页面质量太低?还是服务器配置错了?还是服务器Down掉了?一切问题,都逃不出这些数据的法眼。
作者:夜息 imyexi/?p=448 欢迎转载,请保存出处