注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

移动Labs

http://labs.chinamobile.com/

 
 
 

日志

 
 
关于我

移动Labs(labs.chinamobile.com):中国移动研究院主办的通信行业汇聚门户,专注于移动通信和互联网领域,核心会员是中移动广大员工及ICT行业用户。提供资讯、博客、讨论组、专业报告、视频、电子日报等信息及知识服务,以及研究院主办的每周线下活动“无限论坛”。

网易考拉推荐

用户行为研究:网站数据分析的常见误差  

2011-12-28 09:37:10|  分类: 默认分类 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
独家供稿:移动Labs

在网站数据分析中,我们希望统计数据和分析结果都是准确的,但是由于不同监测方法收集的数据都会有不同的误差,因此我们需要了解一些常见的误差,以便帮助我们更好地分析结果数据。一般说来,常见的误差有以下几种:

一、点击日志的误差

a) Unique Visitor的误差

如果用Server Log的方法监测数据,那么很显然,想要获取真实的访问者数量是不可能的。Server Log本身对于访问者的估算只能依据误差巨大的IP,而网络爬虫/机器人的访问又使这种误差进一步扩大。

b) Page View的误差

本来Server Log是可以很准确的记录Page View的,但是 Cache的出现让这成为历史。Cache极有可能会屏蔽服务器端的响应,这样如果不是cache服务器的log, Server Log可能不会留下任何关于某次Page View记录。

c) 时间记录的误差

在没有Cache干扰的情况下,服务器能准确探知访问开始的时间,但是访问结束的时间却无法了解。因为访问结束往往是随着关闭浏览器一同结束的,而关闭浏览器本身不能激发一条新的Server Log记录。

d) Flash站点误差

如果一个网站的主要构成部分是一个包含多个页面的Flash文件,或多个此类Flash文件的组合,那么Server Log不会记录Flash内部的操作,监测会几乎失效。

二、 HTML Tag(页面插码)的误差

a) HTML Tag失效

HTML Tag即监测JavaScript代码的失效是会发生的。首先,一部分浏览器(例如手机上的一些浏览器)不支持JavaScript或者被设置为JavaScript禁止。其次,HTML Tag可能会因为它之前的JavaScript出错而无法运行。再次,我们也看到过因为变量名冲突而发生Page Tag和页面上其他JavaScript冲突而无法运行的案例。最后,受网络速度的影响,页面上的Page Tag没有完全下载,浏览器就可能被人为关闭或者直接链向一个新的页面。显然,如果HTML Tag失效,那么网站分析工具就会失去部分或者全部数据。

HTML Tag在页面中的位置会影响网站分析工具的计数。如果HTML Tag在页面的上端,那么它会更快的被执行,受到其他因素(例如HTML Tag之前其他JavaScript失效或者网速问题)干扰的情况就越小,计数也就会因此增大。Stone Temple Consulting的统计表明,代码在页面上端时的Visitor计数比在下端时的多4.3%

b) Unique Visitor的误差:

这种误差一般是由以下一些情况引起的:一个计算机可能被多人使用;一个计算机可能有多个浏览器(造成访问同一个网站有多个Cookie);人们会删除Cookie2007comScore的统计表明,一个月内有30%的美国用户会删除浏览器的Cookie);Cookie被禁用(尽管WA工具一般都使用第一方Cookie,但仍有约10%不到的第一方Cookie会被用户设为禁止)。

c) Page View的误差:

这种误差主要由HTML Tag失效引起。前面提到的,网站分析中存在时间记录的误差,所以访问者和访问时间之类的基本度量实际上是无法准确记录的,因此其他一些更高级的度量,例如我们常用的复合度量(如跳出率、网站平均停留时间等)就更不可能准确了。不过,知道了这些误差产生的原因,有助于我们进一步修正误差。有些监测工具(例如DoubleClick)具有自修正功能,就是利用了这个原理。

三、其他监测方法的误差

网站分析中其他获取数据的方式,如通过客户端的软件搜集数据(AlexaiResearch等)以及Sniffer(包嗅探),则因其本身的监测方式所限,会有更大的误差。例如,通过客户端来搜集数据,很显然存在样本量的偏差;而Sniffer本质上是Server Log方式的翻版,但却增加了包丢失以及数据记录有限的问题,所以它们不可能比我们前面的两种方法更准确。




本博文作者发布在移动Labs的原文链接是:
http://labs.chinamobile.com/mblog/382108/159202

【相关博文】

网站分析的主要原则

行为经济学和用户选择的非理性

【精彩推荐】

我国大力建设智能电网 10年内投资将超4万亿

广州着力发展低碳经济建设智慧城市

【推荐】密码泄露在线查询工具!

怎样针对不同网站设置不同密码 还能记得住!

【关注】个人电脑信息安全指南

2011年IT领域最大的赢家和输家

你肯定不知道的冷知识 冷飕飕的啊!

  评论这张
 
阅读(659)| 评论(0)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017