对于第三方机构的调研数据的质疑从来没有中断。

随着互联网经济越来越重要,对于互联网相关的各种数据的需求也越来越多,面对越来越多的“专业市场调研公司”发布的各种互联网的数据,我们可以相信这些数据吗?

事实上,对于数据的质疑不仅仅存在于互联网行业。

比如2009年年度流行词“被”,其中就含有很多网民对于国家统计局出台的各项数据的自嘲;国家统计局有幸在数据领域成为被时代的代表。工资被增长、物价被降低,种种舆论,扑面而来。

互联网时代,我们应该相信第三方的数据吗?

互联网经济,最大的特点就是数据——网站排名、流量统计、用户分布等等,行业内外的各色人等都需要借助这些数据来评判某一家网站的好坏,是否值得投资,是否具备成长性等等。

互联网行业对于数据的需求也催生了很多的互联网市场调研公司,可以举一些例子:

国字头的DCCI ,经常被用到的Alexa,关注中文互联网的艾瑞、易观,还有诸如尼尔森、IDG、互联网实验室等,甚至连google、百度这样的搜索巨头也推出了基于互联网的数据等等——不胜枚举。

在早前我的某一篇博文后面,有网友质疑我对于某一个数据的解读:

“这就算是数据分析了吗?你观测过天涯的服务器错误么,有第三方基调的数据没?另外,alexa由于过多的造假,早就不能作为基础数据了”。

言辞很尖锐,也有一些道理。值得说明的是,我的博客文章并不是严谨的数据分析论文,基之是对一些数据以及现象的简单分析,是个人的观点;其次,对于alexa不能作为基础数据的说法值得商榷。

我们知道,任何数据的出台都是经过一定方法论来实现的,也都可以说是不真实的,但是如果按照严谨的方法论出来的数据,是可以代表一定程度的客观事实的的。在具体的内容中,关于天涯流量的下降,不仅仅是alexa的数据,同样也参照了DCCI的数据。

当然,我认为这位网友的质疑更多的是质疑数据的来源,但是于此同时,他也提出希望用第三方的调研数据来批驳我的结论,这就提出一个重要的问题:

我们应该相信第三方数据吗?是什么让我们对于第三方数据失去了信任感?

不仅仅是网民对第三方数据表示怀疑,相关的企业也经常对某些数据的真实性产生质疑;这对于这个行业的从业者,投资者,以及广告营销人等等都造成了很大的困扰。

对数据的质疑,除了和社会整体的诚信度不高,以及习惯性阴谋论者外,第三方数据机构本身的一些缺陷也是造成外界对于数据不真实的重要原因。

首先是标准(统计方法)不统一。

以“酷6流量造假事件升级”为例,世界杯期间,酷六网援引多项数据证明在此次世界杯中强于优酷。其中DCCI数据显示,酷6网世界杯频道流量在所有跟世界杯相关的视频流量中,达到46.13%,优酷网只有6.97%。易观国际数据显示,在视频世界杯广告市场中,酷6网位居前列,占了22.2%,超过优酷网的13.9%。

而优酷方面则指出,酷6的PV可以通过重复加码、弹窗、刷流量等来实现,但VV(视频播放量)是实实在在的硬指标,是对服务器、带宽的考验。(酷六网并没公布VV数据)

在一份名为艾瑞数据的截图中显示,从6月28日起一周的浏览页面数据显示,平均世界杯期间和前后,酷6日PV不足4千万。

排除人为因素,在此案例中,互联网数据调研没有统一的标准,是导致各方数据不一致的重要原因。所以尼尔森相关人士接受媒体采访时曾表示,只能保证自己的数据没问题,不同人可能对数据的解读方式不一样,不同的统计方法得出的数据也可能不一样,这个没有办法控制。

其次,第三方数据机构受相关利益方的影响。

第三方数据差错率高,还有一个重要原因自然是久为人诟病的“钱出数据、数据出钱”,互联网企业只要想受到投资者认可被公众追捧,就非得把数据涂脂抹粉一番才能公开公示。

举个案例:8月初,易观国际和 Frost&Suli-van(沙利文)不约而同公布了自己的市场研究报告。在易观国际报告中,周鸿祎手中的360安全卫士以及360信安易跃居市场头名,老牌手机安全厂商网秦的市场占有率则大幅下滑。而在沙利文的报告中,网秦仍是市场第一。

调研机构相互打架,如果说是市场占有率相差不大还能够用统计方法不同推诿,但是一方给出网秦占据64.8%老大,另外一方给出的是360以44.44%为市场老大——

如果说两家数据机构打架还能够同方法论来解释,那么易观1、2季度的对于网秦市场占有率的突变则被怀疑受到利益方的影响。

这也难怪一位手机安全的业内人士告诉媒体。对于此次手机安全市场头名之争,这位人士直言不讳地表示,“其中一家花了钱”。

以上两点应该是造成多数数据不被认同的原因吧。

被质疑的数据不仅仅影响到第三方机构的信誉,同样也影响到基于互联网行业的互联网投资、互联网广告、互联网营销等等行业;众多企业、个人都需要基于数据来对这个行业有一定的判断,而数据的被质疑,影响到这个行业的健康的发展。

为了加强数据的真实性,树立专业调研机构的信任度,我们除了期盼第三方数据机构能够客观真实外,还应该从行业的管理入手——

有没有对于数据调研公司的管理办法?这个行业有没有准入制度,或者有没有数据调研的资质?需要不需要制定一定的行业数据统计以及分析的标准?还有就是对于数据机构造假的惩罚措施等等。

一个经济领域是否健康发展,数据真实性至关重要,总不能让我们总是去某个网站混迹几个月来后凭经验判断数据的真实性吧。

我们需要用数据来论证很多“命题”,而这命题的基础在于数据的真实性和客观性。

要相信第三方的数据吗?还是固执的做一个经验派?

各自的抉择。

注:对于第三方数据的争议在发达国家也时有争议,短期内很难解决。对于我们引用者而言,也只能用标注数据的来源这样苍白的举措表明对于数据真实性的不确定。