我们是谁?数据知道

史颖波/文

在过去,如果说数据也是一种资产,甚至说数据也有国籍,人们肯定会觉得不可思议。但是今天,毫无疑问的是,数据是一项货真价实的资产。中国拥有令人艳羡的数据资产,只是对这些以资产的名义到来的数据,我们对其意义的理解还处于一片茫然之中。
8月16日,一组“我们是谁”的六格漫画引发全民自黑狂潮,从人民网到共青团中央、从文案策划到投资明星,各类人物都借着“我们是谁”大声吐槽。这组漫画对白简单,重复的三组图片,粗狂的人物线条,算不上有魅力。在大部分人眼中,这组漫画的走红是偶然的、随机的,和其他类似的热点现象一样,火得莫名其妙,没有什么可以深入挖掘的。
真的是这样吗?有人反驳说,不是的,画面中振臂一呼的呐喊揭示了社会各个阶层、各种角色在生活中的无奈。从事后来分析,这样说有一定的道理,但是如果是这样的话,为什么同样这组漫画在2013第一次出现的时候,却被悄无声息地淹没了呢?这是一个问题,但是我们无法回答这个问题,这意味着我们对社交网络上内容分发的时间和空间规律还一无所知,而这其中蕴藏着丰富的知识。要说清楚这个问题,让我们先从一条引发全民大讨论的裙子说起。
度量传播的过程
大部分中国人知道BuzzFeed是因为一条裙子。两年前,那条到底是蓝黑相间还是白金相间的裙子在中国社交媒体上引起全民大讨论。BuzzFeed上的内容一直是用来解闷儿的八卦,但是成立10年来,它却成了全球最有影响力的内容分发平台之一,每月拥有70亿浏览量,每篇帖子照片或者视频可以轻松达到百万级别。在这些热门内容的背后是BuzzFeed一套独特的专利技术,这套技术使得传播的过程能够被度量,而一旦它可以度量,就可能被优化。
传播的过程怎么可能被度量?这在过去传统媒体时代这是无法想象的。以这条裙子为例,BuzzFeed把这张照片在Facebook、Twitter上的扩散做成了一张可视化的动态图。在Twitter上,一般来说,一条几十万阅读量的内容一般会有7到8 个附加层次的传播。而裙子这张图片,Twitter集群的传播深度前所未有地达到了11层。
收集并存储这些网络传播的数据是一个巨大的挑战,因为这是一个科学研究级别的数据量。两年前,BuzzFeed出版人Dao Nguyen和数据专家Kelleher兄弟披露,他们能够处理超过每秒1万个网页请求。这导致一个月存储的网络扩散数据比BuzzFeed成立以来为内容优化收集的所有其他数据都要多。BuzzFeed收集的数据包括多个维度,它能够理解内容是怎样、何时、何地以及被谁分享的。
2016年,BuzzFeed成功募集2亿美元的G轮融资,估值15亿美元,是其年收入的至少10倍。这个数字对于中国投资者来说也许并不吃惊,但是我们如果对比其他几家老牌新闻媒体,纽约时报的估值是1.2倍,Time Inc.是0.7倍,时代华纳是2倍,我们就会看到,资本市场对BuzzFeed的估值不仅来源于数据,更来源于其对数据的理解能力。这正是投资人在寻找的价值源泉。
理解思想为何会扩散、以及如何扩散是非常不容易的。事实上,BuzzFeed的价值和它发布的那些廉价的内容没有一点关系。BuzzFeed的价值在于它能够勾画出这些内容在社交媒体的扩散图谱,并且能够预测哪些内容会受到追捧。他们创造了9种用于量化的指标,比如“不同节点间的传播速率”。凭借这些指标,比如如果人们分享某个内容的速率不断攀升,编辑们就会知道,又一篇百万阅读量级别的文章即将诞生。
我们是谁?还需要度量
在商业数据领域,无论从数据种类还是数据规模上来说,中国毫无疑问已经处于全球领先的地位,但是中国缺乏从中获取知识的能力。回到这组漫画。它的原创作者是美国一位年轻的女画家艾丽•布罗什(Allie Brosh),而且发布时间是在2010年。当时,曾经被抑郁症困扰的艾丽拿起画笔,将自己所经历的痛苦用漫画的形式表达出来。之后,在reddit上有国外网友在她漫画风格之上进行了再创作。比如:我们是谁,我们是女人。我们要什么?不知道。我们什么时候要?现在!在中国最先引爆的“我们是甲方(客户)”就是在这个版本上翻译过来的。
有意思的是,2013年,暴走漫画第一次出现了这个漫画的中文版《永远的明天》:“我们是谁?胖子!我们需要做什么?健身!什么时候去?明天!”但是,这组漫画在当时并没有引发传播的热情。直到今年8月中旬,在看到有网友发布“我们是甲方”的内容之后,微信公号socialmarketing于8月15日发布了一系列的组图,以文案、公关等不同行业的口吻加以演绎和吐槽。8月16日,“我们是谁”迅速升温,引爆全民自黑热潮,从海底捞到投资经理,各个阶层都不甘落后,乐此不疲。
如果我们只是沉迷于这组漫画带来的幽默,我们会错过一次了解社交媒体传播规律的机会。这些表象的后面有诸多可以挖掘的地方,比如,为什么暴走漫画的那副内容没有得到大规模传播,而今年同样的内容却成为现象级的内容?它在微信和微博上的扩散图谱是怎么的?在微博上它有几个层次的传播?在这些研究之上,我们还可以进一步探讨:一条热门内容应该具备哪些特征?如果我们掌握了热门内容的所有特征,是否可以事先预测它传播的广度?如果过滤掉名人推广的作用,仅仅针对普通用户对内容的偏好,是否有可能为每个人提供更多正确的内容?
我们太需要了解社交网络上内容传播的冰山一角,而这需要专业的知识和专业的方法。对中国的社交媒体来说,要想摆脱流量的束缚,就必须像Buzzfeed这样形成自己的核心竞争力。


更多



3,489 views



发表评论

电子邮件地址不会被公开。 必填项已用*标注