上周一位伦敦男孩和他的软件出现在各种外媒财经科技版块头条,这个名为Summly的移动应用先是被李嘉诚旗下的VC投资,而后被雅虎3000万美元买下;我们不禁好奇,这家被美国500强互联网公司和李同时看中的创业项目有何神奇之处?看下面笔者耗费多时整理的新闻摘要:
雅虎收购移动应用Summly,中学创业天才身家过亿
● 上周伦敦少年尼克•德阿洛伊西奥把手机新闻摘要应用Summly卖给雅虎,价格高达 3000 万美元。
● 两年前,尼克在自己卧室研发的这款软件因Techcrunch报道,被李嘉诚旗下的风险投资机构Horizons Ventures发现,并首先向其注资 25 万美元。
● 尼克的钱被放入信托基金,财务由她母亲掌管,他的个人银行卡里只有40英镑。
● “我喜欢运动,我对设计情有独钟,我还喜欢跟女友和死党在一起。”他说。
● 有分析认为该举动表明梅耶尔领导下的雅虎要大举进入移动领域;
● 也有观点指出:给这个17岁、喜欢运动和派对、黏着女友的漂亮男孩投资,其背后有明显的公关炒作目的。
首先说明,看完这篇300字摘要,寻找猛料的读者就不用再去费力阅读卫报、华尔街日报,纽约时报等媒体的文章了,因为它们大多在2000-3000个英文单词的长度之间,除了一些年轻女记者追星般的赞美之辞外,无甚超出以上核心事实。而Summly所做的就是利用算法代理人工,自动生成类似摘要;和我付出的代价不同,它完成同样的任务可能只需要几分之一秒。如果它有中文版,让Summly来归纳自己被雅虎收购的新闻,基本也就是上面这个结果。不难看出,这是一种将长文章自动缩编到350-400个字以内的阅读简化工具。当然,如果换成中文,类似摘要可能只需要5、6条微博的长度。
这位男孩和他的神奇软件引出了两个有趣的问题?为什么收购发生在这个时候?投资方究竟发现了一种什么样的未来价值?雅虎也许可以回答第一个问题;而第二个问题要留给李嘉诚。
一家VC的投资逻辑往往可以从它的投资组合中找到线索。李嘉诚的维港投资主攻早期项目。扫一眼它的项目,顿时感到一种扑面而来的颠覆性气息,其中有:图片文字化的Cortica、文字视频化的Wibbitz、音乐个性化的Spotify、微视频社交化的Tout。此外还有两个:正在成为社交行业“水电煤”的Facebook和语音智能化的Siri。相比之下,长文字简化的Summly算是最“保守”的项目了。
也许有人会总结维港的投资面向社交、工具和移动。我感觉这背后有还一条逻辑线值得指出:在注意力经济下,它们要么让用户更高效地运用自己的注意力,要么借助(声、像、短文字)更高效地捕获别人的注意力。而Summly则横跨两头。显然符合维港的选择逻辑。
可以想象,维港为了发掘这一批新项目一定参考了很多前沿媒体报道,比如TechCrunch。后者对尼克报道上线几个小时后,尼克就收到了维港的邮件。不认识李嘉诚的尼克当时把邮件当成垃圾处理了,结果维港的人执着地再次和他联系,直至在伦敦找到这个白天还在学校上课的中学生。
为了感受事件过程,我翻出了TechCrunch那篇改变尼克命运的报道。当时文中讲述的还是Summly的前身——一个叫Trimit的应用。Trimit是个比较极客、甚至有点天然呆的名字,它的英语大致可以理解为“缩短它”。
这篇文章透露了几个关键信息:人们的注意力越来越有限,而尼克的软件只要摇动一下手机就可以缩短各种文字,比如Facebook好友们的连篇废话。文末,那个玩性十足的作者用自己的文章当场试验软件,结果尼克的程序只用108个单词就归纳了这篇千字长文。最后还总结出了两点:尼克只有15岁;他正在寻找种子投资。
文章被发到了首页,于是就有了后面的故事。
至于收购时机的选择,我们可以从一个错误的判断开始,反向分析雅虎的行为动机:有部分媒体认为雅虎收购的是算法,而接下来数学算法将是各种收购的热点。
这种理解错在高估了尼克的数学能力。英国中学生所受的数学训练要远远少于中国学生。而这样一个中学生之所以能够发明Summly是因为“文本摘要”早就是一个非常成熟的技术领域。其中有大量的开源工具来帮助这个17岁的男孩完成这项发明;而他只需要基本的编程知识来组合这些工具,其中包括:句子分割工具,词性标注工具,词根提取工具,等等。
这些工具和语料的出现要感谢在这个领域贡献突出的宾夕法尼亚大学和普林斯顿等机构,他们的教授多年来发动成百上千的博士、硕士生人工标注、整理了大量人类文本,建立了高质量的语料并分享给这个领域,让后来的自然语言处理和机器学习变成可能。而语料有点像是喂给机器的“饲料”,可以让机器逐渐理解人类文字。尼克使用的已经是几代人研究之后的成果了,技术壁垒并不高,相信雅虎公司内部很多普通程序员都可以独立完成尼克的工作。
声称独家采访到尼克,并获取背后原理的TechCrunch文章也验证了我以上的猜测:尼克自己解释,他所做的就是去掉了虚词,去掉了时态、情态,去掉了大部分的关联词,只留下了陈述事实必须使用的名词、动词、数量词和引语等。通过简单的统计找到分值最高的语句,然后将他们按照一定语序排列出来即可。
如果软件本身不是奇迹创造者,那让我们回过头来看雅虎现在缺什么?梅耶尔接手后的雅虎已经走了很多年下坡路,之前收购的很多优秀的Web项目已经全部失败,分别败给了Google和Facebook等公司的同类产品。现在他们最需要的就是有一系列新产品和新人可以让他们在未来的某个新起点上“超车”,更重要的是让用户、投资人看明白他们有这个视野和实力。
这会是个什么样的领域呢?看了Facebook上市前的风险分析,听过Google和微软的商业分析,就可以很清楚地想到这个因商业化困难而让巨擘们纠结,却被知难而进的雅虎看中的机会就是移动市场,以及背后那个非常年轻化的群体。
三千万美元需要一定的运气才能够配对一个好的项目,但是如果你:找到了在目标市场已经赚钱的某个前沿产品;它准确地命中了用户的某种需求;具有很高的scalability;年轻的创始人不仅代表了该群体,还有潜力成为这些人的意见领袖;而且他足够有吸引力,可以成为一夜之间引爆媒体的话题人物,在全世界范围内日夜兼程地进行各种语言背靠背的采访,宣扬他理念,以及被他包装过的、你们公司未来要自证的理念;让所有失望的用户重新集中注意力来听你们说话,尤其是在一个目前用户和投资人对你还不太确信的领域…那么不要犹豫,尼克和Summly是个完美的组合。而这对组合从现在开始将为雅虎代言。