财富中文网 >> 商业

AI不那么美妙的一面:他们在听你跟Alexa说了什么

分享: [双语阅读]

人们可能想不到,自己向亚马逊语音助手提问时,还有其他人在听。

人们可能想不到,自己向亚马逊语音助手Alexa询问身上的奇怪皮疹是怎么回事,或者要它关上灯时,还有其他人在听。

要让人工智能变得更聪明,就需要人的输入以及复核。上个月,彭博报道曝光了一个遍及全球的团队,他们的任务是聆听毫无防备的用户向Alexa提出的问题,而且这个AI训练团队有数千人之多。

这些员工听的录音包括人们要Alexa关灯,或者播放泰勒·斯威夫特的歌曲。他们把这些话整理出来,再重新输入Alexa的软件中,让它变得更聪明并且更善于掌握人们说话的方式。

平台Twilio Autopilot供开发者制作机器人程序和Alexa应用,该机构产品和工程部门负责人尼可·阿科斯塔说:“用这种方式训练很正常,而且这是AI不那么美妙的一面。所有语音引擎都需要用真实世界的声音来训练,也就是说,需要有人把这些声音整理出来,以便不间断地训练这种引擎。”

把这样的智能音箱放在家里显然要权衡隐私问题。亚马逊发言人在给《财富》杂志的声明中表示,该公司使用了“随机挑选的一批用户中极小的一部分互动内容”,听录音的亚马逊员工无法借此来辨别用户的身份。

该发言人指出:“比如说,这些信息帮助我们训练我们的语音识别和自然语言解读系统,这样Alexa就能更好地理解您的要求,并确保它的服务对任何人都很有效。我们有严格的技术和操作防范措施,而且对滥用我们这个系统的行为采取零容忍政策。”

网络安全公司Forcepoint首席科学家理查德·福特认为:“原始人类训练数据对保持上述服务的质量来说很‘关键’。”

福特说:“如果想对Alexa进行语音识别训练,最好的训练数据就是实际‘使用中’的情境,其中有背景噪音,有狗叫,有人们在进行交流……也就是大家能在真实世界中见到的所有‘乱糟糟的东西’。”

但他指出,Alexa也有其他训练途径,并不需要偷听数千万人对Alexa的要求。

福特说:“你可以付钱,让人们选择自愿分享数据,或者参加测试。但说到底,用容易操作的方式获得真正的现实数据可能需要捕捉真实世界数据。也许可以采取一些缓解措施来尽量降低隐私风险,但它们并非万无一失。隐私是把好的治理、好的设计以及好的实施融合在一起。”

此前已有人担心把大型科技公司的智能音箱放在家里存在隐私问题,这件事更是加重了他们的顾虑。不过,亚马逊表示Alexa只录下了用户的要求,并在听到“Alexa”或“亚马逊”等唤醒词语后把录音发送到了云端。亚马逊Echo音箱录音时的特征很明显,那就是它顶端的蓝色光圈会亮起来。

以前的录音可以删除。用户可以在Amazon Connect and Devices网站上手动删除自己对Alexa说的所有内容。他们可以在该网站上选择“设备”,也就是亚马逊Echo音箱,然后点击“管理语音录音”。

如果根本就不想做“被蒙在鼓里的”AI训练师,那就可以在亚马逊Alexa App上点击左上角的菜单按钮,然后选择“Alexa账号”和“Alexa隐私”。再点击“管理您的数据如何改善Alexa”,然后关闭“帮助开发新功能”和“用短信来改善对语音的整理”选项。这样亚马逊就无法用原始录音来训练它的软件了。

当然,如果选择隐私的人过多,提高AI的自然语言理解能力所花费的时间就会变得长得多。福特说:“在不使用真实数据的情况下构建这样的语言素材库真的很难,正因为这样,才会出现从实际使用中收集数据的真切需求。要想按时并且高效地交付产品,这会成为一个很大的难题。”(财富中文网)

作者:Alyssa Newcomb

译者:Charlie

审校:夏林

阅读全文

相关阅读:

  1. 只需50种药就可以治疗所有疾病?人工智能显威力
  2. 亚马逊助力大众创建工业云
  3. 连设计师的饭碗也抢,人工智能还有什么干不了?
返回顶部