智能资讯>>质量舆情>>
智能音箱也许正在“偷听”你的秘密
2019-04-12 15:05:24 中国质量新闻网

中国质量新闻网通讯员悟知了综合报道

智能手机用户如果细心留意,会发现一个有点“恐怖”的现象。自己最近无意中的关注,会很快成为手机APP的推送内容。这些“无意中的关注”可能是在手机上查询的词条,通讯软件中输入的文字或语音,甚至还有日常对话中出现的词语。这一现象不得不让人怀疑是否正在被APP“监听”?

“监听”推进技术进步?

其实通过手机监听监视机主的生活早就不是什么新闻了,远的有18年前的“81192事件”,证明当时的手机,即使关机并拆卸电池,仍旧可以进行监听,近的有“棱镜计划”的曝光。

最近的信息表明,遭遇“监听”的不止手机,还有国内外近几年兴起的智能音箱。亚马逊智能音箱Echo中植入的智能语音助手Alexa,近期就被曝出有千人监听团有计划的进行“监听”。

4月11日,彭博社发布调查报道称:7位为“监听”项目工作的员工透露了亚马逊Alexa的人工声音检查流程。这些工作人员称,有时候,(监听团)中的工作人员会听到用户私人的声音片段,如一个女人洗澡时严重走调的歌声,或者一个孩子尖叫着寻求帮助。还有两名员工甚至称,他们听到过他们认为是性侵案的声音。

在此之前亚马逊从来没有对外公开过监听Alexa用户私人聊天,也没有披露过Alexa的语音技术中有人类参与。

2014年上市的Echo音箱是目前世界上用户最多的智能音箱,在Echo之后,谷歌也推出了植入谷歌语音助手的Google Home智能音箱,苹果随后推出了采用Siri的智能音箱HomePod。在中国,天猫精灵、小度智能音箱、小米AI音箱等也纷纷步入市场。

很多智能音箱的用户已经习惯通过唤醒词将智能音箱中的语音助手激活,进而向它提出问题或下达指令,有的智能音箱甚至还能与用户进行机智的对话。但智能语音助手如此“听话”的背后却不仅是人工智能和机器学习,还有人类团队“监听”用户与机器交谈并改进算法的“功劳”。

千人监听团

在亚马逊的广告词Alexa被称为是“生活在云端,并且一直越来越聪明”的机器人,其实和许多需要从经验中学习的软件一样,人类才是教会机器人更像人类的真正老师。

亚马逊目前在全球有数千名工作人员负责“听取”和“检查”用户和智能语音助手的私人对话,目的是改进语音识别技术。罗马尼亚首都布加勒斯特的两名工作人员透露,他们一天工作9小时,每天解析的音频片段多大1000条以上。

该团队收听用户在家中和办公室内Echo音箱抓取的录音。这些录音会被转录、加上注释,然后反馈到软件中,用以消除智能语音助手对人类语言的理解错误,并改正错误。相关工作人员分布在世界各地,包括波士顿、哥斯达黎加、印度、罗马尼亚。这些工作人员都签署了“保密协议”禁止公开这一项目。

“监听”不限内容

亚马逊的发言人在一份电子邮件中表示:

“我们认真对待用户的个人信息和隐私安全。只会注释极小一部分的Alexa录音样本,为了改善用户体验。如帮助我们训练语音识别和自然语言理解系统的信息,这样Alexa可以更好地理解用户要求,并保证对每个人都能提供好的服务。”

“我们有严格的技术和操作保障,对滥用我们系统的行为采取零容忍政策。员工在工作流程中无法直接访问能辨别用户和账号的信息。我们使用多重验证来限制访问,对服务加密,审计我们的工作环境,以对所有信息高度保密。”

但是根据亚马逊“监听团”目前的工作流程,声音片段的抓取对内容“百无禁忌”。智能音箱时刻开启麦克风,用以接受用户随时说出的唤醒词。默认的唤醒词为“Alexa”,亚马逊语音助手被设计为持续记录音频,保证唤醒词接收。

有时工作人员会听到用户私人的声音片段,并利用内部聊天室共享文件,解析含糊的单词,或者是分享搞笑的录音。有时员工还会听到不安甚至有可能是犯罪的录音。两名员工称,他们听到过他们认为是性侵案的声音,当这种事情发生时,他们会在内部聊天室说出来解压。

亚马逊对此表示,员工听到令人痛苦的事情时,他们有标准流程处理。但是这两位罗马尼亚员工表示,他们对这类问题提出疑问时,被告知干预此类事件不是亚马逊的工作。

隐秘的监听政策

据研究机构Canalys公开发布的报告显示,2018年,全球消费者购买了7800万台智能音箱,其中数百万台通过语音软件与智能手机上的智能助手进行交互。

大多数现代语音识别系统依赖于模仿人脑的神经网络,软件会通过海量数据进行机器学习,为智能音箱的算法提供模型。如果用户向智能语音助手提问附近有没有名叫“美国某某”的地方,算法会自动帮助用户寻找美式咖啡厅、美式快餐厅等,而不是清真寺或伊斯兰风味餐厅。

由于俚语、口语、方言和非英语类语言的影响。因此很多提供智能语音技术的公司都雇佣了人类员工,理由是帮助填补算法的空白。

关于Alexa的隐私设置,亚马逊相关的常见问题解答列表中提到“我们使用您对Alexa的命令来训练我们的语音识别和自然语言理解系统”,至于如何训练,是否有人类员工参与则语焉不详。

发送给监听团工作人员的Alexa录音没有提供用户的全名和地址,这似乎是保护隐私的一种措施,但相关的语音内容却与用户的账号、名称及设备编号关联,尽管亚马逊禁止用户使用录音欣彤开发新的功能,但对于监听团成员,这条规定并不适用。也就是说,监听团成员如果想得到语音相关用户的信息,可以自己开发相关功能,而且不受到亚马逊内部制度的约束。

监听不止一家

除亚马逊外,依赖人工操作对智能系统进行补充的技术公司,还有谷歌、苹果等。2014年,谷歌母公司Alphabet就推出了Google Home智能音箱,随后苹果公司也推出了HomePod。这些品牌的语音助手也都在训练和提升相关技术的时候引入了人类帮助。

苹果Siri的人工辅助负责评估语音助手对请求的解释是否与用户需求相符。根据苹果安全白皮书,员工检查的Siri录音是没有个人身份信息的,录音会与一个随机标识符关联,存储六个月,之后这些数据就会被移除随机标识符,但如果相关技术人员认为有必要,也有可能存储更长时间以改善Siri的语音识别。

在谷歌,一些人类技术人员也可以获取谷歌助手的音频片段帮助训练和改善产品,谷歌对外宣称,这些音频没有个人身份信息,并且经过音频失真处理。但谷歌也同样没有表示过已对相关技术人员自行解密有关信息进行了限制。

监听,本身是一种侵权行为,但如果这一行为被戴上了“技术提升”的冠冕,是都就可以堂而皇之的大行其道呢?对于已经或即将成为智能音箱用户的消费者来说,这是一个值得思考,又不那么容易找到答案的问题。

(责任编辑: 李素 )