分类
加州大学尔湾分校新闻

Alexa、Siri和Cortana会录下你的私人对话吗?

智能音箱就像我们的私人助理,提供了一种不用手的方式来获取信息,控制我们的家,管理我们的日程安排。像任何一个好助手一样,他们总是在倾听。

每台设备都有一个“唤醒词”,触发它开始记录、处理和传播它所听到的。

“Alexa,会下雨吗?”

“好吧,明天中午提醒我给妈妈打电话。”

“嘿,Siri,扮演Brittany Spears的‘Toxic’。”

大卫Choffnes。Adam Glanzman/东北大学

但是这些设备意外醒来的频率有多高呢?他们会录下我们的私人谈话,然后发送到云端存储吗?我们的个人信息安全吗?

东北大学计算机科学副教授David Choffnes说,好消息是,它们不会一直记录下来。当它们偶然被激活时,录音通常很短。

“但这并不意味着没有理由担心,”他说。

在最近的一项研究中,考夫尼斯和他的同事们开始研究这些说话者醒来并录音的频率和时长。由于这些设备的内部运行情况属于专有信息,测试它们的最佳方式就是观察它们听对话的过程。很多对话。

研究人员设置了各种类型的智能扬声器来播放最终的疯狂观看:包括《吉尔莫女孩》(Gilmore Girls)、《毒手》(Narcos)、《白宫风云》(The West Wing)和《亲爱的白人》(Dear White People)在内的十几部Netflix热门剧集的134小时音频。一个现场视频(七个智能扬声器专注地听一个普通扬声器)根据每个扬声器的指示灯跟踪激活。

研究人员将光与路由器流量匹配,表明记录是通过互联网发送的,并检查了亚马逊和谷歌为各自设备提供的基于云的激活日志。

The Mon(IoT)r Lab run by David Choffnes, an associate professor in the Khoury College of Computer Sciences, is  an apartment outfitted with cutting-edge smart devices, where researchers study how data is collected and shared online. Photo by Matthew Modoono/Northeastern University

我们知道公司正在收集和分享我们的数据。我们能做些什么吗?


read more

“我们必须建立很多基础设施,做一些有点疯狂的事情,”Choffnes说。“但这让我们能够让设备接触到长达一周的对话,而不需要我和丹尼尔·杜波依斯(Daniel Dubois,东北大学的一名研究科学家)以及团队的其他成员坐在房间里按照剧本进行对话。”

使用电视节目也增加了说话者的多样性——每个节目可能有10个或更多的说话者,他们年龄不同,有不同的口音,偶尔也会说不同的语言。

引起最多错误激活的节目是毒枭,每10000个单词中就有6.21个单词。这些激活似乎主要发生在用西班牙语或口音很重的英语进行对话时,这引发了另外一个问题:这些设备是否更频繁地失效,并侵犯了操多种语言的人的隐私,或者没有“典型的美国”口音的人的隐私?

“这是我们真正想要研究的一个领域,”考夫尼斯说。“在我们的研究中,我们确实试图选择了非常广泛的电视节目,但我们并没有做额外的测试和严格的分析来区分这些影响,以及该设备如何可能会对特定人群产生不均衡的行为。”

结果因人而异,有些人几乎每小时激活一次,或者每说10000个单词就会激活1.43次。虽然这些激活通常很短,但对于一些设备来说,10%的错误激活持续10秒或更长时间。

有时,演讲者犯错误的原因是显而易见的。像“对不起”或“嘿,你感觉怎么样?”可能会被误认为是“嘿Siri”;“head coach”和“pickle”听起来像“Echo”,足以触发亚马逊的设备。

但其他的激活似乎几乎是随机的。

“有很多这样的情况,设备醒来,我们不知道为什么,而且它们是不可重复的,”Choffnes说。“这意味着在你的家里,在你的工作中,无论这些设备在哪里,都会有一大堆随机的事情让它们醒来并录制音频。”如果你真的想确保他们没有在不该录音的时候录音,这就需要考虑了。”

人脸识别技术:在我们匆忙部署它的时候,我们是否忽视了风险?阅读更多

似乎没有人能从一个10秒的音频片段中收集到很多信息,但是我们说的不仅仅是一个录音。Choffnes说,谈话的每一个片段都存储在云里,随着时间的推移,这可能会增加巨大的隐私风险。

即使这些信息没有被恶意方获取,智能扬声器制造商也会通过付钱给承包商来转录这些音频文件来改进他们的语音识别软件。

Choffnes说:“很多人一想到自己的家,就会觉得那是一个私人空间,我们可以在那里进行不应该被分享的谈话。”“现在我们有了这些带麦克风的设备,可以进行这些对话并分享它们。”

媒体查询,请通过[email protected]或617-373-5718联系Mike Woeste。

新闻旨在传播有益信息,英文原版地址:https://news.northeastern.edu/2020/07/14/are-alexa-siri-and-cortana-recording-your-private-conversations/