人工智能还是人工智障?亚马逊用户快把Alexa Answers“玩坏”了
有问题,上谷歌?随着人工智能技术的发展,这种习惯可能逐渐被“有问题,问siri”取代。
目前,Alexa、谷歌助手、Siri和Cortana等各家科技巨头的虚拟助手都可以回答用户头脑中出现的各种问题,而且它们每天都在更新改进。
但是,它们给出的答案是否可靠呢?如果像亚马逊这样的公司决定通过众包来填补其平台知问答数据库的空白,会发生什么呢?
其结果有多种可能:可以是有趣的、令人困惑的,也可以是令人担忧的。
亚马逊Alexa Answers允许任何亚马逊用户对那些无人回答的问题提交自己的回答。
当这个web服务在几周前全面上线时,Amazon保证将通过自动审查和手动审查相结合的方式来监督提交的内容。
但一项外媒对Alexa Answers上问答数据的分析显示,平台上存在为数不少的不真实的、打广告的、无礼的问题和答案,这些都被提供给了迄今售出的超过1亿部支持Alexa的设备。
信息不准确
Alexa Answers采用基于分数的系统,以确保高质量的答案排在前面——至少在理论上是这样。
当一个提交的答案变成“实时”——也就是说,当亚马逊开始为Echo和其它第三方Alexa设备所有者推送这个回答时——来自用户的积极反馈(以及分享次数)会增加该回答的总体得分。相反,负面反馈会降低分数。
(在Alexa使用网友的答案来回答一个问题后,Alexa会问“这回答了你的问题吗?”)
根据Alexa Answers社区成员给出的平均星级评分(满分为5分)和反馈评分,系统将决定是否将答案提供给Alexa用户。
得分低于某一分数线的回答不会被分享,而对于多次提交的问题,评分较高的答案更常被分享。
Alexa Answers允许亚马逊用户浏览并回答Alexa用户提出的问题,这些问题涉及的主题十分繁杂,包括动物、气候、电影和电视、食品、地理、历史、文学、音乐、科学、体育和视频游戏等领域。
他们还可以根据其它分类来浏览问题,比如“最近”、“热门”或“状态”(例如,问题是否得到了回答)。
来Alexa Answers的问题附有“来自亚马逊用户”的免责声明。
无论用户通过哪种支持Alexa的设备回答了这个问题,无论是Echo智能扬声器还是显示器、平板电脑,或各种针对安卓、iOS和Windows的Alexa APP。
比如,用一个问题来实验:“为什么奶牛对环境有害?”在外媒的测试过程中,加拿大的Android和iOS的Alexa应用程序最初推送了Alexa Answers的内容,但没有给出免责声明。
外媒报道称,在将这个错误提交给亚马逊大约一周后,它就被修复了。虽然在某个地区可能你没收到免责声明,但实际上亚马逊的免责声明适用于所有受支持的地区和语言。
此外,外媒发现Alexa有时会提供两个不同的答案。
亚马逊表示,对于有两个或更多贡献者提交的答案的问题,Alexa可能会在这些答案之间轮换,直到出现一个明显的优胜回答。
有时,得到不同的答案很简单,只需再次询问Alexa——或者在移动设备上,重启应用程序,然后再次询问。
公平地说,“为什么牛对环境有害?”是一个很重要的问题,但它凸显了Alexa Answers.的一个严重缺陷。
稍微改头换面的问题可能会得到不同的答案,或者偶尔根本没有答案。
例如,如果你问Alexa“牛对环境有害吗?”,它会回答类似于“对不起,我不知道。”
问题含义模糊
Alexa Answers中的问题来自于Alexa的用户,有时他们会问一些虚拟助手无法回答的问题。
一旦某个问题被问了一定次数(亚马逊拒绝透露具体次数),它就会进入Alexa Answers门户网站,在那里,任何拥有亚马逊账户的人都可以轻松回答问题。
因此,对于几乎相同的问题,往往会出现不同的答案。
对于“什么酒配辣椒?”(What wine goes with chili?),Alexa简洁地回答“红酒”。
但如果你问“什么酒和辣椒很配?”(What wine goes well with chili?),Alexa给出了更详细的回答:“大多数侍酒师都认为,黑比诺(Pinot Noir)和博若莱(Beaujolais)等淡红色葡萄酒配上辣椒会更好。它的果味和口感与大多数辣椒食谱中的香料搭配得很好。”
这很容易被“玩坏”。例如,“什么植物对猫有害?”这个问题有两个不同的答案:“毒葛和我妈妈的厨艺”和“猩猩木”。
前者可能是在开玩笑,但它与Google Assistant从PetMD.com中为用户提供的详细答案列表形成了对比。
Alexa使用其不完善的文本-语音转换引擎来理解Alexa Answers中的问题,但这偶尔也会出错。
例如,在“什么是sat siki酱?”的问题中,用户会假设提问者指的是“tzatziki酱”(一种酸奶酱)。在“mick romney值多少钱”的问题中,用户会假设这是对“Mitt”(指前马萨诸塞州州长米特·罗姆尼)的嘲讽。
但他们并不总是能正确会意。
一名用户对“海豚是如何繁殖的?”这个问题的回答是“海豚是哺乳动物,用肺呼吸”,他大概把“繁殖”(breed)当成了“呼吸”(breathe)。
问答存在不恰当信息
根据亚马逊的说法,提交给Alexa Answers的问题,如果属于以下任何一类,可能会被自动和人工审核过滤系统拒绝:
· 不恰当的(主观的、建议的、粗俗的、亵渎的、侮辱性的或无礼的)
· 难以理解的
· 不正确或无关紧要的
· 威胁
· 诽谤
· 侵犯他人隐私
· 侵犯知识产权(包括宣传权)
Alexa Answers还允许会员标记他们认为违反服务条款的答案。
被标记的答案在Alexa answers网站上是看不到的,也不会与Alexa用户共享,但可以被重新编辑和重新提交。
但在外媒测试时,他们的Alexa设备对所有这类问题都做出了响应。
用户有责任标记出有问题的答案,这同时也意味着这些不恰当的问题被暴露给了Alexa用户。
有争议和无礼的问题包括:
气候变化是一场骗局吗?
你如何培育村民?(这可能是指游戏《我的世界》)
在Alexa Answers中出现事实错误并不罕见。
比如这个问题“什么是最热的火焰颜色?”
Reference.com报道说,紫色和白色分别是色谱和可见光谱上最热门的颜色,但Alexa Answers的贡献者写了“橙色”。
人体有22个压觉点,但你如果询问Alexa“人体有多少个压觉点?”,你不会知道正确答案,而只会得到一个令人费解的回答:“420”,这是Alexa Answers中唯一提交的答案。
狗也不是混蛋——至少不是故意的——但这就是某位用户对“为什么狗会嚼东西?”这个问题的回答。
AA电池食用安全吗?人们可能会认为不会,但这与Alexa用户询问他的Echo设备时听到的相反。他得到的回答是:“是的,但不要吃太多。”
另一位Alexa用户问道:“蛋壳对土壤有益吗?”
一位Alexa用户回答说:“不,不要用蛋壳,用蛋黄,植物会更快乐,”这并不完全准确。
蛋黄中含有动物蛋白,在植物利用它们之前,这些蛋白必须被分解,这意味着它们需要首先能够腐烂。而土壤中的蛋壳能为植物提供钙的来源。
提交给Alexa的一些问题的答案相互矛盾。
一位网友在“印度登上月球了吗?”这个回答中指出,印度定位了月球探测器,但无法与其最新的月球探测器“月船二号”取得联系。与此同时,另一名用户开了个玩笑。
事实是,虽然着陆器偏离了预定轨道,失去了联系,这意味着发生了碰撞,但从技术上讲,着陆器是在月球上着陆的(尽管可能不是完整的)。
“谁发现了旧金山湾?”这个问题的回答同样犹豫不决,其中一人认为,应该把这一发现归功于奥隆族印第安部落,而不是西班牙探险家加斯帕尔德波托拉(Gaspar de Portola)。
理想情况下,Alexa会同时提供两个答案,而不是随机提供一个。
与此同时,Google Assistant在从维基百科(Wikipedia)获得的答案中指出,加斯帕德波托拉(Gaspar de Portola)是已知的第一个发现旧金山湾的欧洲人。
而一些有关最新统计数据的问题的回答很快就会过时。
比如:“wassabi(一位youtube播主)有多少订阅粉丝?”三个月前,答案是950万用户。目前这个数字已经增长到1150万。
回答中的广告和玩笑
在一些Alexa Answers用户的眼中,荒谬的问题就应该有个荒谬的答案。
例如:“你如何抓住一头大象?”这个问题下,有人回答:“为了抓住一头大象,你需要蛋糕、葡萄干、望远镜和一把镊子”(摘自艾米·施瓦茨的儿童小说《如何抓住一头大象》)。
或者,它会给出一个肯定更卑鄙的回答:“首先你挖一个洞,把它填满灰烬,然后用豌豆盖住它,当大象来拿豌豆时,你把它踢进洞里。”
诸如“说出一些水生动物的名字?”这个问题下唯一的回答是“鲸鱼、鲨鱼、鲸鲨、蓝鲸、海豚、逆戟鲸、鳄鱼、海龟、短吻鳄、海绵、鳗鱼、大白鲨、小鲨鱼、鲨妈妈、鲨爸爸。”
而来自Reference.com 的对“什么是水生动物?”问题的回答是:“一些水生动物是海龟、水母、小丑鱼和蓝鲸。”
另一个令人担忧的趋势是,Alexa Answers上的一些问题的答案似乎包含广告、赞助或垃圾邮件的内容。
一名用户对“如何完全解出魔方?”的回答是给乐高Mindstorms EV3机器人套件打广告:“解决魔方的最好方法是建造你自己的MindCub3r机器人,它可以由一个乐高Mindstorms EV3家庭装置建造。MindCub3r将扫描这个混乱的立方体,然后完全解决它,使用其独特的机制来扭转侧面和扭转立方体。”
“什么是佛罗里达的僵尸?”和“佛罗里达有僵尸吗?”的问题可能指的是2019年5月的沃斯湖断电通知,其中包括一条关于城市中僵尸的警告。但Alexa Answers用户借此机会宣传沃斯湖的Zombie Run(僵尸路跑)。
其中一条是这样的:“佛罗里达的沃斯湖海滩因黑客发出‘僵尸警报’而闻名,该市将于2019年10月25日为市民举办‘僵尸路跑’活动。”
如何保护问答不受“污染”?
外媒表示,已经要求亚马逊提供更多关于Alexa Answers如何工作的信息,但该公司迄今对细节一直保持谨慎。
目前还不清楚为什么一些在Alexa Answers上指定为“实时”的问题会被提供给Alexa用户,而其他的则不会。
在测试中,大多数问题和答案在尝试时都是有效的,不管它们的状态如何。
“高质量的答案对我们来说很重要,这是我们严肃对待的事情——我们将继续改进Alexa的答案,”一位亚马逊发言人表示。
Alexa Answers同样也饱受问答平台前辈们的缺陷之苦,其中最有名的包括Yahoo Answers、WikiAnswers和StackExchange。
用户有责任认真、彻底地回答问题,并在系统进行自动过滤之外进行自我监督。
大多数参与Alexa Answers的亚马逊用户都遵守规则,但也有一些人无视规则。不幸的是,目前还不清楚恶意行为者是否会受到惩罚,除了答案被删除之外。
这对那些使用Alexa Answers 的Alexa用户来说是个坏消息。亚马逊并没有提供关于答案提供者的声誉信息。
通过将贡献者简单粗暴地归类为“亚马逊用户”,亚马逊可能会为那些在Alexa答题中记录不佳的人提供权威背书——对于Alexa设备所有者来说,这很危险,因为他们的孩子可能会认为Alexa是一个可靠的知识来源。
在回答问题网站和虚拟助手之间,用户与信息交互的方式也存在独特而有问题的结构性差异。
比如在使用Yahoo Answer时,理想的情况下,网站的系统也会根据评分和其它因素为你选出最佳答案。但无论如何,你也可以看到其它答案,有好的有坏的,有搞笑的有严肃的,你可以看看所有答案,并自己辨别真伪。
如果其中一个答案是一个明显的玩笑、恶作剧或垃圾邮件,通常你很容易发现它,并立即向下滚动,查看别的答案。
但是有了语音助手,你就没有机会了。在回答一个问题时,你只能得到一个答案。使用诸如虚拟助手这样的工具的部分便利之处在于,它的后端可以完成所有工作。
尽管关于这些问题没有什么灵丹妙药,但亚马逊最好能更仔细地审查提交给Alexa Answers的答案,或许还可以加强自动化筛选和人工审核。
它可能会考虑制定一个选项,让用户阻止来自Alexa的未评分的答案推送给孩子的Alexa设备——或者他们自己的设备。
本文来自: 前瞻网