经过过去十余年的发展完善,苹果倾力打造的语音助手 Siri,似乎还是没有摸清门道。
2011 年 10 月,苹果首度曝光其数字助手 Siri,其肩上承担的勃勃野心可见一斑。
苹果公司高管 Phil Schiller 曾在 iPhone 4s 发布会上强调,“几十年来,技术专家们一直在嘲笑我们的这个梦想。‘类似的噱头玩了一遍又一遍,但从来没能成真。’ ”
在 Schiller 看来,真正的问题在于以往的语音界面太过依赖简单的语法表达。“打给妈妈”、“呼叫 555-2368”、“播放贝多芬作品”等等。“但我们真正想要的,是跟自己的设备顺畅交流。手机应该能理解我们的意图、并帮助我们完成相应操作的手机功能。”说到这里,Schiller 翻开了下一页幻灯片,后来为大家所熟悉的抛光铝材质麦克风图标就此映入眼帘。“这就是我们的方案,Siri——它将连同 iPhone 4s 一同面世。”
SCHILLER 指出,“我们真正想要的,是跟自己的设备顺畅交流。”
Schiller 将 Siri 称为一款“和蔼的个人助手”。 在苹果公司的困难探索期,Siri 为 2011 年的 iPhone 注入了一针强心剂。而就在 4s 手机正式发布的几个月前,苹果公司一位不那么知名的雇员、时任首席运营官的 Tim Cook 刚刚出任 CEO 职务。
Schiller 演讲后的第二天,苹果公司传奇联合创始人 Steve Jobs 因胰腺癌不幸辞世。分析师开始对苹果的前景持冷淡态度,但也承认 Siri 有望成为潜在的游戏规则改变者。
有声音称 Siri 为“未来移动设备使用方式的一种全新可能性”,也有人认为它将成为“苹果旗下一切移动及 Mac 产品全新用户体验的起点。”
但十年之后,Siri 的最后一点光芒也已褪去。
Schiller 曾在当初的发布会上,用一句话总结了之前所有语音界面的表现,“太让人失望了。”但 Siri 显然没没能消除这种失望感,每位用户都在 Siri 上遇到过自己的“失望时刻 ”——它可能没听懂一句简单的指令,甚至搞不定一项最基本的操作。
如今的语音界面虽然已经全面普及,苹果也确实是第一家携成熟解决方案进入市场的企业,但并没能把握住领先地位。Siri 仍然“和蔼”,但与其说是和蔼、不如说是软弱:在移动平台上不如谷歌智能助手,在家居场景下也打不过亚马逊 Alexa。
所以回顾苹果个人助手这十年发展历程,我们不得不思考这样一个问题:嘿 Siri,发生了什么事?
回顾 2011 年,刚刚诞生的 Siri 确实赢得了市场的热烈回应,评论者对其迅捷的响应速度和良好的准确性印象深刻。
媒体 The Verge 曾经断言,“Siri 最牛的地方就是它的工作原理——至少在大多数情况下,它的水平都能超出用户的预期。”;CNN 的观点则是,“它有点像我们梦想中的免费助理,随叫随到。”《纽约时报》也感慨,“Siri 帮我们节约了时间、消除了不必要的操作,并深刻改变了手机的定义。”
多么美好,苹果似乎已经兑现了自己的承诺。
但现在回看这些评论,对于 Siri 的赞誉的确有些言过其实。
Siri 当初是靠着新颖性和勃勃雄心冲昏了评论家们的头脑,但在后续使用中逐渐发现问题后,人们开始承认这款软件还仅仅处于测试阶段。那时候大家还很乐观,觉得不断推出的补丁肯定能让 Siri 逐渐成长为真正称职的个人助手。
媒体 Ars Techinca 倒是比较清醒,早在 2011 年的评测中就发现了 Siri 如今最受诟病的问题——在嘈杂的环境中经常听错指令、做出错误判断。 例如,用户说出“给 Jason、Clint、Sam 和 Lee 发短信,说我们打算在 Silver Cloud 吃晚餐”,结果 Siri 理解成了“给 Jason 发短信,Clint、Sam 和 Lee 说我们在 Silver Cloud 吃晚饭。”
Siri 的横空出世令人惊艳,但没过多久,市场上就出现了其他竞争对手。
三星于 2012 年在 Galaxy S3 上推出了 S Voice;同一年,Google Now 推出了 Android 版本(随后于 2016 年被 Google Assistaqnt 谷歌助手所取代);2014 年,微软在 Windows Phone 上公布了 Cortana 小娜;同样是 2014 年,亚马逊走上一条独特的道路,在 Echo 智能扬声器上首度推出 Alexa。
到这个时候,智能语音助手已经已经不再局限于手机平台,而是在各类计算设备上成为一种常规工具。
纵观这个时期,人们对于智能助手的评论基本可以归纳成两点。
首先,人们很快就玩腻了 Siri。在 4s 之后的几代 iPhone 中,Siri 虽然也都会迎来增量式更新,但实际功能根本没有跨越式的提升。更准确地讲,其变化着实有限,例如 iOS 6 中新增检索体育赛事结果;iOS 7 中集成 Wikipedia;在 iOS 8 中引入“嘿,Siri”激活语……就这?没错,就这。
到 2017 年的 iPhone 8 时代,评测人士对于 Siri 已经几乎是一笔带过。我们自己在当初的评测中也就一句,“Siri 的语音听起来自然多了,但除此以外跟之前没多大区别。”
iPhone 4s 上的 Siri 凭借着前无古人的新颖定位引爆评论圈,但苹果显然没能延续这股后劲。
第二个主要趋势是,在竞争对手陆续出现之后,苹果的先发优势开始快速消退。
2012 年在对 Siri 和三星 S Voice 进行比较之后,我们发现后者已经能够提供与“苹果数字助手非常接近的功能表现”,而 2014 年的单挑测试则证明“Google Now 已经优于 Siri”。到 2017 年,The Verge 提出 Siri 已经“明显跟不上时代发展”,用户对它的不满情绪也开始蔓延。
没错,它仍然能很好地回应那些基本问题,但却无法比较可靠地帮助用户购买电影票或者点餐。我们折腾了一圈,往往发现还不如自己亲自动手。
回过头来看,Siri 的大问题明显在于没能延续这股后劲。
时至今日,Siri 上利用率最高的功能仍然是 2011 年刚亮相时的那些 —— 设个闹钟啦、记份便笺之类。虽然我们偶尔也能跟它闲聊一下,或者查查自己关心的球队最近打赢比赛没有,但 Siri 一直没能像当初承诺的那样彻底颠覆使用习惯。
与此同时,竞争对手则达到并超越了 Siri 的水平,开始提供更可靠的听写结果、更出色的语言理解能力与更丰富的第三方功能集成。
到这时候,Siri 已经落后于时代了。
那么,到底是哪里出了问题?苹果 (Siri) 为什么就从学霸变成学渣了呢?答案其实相当复杂。
不少人认为苹果对隐私保护的过度关注,注定他们没法像谷歌那样大量收集用户数据、再利用这些资源改进自己的 AI 系统。我个人觉得这应该不是 Siri 失败的主要原因,毕竟苹果对用户隐私的“尊重”也是有条件的。
2019 年,英国《卫报》就透露苹果曾把“一小部分 Siri 录音转交给承包商进行分析,一名举报人声称其中涉及医患间的讨论、商业交易、疑似非法交易、性接触等内容。
其次,苹果是一家价值 2 万亿美元的公司,如果真的想规避由收集用户数据引发的麻烦,他们完全可以花钱来合成数据。没错,随机分析 Siri 交互当然不错,但也有其他办法可以达到相同的改进效果。
“Steve Jobs 在 Siri 推出后的第二天去世了,苹果也由此失掉了前进的方向。”另一个更有说服力的理由,是苹果内部出现了管理职能障碍。
2018 年,The Information 发布了一份关于 Siri 团队成员变动的报告。可以看到,苹果内部对于 Siri 的基本定位出现了难以调和的分歧 —— 到底该专注于搜索 / 检索功能,还是成长为能执行复杂任务的助手?
这些分歧源自 Steve Jobs 本人最初给 Siri 定下的框架,但随后演变成不同派系之间“争抢地盘与话语权的对抗”。于是,Siri 项目不断经历着走马换将,策略连续性的缺失让情况不断恶化。
正如一位前苹果员工在接受 The Information 采访时所言,“Jobs 在 Siri 推出后的第二天去世了,苹果也由此失掉了前进的方向。”这样的论断,确实符合 Siri 在之后多年里停滞不前的客观现实。
苹果的技术发展理念也给 Siri 压上了一块沉重的大石。
The Information 报道称,苹果公司高管 Richard Williamson 拍板决定每年只对 Siri 进行一次更新,用以匹配公司其他新款硬件和 iOS 系统的更新节奏。这显然会拖慢 Siri 的前进脚步。
但 Williamson 本人随后驳斥了这种说法,还带头在 2012 年灾难性的 Apple Maps 功能推出时提出离职。另一位同样先后参与过 Siri 与 Apple Maps 项目的高管 Scott Forstall 也在同年离职。
还有传言说苹果的“围墙花园”理念阻碍了 Siri 的进步,导致其在调用 iOS 功能时表现不错,但却很难与第三方服务顺畅对接。
确实,在筹备本篇文章时,我惊讶地发现 Siri 居然无法在几乎人人在用的 iOS 应用上实现最简单的功能。Siri 无法通过 WhatsApp 发送语音消息,无法将内容发布至 Instagram,无法在 RunKeeper 上记录跑步数据,也没法启动《纽约时报》应用的填字游戏。
当然,这种互操作性缺失也跟外部开发者的消极态度有关,但苹果不是更应该发布友好易用的工具包、鼓励其他开发商接入 iOS 生态吗?
最后再说个没得洗的问题,我让 Siri 帮我查询存储在 iOS 本机中的信息,例如“让我看看去年八月的照片”,结果它打开了浏览器、在里头搜索名为“去年八月”的图像……
相反,苹果想借 Siri 这个跳板把人们引导回他们自己那套劣质应用库里,这真的让人很不爽。
如果我向 Siri 询问路线,它就会提示我安装 Apple Maps——但你 Apple Maps 凭什么跟 Google Maps 和 Citymapper 争?如果我想给老板发封邮件,Siri 会先回答“对不起,我不能这样做”,然后引导我去 App Store 里下载苹果的默认邮件应用……拜托,我用 Outlook 的好吗?
而且这里很明显能看出苹果对于 Siri 的发展规划有多么草率,因为它在 App Store 里搜索的词条就是“手机邮箱”。这根本不是苹果官方邮件应用的名称哎,而是 iOS“邮件”应用的内部开发代号,所以这样根本啥也搜不到。这还是我认识的那个苹果吗?产品测试都没做完就把功能上线啦?
而且这最后一点,也凸显出包括 Siri 在内的、当前各类语音界面方案的最大通病。
在 Schiller 于 2011 年首次推出 Siri 时,曾一再强调 Siri 可以理解用户的意图——或者说,它能明白用户在说什么,就跟真人一样。
正是这样的心理预期,让我们对后来的 Siri 感到失望。其实如果我们认定语音界面就该像真人那样拥有一定的知识积累、生活常识和理解能力,那注定是要失望的。我们提问,它们答错;我们出题,它们懵圈 ——也许这才是正常状况。
使用中最让人难受的,往往是它们支持不了我们认为它们该支持的功能或者命令。所以每一次失败都相当于提醒了我们,别相信这个什么鬼助手。
相比之下,显示屏上的交互界面才是真正的可靠,能做什么、不能做什么都清晰可循。相较于朴实无华的菜单、导航和按钮,语音只是一种可有可无的娱乐手段。
所以我们本来对 Siri 可以没那么高期待的,都是苹果当初的爆炸式宣传,让我们产生了不切实际的幻想。
我给大家讲个真实的故事。我在写这篇文章时来了一轮中场休息,泡上茶后突然想起一小时后有个远程会议。
为了怕忘记,我就随手来了个日常操作:让 Siri 帮我设个提醒。
“Siri,提醒我差十分钟五点的时候有个会。”Siri 回答得很痛快,“好的,已经为您设好明早五点的闹钟:有个会。”
我又试了一次,这下 Siri 又给晚上十点设了个提醒。
第三次,我激活 Siri 之后思考了一下,想找个更容易理解的表达方式,然后 Siri 明显等烦了,说道“你想让我提醒你什么?”
放弃,果断放弃。
没错,Siri 之类的智能助手经常让人失望,但它们对客户还是有着一定的吸引力,毕竟大家还是期待着它们终有一天能靠谱起来。而且语音界面再怎么不济,也确实代表着一种未来方向。
我经常会用 Siri 完成一些快速操作,例如记笔记 、设置闹钟和进行搜索等。只要不出毛病,它的效果还是颇令人满意的。如果我们认真学习一下苹果快捷命令和常见家居设备操作,那 Siri 的表现还能更好。
作为一种辅助工具,语音控制和听写功能已经在用户中培养起新的使用习惯。自 2011 年苹果 Siri 面世以来,苹果生态中已经出现了越来越多高度依赖于语音控制的产品。
无论是为了解决屏幕尺寸有限的问题(Apple Watch)、还是为了解决没有输入介质的问题(AirPods、HomePod),Siri 都完成了一项项从不可能到可能的任务。
未来几年,希望苹果自家的增强现实眼镜也能加入进来,让 Siri 多一块施展的舞台。所以,拜托苹果认真升级一下 Siri 吧,这真的很重要。
AirPods、HomePod 以及 Apple Watch——总有一些产品需要、甚至完全依赖于 Siri。
这里说点好消息,有迹象表明苹果公司正着手扭转困局。
近年来,苹果对于 AI 技术的关注度日益提升。从 2018 年挖直谷歌机器涫负责人、到内部自研 AI 处理器、再到定期发布 AI 增强功能,苹果的 AI 野心已经不言自明。更重要的是,Siri 本身也迎来了一系列重大改进,并将在今年实现本机处理并开始支持第三方硬件。
但我个人还是心存怀疑。首先,即使是在执行基本命令方面,Siri 的表现也不只是停滞不前、有时候还会倒退。在 iOS 15 中,苹果删除了 Siri 的大量功能,包括涉及笔记和照片的任务;叫车和支付等第三方集成操作也被拿下。我最近还发现检查语音邮件等基本命令好像也消失了,具体如何还有待验证。
在我看来,苹果最大的问题是仍然没想好 Siri 应该是个什么定位。它到底只是提供一种通过语音控制手机的途径(比如浏览应用并查找内容),还是像真正的助手那样执行复杂的任务? 苹果在宣传材料中肯定是选择了后者,但用户却发现 Siri 的真实功能只局限于前者。
我们这帮媒体人长年接触 AI 和机器学习内容,所以很明白 让计算机真正听懂人话仍是个遥不可及的长远目标。 语言这东西太复杂了,深深植根于人类的经验与文化之内,根本不是靠统计模型就能强行解读的。所以虽然出现了不少让人印象深刻的新型语言系统,但它们都不够可靠,还支撑不起完美的数字化助手。
如果苹果想要挽救 Siri,我觉得他们首先应该重新设定期望值,之后专注于提升核心竞争力。
其实把 Siri 发布会跟其他竞争对手的宣传内容做出比较,我们就能看到有趣的区别。
例如,谷歌在 2016 年推出 Google Assistant 时,重点并不是解决复杂任务、或者理解用户提出的那些脑洞大开的问题;它的目标只有一个,拓展谷歌搜索功能的使用方式和使用范围。
正是这种只做对一件事的定位,让谷歌博得了用户们的青睐。(当然,后来他们也在宣传中做出过不靠谱的承诺,这里就不展开了。)
相比之下,Siri 在 2011 年初登场时“牛吹得太大”,之后无论怎么努力也满足不了用户的胃口。所以苹果最好能 “认清形势、放弃幻想”, 回归原点再出发。
原文链接:
https://www.theverge.com/22704233/siri-apple-digital-assistant-10-years-development-problems-why
点击下方图片即可阅读
谷歌高级工程师:2022年最值得学习的编程语言
你也「在看」吗?👇