2025 年将是大型科技公司从向我们出售越来越强大的工具转变为向我们出售越来越强大的能力的一年。工具和能力之间的区别微妙而深刻。我们将工具用作帮助我们克服有机限制的外部物品。从汽车和飞机到手机和电脑,工具极大地扩展了我们作为个人、大型团队和庞大文明所能完成的事情。
能力则有所不同。我们以第一人称体验能力,将其视为自我体现的能力,感觉是内在的,并且可立即被我们的意识所利用。例如,语言和数学是人类创造的技术,我们将其装入大脑并终生携带,从而扩展了我们思考、创造和协作的能力。它们是超能力,感觉是我们存在所固有的,以至于我们很少将它们视为技术。幸运的是,我们不需要购买服务计划。
然而,下一波超级能力不会是免费的。但就像我们用语言和数字思考的能力一样,我们将体验到这些能力作为我们一生中随身携带的自我体现能力。我将这种新技术学科称为增强思维,它将从人工智能、对话式计算和增强现实的融合中诞生。而且,到 2025 年,它将在世界上最大的公司之间引发一场军备竞赛,向我们出售超人的能力。
这些新的超能力将由情境感知型人工智能代理释放,这些代理被加载到可穿戴设备(如人工智能眼镜)中,伴随我们一生,看我们所见,听我们所听,体验我们所体验,并增强我们感知和解读世界的能力。事实上,到 2030 年,我预测我们大多数人将在情境感知型人工智能代理的帮助下生活,这些代理将数字超能力带入我们的日常生活。
我们的超人类未来将会如何展开?
首先,我们会向这些智能代理低声细语,它们也会回应我们,就像无所不知的另一个自我,为我们提供情境感知的建议、知识、指导、建议、空间提醒、方向提示、触觉提示以及其他言语和感知内容,指导我们度过每一天,让我们了解我们的世界。
考虑一下这个简单的场景:你正在市中心散步,发现街对面有一家商店。你想知道它几点开门?于是,你拿起手机,输入(或说出)商店名称。你很快在网站上找到了营业时间,也许还会查看有关商店的其他信息。这是当今流行的基本工具使用计算模型。
现在,让我们看看大型科技公司将如何转型到能力计算模型。
第 1 阶段:您戴上人工智能眼镜,它可以看到您所看到的内容,听到您所听到的内容,并通过多模态大型语言模型 (LLM) 处理您的周围环境。现在,当您看到街对面的那家商店时,您只需低声对自己说:“不知道它什么时候开门?”然后一个声音会立即响起在您的耳边:“上午 10:30。”
我知道这和让你的手机查找商店名称相比只是一种微妙的转变,但它会给人深刻的感受。原因是情境感知型人工智能代理将分享你的现实。它不仅仅是像 GPS 一样跟踪你的位置,它还能看到、听到并关注你正在关注的事物。这会让它感觉不像是一种工具,而更像是一种与你的第一人称现实相关的内在能力。
当我们耳朵里的人工智能助手问我们问题时,我们通常会点头表示肯定(眼镜里的传感器可以检测到)或摇头表示拒绝。这种回答感觉如此自然流畅,我们甚至可能没有意识到自己回答了问题。
第二阶段:到 2030 年,我们将不再需要对陪伴我们一生的人工智能代理悄悄说话。相反,我们只需用嘴巴说出话来,人工智能就会通过读唇语和检测我们肌肉的激活信号来了解我们在说什么。我相信“用嘴巴说话”将会得到应用,因为它更私密,在嘈杂的空间中更具弹性,最重要的是,它会让人感觉更个人化、更内在、更自我。
第三阶段:到 2035 年,你甚至可能不需要用嘴说出来。这是因为人工智能将学会以如此微妙和精确的方式解读我们肌肉中的信号,我们只需要想着用嘴说出来就能传达我们的意图。我们将能够将注意力集中在我们世界中的任何事物或活动上并思考一些事情,有用的信息将从我们的人工智能眼镜中回响,就像我们头脑中无所不知的声音一样。
当然,这些功能远不止好奇你周围的事物。这是因为与你共享第一人称现实的机载人工智能将学会在你提出要求之前预测你想要的信息。例如,当一位同事从走廊尽头走过来,而你又记不住他的名字时,人工智能会感觉到你的不安,然后响起一个声音:“工程部的格雷格。”
或者,当你在商店里拿起一罐汤,好奇里面的碳水化合物,或者想知道沃尔玛的汤是否更便宜时,答案就会在你的耳边响起或以视觉形式出现。它甚至会赋予你超人的能力,让你评估别人脸上的情绪,预测他们的情绪、目标或意图,并在实时对话中指导你,让你更有吸引力、更有说服力(参见这个有趣的视频示例)。
我知道有些人会对我上面预测的采用水平和快速的时间框架持怀疑态度,但我并不是轻率地做出这些断言。我职业生涯的大部分时间都在研究增强和扩展人类能力的技术,我可以毫无疑问地说,移动计算市场即将大规模地朝着这个方向发展。
在过去的 12 个月中,全球两家最具影响力和创新精神的公司 Meta 和 Google 透露了他们赋予我们自我超能力的意图。Meta 迈出了第一步,为其 Ray-Ban 眼镜添加了情境感知 AI,并展示了其增加了令人印象深刻的视觉功能的 Orion 混合现实原型。Meta 现在非常有能力利用其在 AI 和扩展现实 (XR) 方面的巨额投资,成为移动计算市场的主要参与者,他们很可能会通过向我们出售我们无法抗拒的超能力来实现这一目标。
谷歌也不甘示弱,最近宣布推出 Android XR,这是一款全新的人工智能操作系统,可通过无缝情境感知内容增强我们的世界。他们还宣布与三星合作,将新眼镜和耳机推向市场。凭借超过 70% 的移动操作系统市场份额以及 Gemini 日益强大的人工智能影响力,我相信谷歌完全有能力在未来几年内成为技术支持的人类超能力的领先提供商。
当然,我们需要考虑风险
引用1962 年著名的《蜘蛛侠》漫画,“能力越大,责任越大”。这句至理名言实际上就是关于超能力的。不同之处在于,重大责任不会落在购买这些技术力量的消费者身上,而是落在提供这些技术力量的公司和监管这些技术的监管机构身上。
毕竟,当我们戴上人工智能增强现实 (AR) 眼镜时,我们每个人都会发现自己身处一个新现实中,第三方控制的技术可以选择性地改变我们所看到和听到的内容,而人工智能的声音则会在我们耳边低语,提供建议、信息和指导。虽然意图是积极的,甚至是神奇的,但滥用的可能性也同样巨大。
为了避免出现这种反乌托邦的后果,我向消费者和制造商提出的主要建议是采用订阅式商业模式。如果销售超能力的军备竞赛取决于哪家公司能以合理的月费提供最令人惊叹的新能力——那么我们都会受益。相反,如果商业模式变成了一场竞争,通过在我们的日常生活中向我们的眼睛和耳朵传递最有效的定向影响来将超能力货币化,那么消费者很容易受到操纵,其精确度和普遍性是我们从未遇到过的。
最终,这些超能力不会让人觉得是可有可无的。毕竟,没有它们会让我们处于认知劣势。现在,行业和监管机构必须确保我们以不具侵扰性、操纵性或危险性的方式推出这些新能力。我相信这可以成为计算领域的一个神奇新方向,但它需要仔细规划和监督。
原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/wei-shen-me-qing-jing-gan-zhi-xing-ren-gong-zhi-neng-dai-li