我让一群AI助手填写了NCAA疯狂三月锦标赛预测表,结果令人惊讶

我让一群AI助手填写了NCAA疯狂三月锦标赛预测表,结果令人惊讶

想象一下,如果一支由200人组成的大型团队能够进行深思熟虑的实时对话,他们高效地集思广益、分享知识、辩论备选方案,并迅速达成共识,得出AI优化的解决方案。这真的可能吗?如果可能的话,这种方式是否会放大他们的集体智慧

如今,一项名为“对话群体智能”(或简称“超聊”)的新技术正在使这一切成为现实。这项技术允许任何规模的团队进行实时对话,并迅速达成共识。为了验证这一点,我请Unanimous AI的研究团队召集了50名随机的体育迷,让他们通过实时对话的方式快速填写了一份NCAA疯狂三月锦标赛的预测表。

群体智慧的挑战

在讲述实验过程之前,我需要解释一下为什么我们不能简单地将50人拉进一个Zoom会议,让他们一起填写预测表。研究表明,进行高效实时对话的理想人数只有4到7人。在小群体中,每个人都有足够的时间表达自己的观点,且等待回应的时间也较短。但随着群体规模的扩大,每个人的发言时间减少,等待时间增加。当人数超过十几个时,对话就会变成一系列独白。人数超过20人时,对话就会陷入混乱。

超聊技术的工作原理

超聊技术通过将一个大型群体分成多个并行的子群体来解决这个问题。然后,在每个子群体中引入一个名为“对话代理”的AI助手,负责提炼该子群体内的人类见解,并快速以自然语言的形式与其他子群体分享这些见解。这些代理使所有子群体能够相互重叠,将局部对话编织成一个单一的大规模对话。这项技术不仅使大规模通信和协作变得高效,还显著放大了群体智慧。

实验过程与结果

为了公开测试这项技术,我请Unanimous AI的团队在他们的Thinkscape平台上召集了50名随机的体育迷,并让他们通过超聊技术填写了一份NCAA疯狂三月锦标赛的预测表。这份预测表随后被提交到了ESPN的疯狂三月锦标赛预测大赛中,与3000万份其他预测表一较高下。令人惊讶的是,由50名随机体育迷通过超聊技术创建的预测表在ESPN大赛中的表现位列前1.4%(第99百分位)。

当然,随着锦标赛的进行,任何事情都可能发生,但到目前为止,这群通过超聊技术集思广益的体育迷所展现的集体智慧已经超出了我的预期。这并不是这项技术第一次让我感到惊讶。

在2024年由卡内基梅隆大学和Unanimous AI研究人员进行的一项研究中,35人组成的小组被要求通过超聊技术进行标准智商测试。结果显示,这些随机参与者的平均智商为100(第50百分位),但当他们在超聊平台上进行对话式讨论时,他们的有效智商达到了128(第97百分位),达到了天才水平。

另一项2024年的研究则要求75人组成的小组通过实时对话共同解决一个创意挑战。这些小组多次进行了讨论,一半使用标准聊天方式,一半使用Thinkscape平台上的超聊技术。之后,小组们对比了两种讨论方式的体验,并报告称,在使用超聊技术时,他们感到更加高效、更加协作,并且能够提出更好的解决方案(p<0.001)。他们还表示,对通过超聊技术得出的解决方案更有认同感,并在过程中感受到了更多的“参与感”(p<0.001)。

技术展望

超聊技术已经激发了我长期以来的兴趣,它不仅使人类群体变得更聪明,还具备使人类参与者和AI代理以无限规模协作的潜力,从而实现保持人类控制的优化决策。这要求在超聊结构中添加第二种类型的AI代理,即“贡献代理”。这些代理以对话形式提供实时事实内容,以支持正在进行的人类讨论。目标是实现一种混合型的集体超级智能。

这种混合技术已在2024年的一项研究中得到了初步测试,该研究将人类和AI代理聚集在一起,通过实时超聊结构组建梦幻棒球队。结果显示,大型协作群体认为超聊结构是一种高度有效的讨论方式,87%的参与者表示它显著提高了决策质量。

结语

对话群体智能是一种强大的AI应用方式,它有可能彻底改变协作方式,使任何规模的团队都能进行实时对话。考虑到平均财富1000强公司拥有超过3万名员工,且各功能团队拥有数百名成员,这项技术有望解决长期以来限制实时讨论局限于小团队的瓶颈问题。同时,它也是一种在关键决策中有效利用AI力量,同时保持人类控制权的高效方式。

原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/wo-rang-yi-qun-ai-zhu-shou-tian-xie-le-ncaa-feng-kuang-san

Like (0)
王 浩然的头像王 浩然作者
Previous 6天前
Next 6天前

相关推荐

发表回复

Please Login to Comment