随着越来越多的企业组织展望所谓的代理未来,一个障碍可能是人工智能模型的构建方式。对于企业人工智能开发人员A121来说,答案是显而易见的,该行业需要寻找其他模型架构来启用更高效的人工智能代理。
AI21首席执行官Ari Goshen在接受VentureBeat采访时表示,最受欢迎的模型架构Transformers具有限制,这将使多代理生态系统变得困难。
你准备好使用人工智能代理了吗?
Goshen说:“我看到的一个趋势是非变压器架构的兴起,这些替代架构将更有效率。”“变形金刚通过创建如此多的代币来发挥作用,这些代币可能会变得非常昂贵。”
AI21专注于开发企业人工智能解决方案,之前曾提出过,变压器应该是模型架构的选项,而不是默认架构。它正在使用JAMBA架构(联合关注和Mamba架构的缩写)开发基础模型。它基于普林斯顿大学和卡内基梅隆大学的研究人员开发的曼巴架构,可以提供更快的推理时间和更长的上下文。
Goshen说,像Mamba和Jamba这样的替代架构通常可以使代理结构更高效,最重要的是,价格实惠。对他来说,基于Mamba的模型具有更好的内存性能,这将使代理,特别是连接到其他模型的代理,更好地工作。
他将人工智能代理现在才开始流行的原因——以及为什么大多数代理尚未进入产品——归因于对使用转换构建的LLM的依赖。
Goshen说:“代理商尚未进入生产模式的主要原因是可靠性或缺乏可靠性。”“当你分解变压器模型时,你知道它非常随机,所以任何错误都会延续下去。”
企业代理越来越受欢迎
人工智能代理成为今年企业人工智能的最大趋势之一。几家公司推出了人工智能代理和平台,以便于构建代理。
ServiceNow宣布了其Now Assist AI平台的更新,包括面向客户的AI代理库。Salesforce有其名为Agentforce的稳定代理,而Slack已经开始允许用户集成来自Salesforce、Cohere、Workday、Asana、Adobe等的代理。
Goshen认为,随着模型和模型架构的正确组合,这种趋势将变得更加流行。
他说:“我们现在看到的一些用例,如来自聊天机器人的问答,基本上是美化搜索。”“我认为真正的智能是连接和检索来自来源的不同信息。”
Goshen补充说,AI21正在开发围绕人工智能代理的产品。
其他建筑争夺关注
Goshen强烈支持Mamba和AI21的Jamba等替代架构,主要是因为他认为变压器模型过于昂贵和笨重,无法运行。
Mamba可以对不同的数据进行优先排序,为输入分配权重,优化内存使用,并使用GPU的处理能力,而不是形成变压器模型骨干的注意力机制。
曼巴越来越受欢迎。在过去的几个月里,其他开源和开放重量级人工智能开发人员已经开始发布基于Mamba的模型。Mistral在7月发布了Codestral Mamba 7B,8月,Falcon发布了自己的基于Mamba的模型Falcon Mamba 7B。
然而,在开发基础模型时,变压器架构已经成为默认的,如果不是标准的,也是选择。当然,OpenAI的GPT是一个变压器模型——它的名字就像字面意思一样——但大多数其他流行的模型也是如此。
Goshen说,归根结底,企业希望哪种方法更可靠。但组织也必须警惕有望解决其许多问题的华丽演示。
Goshen说:“我们正处于魅力演示很容易做到的阶段,但我们更接近于产品阶段。”“使用企业人工智能进行研究是可以的,但企业还不能使用它来为决策提供信息。”
原创文章,作者:点点,如若转载,请注明出处:https://www.dian8dian.com/ai21-shou-xi-zhi-xing-guan-biao-shi-you-yu-cuo-wu-yan-xu