新加坡初创公司 Sapient 凭借全新模型架构加入全球企业 AI 竞赛

新加坡初创公司 Sapient 凭借全新模型架构加入全球企业 AI 竞赛

新加坡首家基础模型 AI 初创公司Sapient Intelligence宣布成功完成种子轮融资,以 2 亿美元的估值募集 2200 万美元。

在 Vertex Ventures、住友集团和 JAFCO 等知名投资者的支持下,该公司希望在人工智能开发中开辟一条独特的道路,解决其认为的 GPT 式模型中的根本缺陷。

“这家初创公司的目标实际上是打造新一代基础模型架构,以解决真正复杂且长期的推理任务,这些任务对于大型语言模型 (LLM),尤其是 GPT 架构来说,确实具有挑战性,”联合创始人兼首席执行官 Austin Zheng 在最近通过视频聊天接受采访时表示。

超越传统 Transformer 的新架构

传统的 GPT 风格模型依赖于自回归方法,该方法通过按顺序构建先前的输出来生成预测。

虽然这种方法对于一般任务很有效,但它在多步骤推理和复杂问题解决方面却很困难。

“目前的模型都是用自回归方法训练的,这样做的好处是模型更容易收敛到一般任务,”郑解释说。“所以它听起来真的很聪明,所以它可以解决很多不同的任务。它有很好的泛化能力,但对于它们来说,解决子任务、复杂、长期、多步骤的任务真的非常非常困难。这就是幻觉发挥作用的地方,”郑说。

Sapient 的答案是一种受神经科学和数学启发的新颖模型架构,将变压器组件与循环神经网络结构相结合,模仿人类大脑的工作方式。

“该模型将始终评估解决方案、评估选项并据此为自己提供奖励模型,”郑说。“而且该模型可以不断重复计算,直到得到正确的解决方案。这样,我们的代理将能够部署到企业或生产环境中,并通过反复试验不断学习和改进自己,并学会成为现有代码库的专家。”

这种设计增强了 Sapient 模型的灵活性和强大功能,使其能够精确、可靠地处理广泛的任务。

它还将它们与OpenAI 及其 o1 系列以及其他中国竞争对手的新一代推理模型进行对比。

在基准测试和其他方面均表现优异

公司的创新体现在基准绩效上。

“我们使用的第一个基准实际上是数独,”郑表示。“目前,我们的模型是市场上解决数独问题方面表现最好的神经网络——无需使用中间工具和数据,准确率就达到 95%。”

郑先生表示,其他领先模型需要对中间步骤进行训练才能解决流行的数字排序难题,而 Sapient 仅向模型提供了未完成的数独板、规则和最终解决方案,模型必须通过反复试验自行推断如何解决这些问题。

同样,Sapient 的模型在二维导航和复杂数学问题解决等任务中表现出色,始终优于竞争方法。

训练这些模型是 Sapient 的另一个独特之处。“与需要大量高质量、循序渐进数据的传统模型不同,我们的方法只需要问答对。这大大降低了训练复杂模型的门槛,”郑说。

通过利用合成数据,Sapient 减少了对精选数据集的依赖,创建了可扩展且高效的训练流程。

实际应用:从代码到机器人

Sapient 最初的重点是现实世界的应用,从企业编码和机器人技术开始。

其自主编码代理旨在彻底改变企业管理软件开发和维护需求的方式。

该公司已经在住友的企业环境中部署了自主 AI 编码代理,以学习公司的代码库,并最终开始维护和贡献它。

Sapient 旨在为其他企业客户提供类似的服务,郑先生将其描述为“智能、定制的 AI 员工和 AI 软件工程师,可以帮助他们维护、更新和发展现有的技术堆栈”。

与由 GPT-4o 提供支持的CognitionDevin不同,Sapent 相信其编码 AI 代理将能够自主工作——无需任何人工指导流程或解决问题,只需主管在上线之前检查工作即可。

该公司还在推进具象人工智能,设计使机器人能够实时交互、学习和适应的模型。

“只有少数几家初创公司致力于理解环境,规划选项和任务,了解哪些类型的任务是可行的——同时,它们也在不断完善自己,理解环境、理解问题、理解用例,”郑指出。“这将是我们未来 1-2​​ 年的主要关注点。”

全球视野

Sapient 不仅通过技术脱颖而出,还通过其全球化和包容性的方法脱颖而出。

“在中国以外,真正由亚洲创始人领导的基础模型级人工智能初创公司非常少,”郑说。“我们真的想把自己定位为一个国际化、研究导向型的组织。但同时,我们也想成为首批由亚洲人领导的解决真正具有挑战性的问题的国际研究组织之一,我们也看到这一目标正在实现。”

该公司在新加坡设有办事处,并计划在湾区开展业务,目前正在建立一个人工智能研究实验室,汇集不同的观点和人才。

其团队体现了这种精神,由来自 DeepMind、Anthropic 和 Microsoft AI 等领先机构的科学家和工程师组成。

这种多样性,加上与住友集团等日本投资者的强大合作关系,使 Sapient 成为全球 AI 生态系统中独特的参与者。

针对个人和企业

Sapient 的长期愿景非常宏伟,其目标是开发能够为个人和企业带来同样有用成果的技术。

“我们的最终目标是打造一个真正通用的代理,能够真正解决用户的日常任务——一个可以作为个人助理的‘全代理解决方案’,解决你的所有任务……这就是我们的技术目标,也是我们的发展方向。”郑先生说道。

这包括未来面向公众的产品,如自主编码代理和通用个人助理。

目前,Sapient 专注于完善其技术并提供企业级解决方案。定价模式仍在探索中,但可能包括许可费、订阅费或与成功完成任务挂钩的收费。

随着 Sapient 扩大其运营和能力,它仍然是快速发展的人工智能领域中值得关注的公司。

原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/xin-jia-po-chu-chuang-gong-si-sapient-ping-jie-quan-xin-mo

Like (0)
王 浩然的头像王 浩然作者
Previous 2024年12月11日
Next 2024年12月11日

相关推荐

发表回复

Please Login to Comment