
近日,中国搜索引擎巨头百度宣布推出两款全新的人工智能模型——ERNIE 4.5与ERNIE X1。ERNIE 4.5作为一款多模态语言模型,而ERNIE X1则专注于推理能力。百度声称,这两款模型在多项指标上均达到了业界领先水平,并且在多个第三方基准测试中超越了DeepSeek的V3(非推理模型)和OpenAI的GPT-4.5。此外,ERNIE 4.5和ERNIE X1在成本上也颇具竞争力,分别比DeepSeek的R1推理模型低50%,比OpenAI的GPT-4.5低99%。
然而,这两款模型目前尚未开源,这是与DeepSeek R1相比的一个显著局限。尽管如此,百度已经通过其应用程序编程接口(API)和中文聊天机器人“ERNIE Bot”提供了模型访问权限。ERNIE Bot不仅能够回答问题、生成文本和创意写作,还能与用户进行对话式互动,并且目前免费开放使用。
ERNIE 4.5作为百度最新的基础模型,被设计为原生的多模态系统,能够处理和理解文本、图像、音频和视频。该模型在理解、生成、推理和记忆等方面进行了优化,并引入了FlashMask动态注意力掩码、异构多模态混合专家和自我反馈增强的后训练等关键技术。据百度介绍,ERNIE 4.5在多个基准测试中超越了GPT-4.5,同时保持了更低的成本。
ERNIE X1则是一款具备深度思考推理能力的模型,强调理解、规划、反思和进化。与标准的多模态AI模型不同,ERNIE X1专门设计用于复杂推理和工具使用,能够执行高级搜索、基于文档的问答、AI生成的图像解释、代码执行和网页分析等任务。该模型支持包括百度学术搜索、商业信息搜索和特许经营研究工具在内的多种工具。
对于企业和开发者而言,ERNIE 4.5现已通过百度AI云的千帆平台提供API访问,而ERNIE X1也即将上线。这两款模型的定价也颇具吸引力,ERNIE 4.5的输入和输出费用分别为每百万标记0.55美元和2.2美元,ERNIE X1则分别为每百万标记0.28美元和1.1美元,相比之下,GPT-4.5的输入和输出费用分别为每百万标记75美元和150美元,DeepSeek R1则为每百万标记0.55美元和2.19美元。
百度还计划将ERNIE 4.5和ERNIE X1集成到其更广泛的生态系统中,包括百度搜索和文心一言应用。对于企业决策者而言,这两款模型的推出既带来了机遇也提出了挑战。在性能与成本之间取得平衡、利用多模态和推理能力、集成工具以及考虑生态系统和本地化等因素都是值得深思的问题。
此外,尽管百度已宣布计划在今年6月30日将ERNIE 4.5系列模型开源,但在此之前,企业用户仍需审慎评估数据隐私、合规性和模型使用政策等方面的问题。
原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/bai-du-fa-bu-xin-xing-llm-ernie-4-5-yu-ernie-x1-cheng-ben