4800个大模型团队竞逐「产业真题」，这场金融科技大赛火出圈了

点点 • 2024年9月7日上午10:00 • AI前沿 • 104 views

今年 7 月，一份《全球数字经济白皮书 (2024)》统计显示，全球目前已有 1300 多个基础大模型，美国的数量最多，中国紧随其后排在第二。

这一数字对比说明，在大模型这张「牌桌」上，中美是最具实力的两个玩家。曾经，中国奋力追赶「OpenAI 们」，两年之后我们可以看到，国产大模型在技术层面已抵达全球第一梯队。

而在这个过程中，圈内玩家逐渐分化出两条路线：一派继续卷性能，一派专注搞应用。

国内的优势恰恰在于产业场景极其丰富，落地空间极其广阔。面向大模型的下半场战事，业界普遍认为，中国将在应用层展现出更强的后劲。

目前的核心问题是，如何让大模型技术尽快与更多真实的产业场景连接起来。

从何处入手？一是精准定位最需要大模型的产业场景，二是找到能解决这些真实场景问题的人才。

一场直面「产业真命题」的技术赛事

我们熟悉的大模型落地案例更多发生在对话、作画、视频等方向，但其价值远不止于此，大模型同样可以深刻改变城市发展、金融科技、生物医药、工业制造、科学研究等领域。

已连续举办两届的 AFAC 金融智能创新大赛，正在成为国内大模型人才竞逐金融产业真命题的赛场。

AFAC2024 金融智能创新大赛(以下简称 AFAC2024 大赛）以金融行业内真实案例及海量真实数据为牵引，鼓励参赛者直面金融产业真命题，探索最具挑战的创新模型和算法。在去年赛制的基础上，AFAC2024 大赛对比赛形式进一步升级，在「挑战组」之外新增了「初创组」和「企业组」，形成了涵盖算法赛、应用赛和创业赛的综合赛制架构。

蚂蚁集团副总裁、蚂蚁金融技术委员会主席王晓航表示，举办 AFAC2024 大赛的出发点之一就是集聚、培养优秀科技人才、开展高水平合作交流。

同时，大赛设立了丰厚的奖金池，并为选手提供了配套的技术支持，吸引了数千个极具潜力的大模型团队参与。值得注意的是，选手们可以基于蚂蚁开源的 agentUniverse 多智能体框架，对多智能体协作模型进行开发定制，轻松构建智能体应用，节省更多精力以专注于破解产业命题。

3 个月，4882 支队伍的技术探索，让这场比赛「卷」出了新的高度。中国最顶尖的一批大模型人才围绕金融场景下的众多产业真题，贡献了众多前沿解决方案。

「我们始终相信通过科技的力量可以带来更多微小而美好的变化，我们期待 AI 能让高质量的金融服务惠及每一个人，让更好的金融产品进入千家万户，成为人们生活中的一部分。」王晓航表示，「人工智能技术的作用和价值不应仅限于研究和模型能力，更应产生更大的应用价值，就像扫码支付一样能够进入千家万户，进入每一个行业。」

接下来，让我们来看看三个代表团队的技术创新故事。

什么样的金融研报生成应用，能从六百多支队伍脱颖而出？

「拥抱 AIGC」团队的三位成员有很多共同点：都就读于浙江大学软件工程专业，都是硕士二年级的研究生，甚至住在同一个寝室。除了研究方向不太相同：三人分别选择了计算机视觉、数据治理与大语言模型、时空数据作为主攻方向。

队长高天弘曾参加过首届 AFAC 大赛，关注到 AFAC2024 大赛启动之后，他决定拉上室友再挑战，尽管「金融智能」对于三人来说是有些陌生的领域。

一番深思熟虑之后，他们选择了「AIGC 金融多模态研究报告智能生成」这个赛题。团队需要将大模型技术和金融数据深度融合，提出有创新价值的金融研报生成智能体解决方案，并应用于实际场景。

大模型的通用能力在不断进化，但要想解决高水平问题，还要靠行业知识的进一步积累。纵观当前的各类对话式 AI 应用，生成真实、有用、高水平的研究报告仍然是一项极具挑战性的任务。特别是对于金融这种专业门槛极高的领域，数据时效性、长文本总结、图表生成等都是其中存在的挑战。

如何有效攻克？特别是在赛题发布后，留给团队完成方案设计的时间并不算多。

针对上述问题，他们设计了一个面向金融研报生成的多智能体协同框架。具体来说，这个框架包含三层：多元数据来源、金融研报生成智能体 Agent、多源大语言模型。

与传统的对话系统不同，协同的智能体具备任务规划和执行能力，能够在无需人类干预的情况下自动处理复杂问题，包括生成研报：

其中，团队以 FinGPT-Forecaster 为基础，结合 LoRA 微调，训练了一个用于投资评级分析的股价预测大模型，克服了 ChatGPT 预测含糊和数据隐私问题，提供了可解释的预测结果。

为了更高效地筛选金融数据，同时保证实时性和专业性，团队设计了一套多源检索增强方案。在检索获得行情、研报、股价等信息之后，首先针对走势图、PDF 研报等多模态数据进行预处理，突破单模态分析的局限性，使市场波动更直观呈现。然后从相关性、市场敏感性、可靠性、时效性多个维度出发，使用基于 LLM 的重排器进行排序优化。在这个过程中，作为赛事主办方之一，蚂蚁集团提供了新闻信息助手 API ，保证了数据收集的实时性，也大大减少了数据处理的工作量。

最终，这一方案在同赛道的六百多支队伍中脱颖而出，夺得冠军。获奖之外，三位成员通过这次比赛也学会了如何理解现实中的产业需求，又如何面向真实产业场景制定具备可行性的方案。

他们更加深刻地体会到大模型与传统 AI 研究的巨大差异。此前的 AI 模型基本面向具体任务而设计，仅用少量数据训练就可达到目标性能。相比之下，从底层训练的角度说，大模型对数据、算力的要求已经实现了指数级增长，对训练大模型的人的创新能力要求显然也更上一层楼。

用大模型打造「一对一」旅行智能助理

在「初创组」的赛场上，「智游幻境 Odyssey Agent」团队的成果让评委们印象十分深刻。

这个团队由五位热爱旅行的年轻人组成。众所周知，旅行的回忆是美好的，但旅行前的规划是千头万绪的。出行的人常常花费大量时间辗转于各个平台之间，获取信息、制定行程、预定服务，如果涉及出境游难度更甚。

以 Gemini、ChatGPT 为代表的对话式 AI 应用，也具备提供旅行信息推荐的能力，但往往只有「第一次可用」。很多时候，如果我们继续追问，后续对话可能很难与前面所谈行程保持一致。而且这些基本只能集成单个平台的信息，无法做到有效整合旅行过程中全部所需信息。

能不能做一款提供一站式定制旅行服务的大模型应用呢？五个人一拍即合，决定打造一个「旅行规划智能助理」。尽管团队中有几位成员在大厂的工作非常忙碌，但他们还是利用业余时间快速打造出了这个项目的雏形。

具体来说，他们参考 agentUniverse 多智能体框架的交互模型设计思路，针对旅行场景搭建了一套多 Agent 协作体系：「CHaTS」（Consult，Hotel and Transportation，Spots）。

生成一个七日行程平均要调用大语言模型 50 余次，能在 3 到 5 分钟内返回一个城市的旅行规划和游记 Vlog。对于用户来说，最大的体验提升就是推荐的攻略细节真的更丰富了。

由于涉及到多个大语言模型生成机制，为了避免前后行程矛盾、关键信息的遗忘以及 token 长度和整体成本问题，团队引入了共享记忆和 tool memory 机制。具体来说，他们将相关工具的执行结果（比如机票 / 酒店查询结果、每日景点推荐），在简单地预处理后进行本地存储，或者通过 Qwen 模型的 File 编码的形式存储在云端，降低了频繁调用工具造成的时间和经济成本，也避免了模型在重新推荐时产生幻觉或者矛盾冲突。

尽管目前的「智游幻境」还处于早期版本，却恰好展示了大模型在旅行类应用赛道的想象空间。团队表示，未来的「智游幻境」可以引入更强的大模型、更多的模态、更丰富的场景。比如通过 VR/AR 设备、无线耳机、摄像头等设备的联动，这款应用可以变为一个能看、能听、能说的「导游」，带来更沉浸的旅行体验。

从观光推荐到实时翻译服务，这样一款应用真的有可能彻底改变旅行者与世界互动的方式。

让大模型融入科技金融业务的「系统工程」

相比于挑战组和初创组，大赛的「企业组」赛道主要着眼于科技金融行业的新兴方向，鼓励科技金融行业的中小型企业提报有亮点、有新意的新技术、新产品落地项目。

深擎科技是一家成立六年的公司，多年来利用 AI 与大数据分析技术，为券商银行提供智能投顾助手和个性化内容生成相关产品，也见证了大模型技术的兴起和爆发。

在数十家参赛企业中，深擎科技提交的方案受到了较多的关注。简单来说，他们围绕 AI Agent 的基座，打造了一整套行业「刚需」的应用产品体系。

对于那些想用大模型变革自身业务的金融机构来说，在实践中往往会遇到一些挑战：如何快速响应业务需求，让业务参与到大模型应用场景的打磨中来？投入的大量配套研发，如何沉淀，算子化、可复用的最佳实践？如何量化评价场景效果，上线后如何持续优化迭代？

核心的问题就是，技术的快速迭代与金融业务所需的确定性之间，如何平衡？

深擎科技给出的解决方案是 AI Agent 平台「乾坤圈」，将大模型能力融入到金融业务的「系统工程」之中。

在不同基础模型各有所长的今天，「乾坤圈」的一大亮点是支持多个基座大模型协作完成业务交付，且支持本地化、SaaS 大模型服务接入，兼容主流的开源和闭源模型。

此外，「乾坤圈」还提供了敏捷的 AI 场景构建模板和工具，让机构以低代码甚至无代码的方式迅速构建业务场景应用，解决了大模型落地中容易产生的「重复造轮子」问题。

基于「乾坤圈」，以往业界存在的金融领域大模型幻觉控制、业务数据和知识接入、生成结果合规安全性、产研运营端到端效率和生成结果质量评测问题，都得到了有效解决。

实际上，「乾坤圈」平台的技术探索也代表了当前大模型落地的整体趋势，对于很多专业门槛较高的领域来说，只有面向真实的产业场景设计垂直解决方案，才能实现以技术解决真问题的初衷。

目前，深擎科技的产品已经实现 PMF（Product Market Fit），覆盖了 80% 的大中型券商和 50% 的大型银行，近几年的主营收入年复合增长率超过 80%。

接下来的阶段，大模型技术与金融业务场景的结合也会越来越紧密，深擎团队希望持续完善「乾坤圈」，在大模型和金融行业的交叉领域做更多从 0 到 1 的创新，为金融机构实现「数字化、集约化、精细化」客户经营提供动力。

期待大赛能诞生出中国的「OpenAI」

在有关大模型的讨论中，「人才」始终被认为是非常关键的竞争要素。

以 AFAC2024 大赛为代表的技术赛事之所以备受瞩目和火爆出圈，因为它既能提供一方培养 AI 人才的土壤，也切实给到了这些高潜力 AI 人才需要的扶持资源。

比如，对于「拥抱 AIGC」团队来说，这是一次走出校园、直面产业真题的宝贵机会；对于「智游幻境」团队，这是一次走上广阔舞台、验证自身设想的契机；对于「深擎科技」团队，这是一次与业内最顶级同行比拼、促进自我提升的精彩旅程。

纵览 AFAC2024 大赛的 4800 多支队伍，「年轻化」和「多元化」也是本次参赛群体的一大特质。但这些年轻的队伍却做到了对前沿技术的极致追求，以长远的眼光去看，未来中国的「山姆奥特曼」和「OpenAI」，很可能就诞生在这些充满技术热情的队伍中。

AFAC 组委会相关人士表示，希望大赛里涌现的出来各种优秀人才，能成为国内大模型领域的中坚力量，最终造福于整个行业的发展和创新。

原创文章，作者：点点，如若转载，请注明出处：https://www.dian8dian.com/4800-ge-da-mo-xing-tuan-dui-jing-zhu-chan-ye-zhen-ti-zhe

Like (0)

点点

0 0

离开OpenAI后，Ilya拿了10亿美金对抗AI作恶

Previous 2024年9月7日上午9:00

海外客户突破一万家，国际业务成腾讯云新增长点

Next 2024年9月7日上午11:00

AI前沿

OpenAI推出全新语音AI模型：gpt-4o-transcribe，让你的文本应用秒变语音交互神器

OpenAI，这家因ChatGPT而广为人知的AI公司，近日再次在语音AI领域迈出重要一步。公司宣布推出三款全新的语音模型——gpt-4o-transcribe、gpt-4o-mi…

王浩然
2025年3月24日
000
AI前沿

Anthropic 推出全新 Claude AI 模型和“计算机控制”

Anthropic宣布升级其 AI 产品组合，包括增强型 Claude 3.5 Sonnet 模型和推出 Claude 3.5 Haiku，同时在公开测试版中推出“计算机控制”功能…

点点
2024年10月24日
000
AI前沿

随着“AlphaChip”的兴起，谷歌和 Meta 更新了他们的人工智能模型

于 OpenAI 的影响，本周人工智能新闻异常繁忙，包括首席执行官 Sam Altman 发表的一篇有争议的博客文章、高级语音模式的广泛推出、5GW数据中心的传闻、重大员工变动以及…

点点
2024年9月30日
000
AI前沿

什么阻碍了数字孪生的演进和应用？

数字孪生技术具有巨大的潜力，它能够创建物理对象、流程和环境的数字复制品，可应用于各个行业，从复制危险环境到展示用于远程培训的航天器。麦肯锡最近的分析表明，人们对数字孪生的兴趣非常浓…

点点
2024年10月24日
000
AI前沿

Chain of Experts（COE）：低成本高效能的大型语言模型框架

引言在人工智能（AI）领域，大型语言模型（LLM）的应用日益广泛，但高昂的成本和复杂的部署流程一直是阻碍其普及的关键因素。近日，一种名为Chain of Experts（COE）…

王浩然
2025年3月19日
000
AI前沿

谷歌开始在乌拉圭建设价值 8.5 亿美元的数据中心

新设施旨在提高人工智能能力、支持经济增长和实现可持续发展

点点
2024年9月5日
000
AI前沿

Snowflake 与 Anthropic 合作扩展 AI 工具——这对企业意味着什么

Snowflake和Anthropic宣布达成重要合作伙伴关系，将人工智能代理直接嵌入企业数据环境，使企业能够分析大量信息，同时保持严格的安全控制。两家公司将把 Anthropi…

王浩然
2025年2月17日
000
AI前沿

ChatGPT 登陆 Windows

ChatGPT 现已在 Windows 上推出。今天，OpenAI宣布已开始预览其 AI 聊天机器人平台ChatGPT的专用 Windows 应用程序。 OpenAI 表示，该应…

点点
2024年10月18日
000
AI前沿

马克·贝尼奥夫警告称，人工智能虽然有用，但被夸大了，并将部分责任归咎于微软

科技行业最热衷炒作的人之一、Salesforce 首席执行官马克·贝尼奥夫 (Marc Benioff) 想让你知道，他对生成式人工智能充满期待，但即便如此，他也不认为它能做到其最…

点点
2024年10月18日
000
AI前沿

地缘政治和人工智能将在 2025 年影响芯片行业 | KPMG

人工智能技术让半导体领导者对2025年更加乐观，但阻力可能来自地缘政治和人才保留问题。这些是美国审计、税务和咨询公司毕马威 ( KPMG)和全球半导体联盟 (GSA) 发布的第 …

王浩然
2024年12月19日
000
AI前沿

OpenAI获英伟达B200最强超算，GPT-5训练无底洞，微软算力却严重不足

就在刚刚，OpenAI收到了来自英伟达的首批工程版DGX B200！此情此景，不得不让人联想到，刚刚成立的OpenAI在接收英伟达初代DGX时的画面。如今，早已物是人非。依然…

点点
2024年10月9日
000
AI前沿

非营利组织加入伊隆·马斯克的行列，阻止 OpenAI 向营利性转型

Encode 是一家非营利组织，也是加利福尼亚州命运多舛的 SB 1047人工智能安全法案的共同发起人，该组织已请求允许提交一份法庭之友陈述，以支持埃隆·马斯克的禁令，阻止 Ope…

王浩然
2024年12月29日
000
AI前沿

OpenAI 研究人员开发新模型，将媒体生成速度提高 50 倍

OpenAI 的两位研究人员发表了一篇论文，描述了一种新型模型——具体来说是一种新型的连续时间一致性模型 (sCM)——与传统扩散模型相比，该模型将人工智能生成图像、视频和音频等多…

王浩然
2024年10月25日
000
AI前沿

人工智能的最大障碍？数据可靠性。天文学家的新平台应对挑战

Astronomer是 Apache Airflow 编排软件背后的公司，现已推出Astro Observe，标志着其从一家单一产品公司扩展到竞争激烈的数据运营平台市场。此举正值企…

王浩然
2025年2月14日
000
AI前沿

亚马逊利用 Anthropic 的人工智能来改造 Alexa

亚马逊将通过与人工智能公司Anthropic建立战略合作伙伴关系来升级其 Alexa 语音助手。据路透社首次报道，亚马逊计划推出代号为“Remarkable”的新版 Alexa，它…

AI News
2024年9月1日
000
AI前沿

个人AI的崛起：通过自动化颠覆客户体验

引言随着人工智能（AI）技术的飞速发展，特别是大型语言模型（LLMs）与计算能力的显著提升，我们正见证着AI在日常生活和商业领域中的广泛应用。个人AI，作为这一浪潮中的佼佼者，正…

王浩然
2025年3月15日
000
AI前沿

为什么 2025 年将成为 AI 编排之年

在科技界，我们喜欢将某个时期称为（此处插入里程碑）之年。过去的一年（2024 年）是人工智能和代理用例进行更广泛实验的一年。 2025 年即将到来，采访了行业分析师和 …

王浩然
2024年12月31日
000
AI前沿

Meta 的 Movie Gen AI 视频生成器能够制作真正的电影，包括音乐

Meta 的 AI 之旅将不可避免地将其带入新兴的 AI 视频领域。现在，马克·扎克伯格领导的这家公司推出了 Movie Gen，这是另一款能够通过简短的文本提示制作出逼真视频的视…

王浩然
2024年10月10日
000
AI前沿

Cassette Group 首席执行官兼联合创始人 Ben Taylor – 访谈系列

Ben Taylor是Cassette Group的联合创始人兼首席执行官，该集团是一家沉浸式技术公司，专门为企业提供培训、教育和通信解决方案。该公司利用 3D 实时技术通过动画…

点点
2024年9月28日
000
AI前沿

Gemini Extensions 将帮助谷歌的人工智能接管你的 Android 手机

谷歌承诺其 Gemini AI 不会成为 Google Assistant 的简单聊天机器人替代品。未来几周，我们将看到这一承诺是否能实现。Gemini 扩展将允许 AI 访问更…

王浩然
2024年10月6日
000