蚂蚁创业21年，下一个十年做什么？

蚂蚁创业21年，下一个十年做什么？

2025-08-09 13:02

燃油车变速箱配不上新能源车，打通AI服务“最后一公里”

作者／ IT时报记者孙妍

编辑／ 孙妍

多年前，《IT时报》就曾评论：“错过了BAT的上海，这次没错过‘新BAT’——哔哩哔哩（bilibili）、蚂蚁集团（Ant Group）和商汤（Sense Time）。”

上海向来都是务实派，战略说到做到的强力执行派。这些年，上海逐渐走出了自己的科技之路，归纳为一大基础、两大中心和两大核心。智云上海、5G等新基建是一大基础，科创中心和国际金融中心是其两大中心，与两大中心对应的核心赛道是AI和金融科技。

而AI和金融科技，正是蚂蚁集团既定的赛道。

AI理财助理“蚂小财”连通200多家金融机构，不仅能帮用户“盯盘”，还能深度“诊基”；在上亿人的手机里，都有一位健康管家AQ，“最近为什么提不起精神？”“每天喝奶茶患糖尿病的概率会增加多少？”有什么健康疑虑都可以问它，去医院不了解挂什么科也可以问它；看一下就能支付，Rokid、小米、雷鸟等终端都推出了可支付的AI智能眼镜，以后支付都不用掏手机了；在沪上阿姨上万家门店里，数字码力“AI督导员”正在巡店，助力规范设备卫生、原料有效期、物料摆放、茶饮制作等流程，比以往的人海战术提效15倍……

蚂蚁创业已经21年，第一个十年，参与了移动支付的进程，让二维码支付深入老百姓的日常生活。第二个十年，参与了中国数字普惠金融的实践，让普通用户和千万小微商家平等享受到金融服务。面向下一个十年，蚂蚁确立了支付宝双飞轮、AI first、加速全球化的战略，既要探索AI的智能上限，也要守住科技的下限。

打通AI服务“最后一公里”

AI时代的支付应该是什么样？移动支付在移动互联网时代迅猛发展，全世界都惊讶于中国的移动支付便捷程度。

“今天在AI时代，数字支付仍然是支付的基础，但是它并不完全适用于AI时代，就像传统油车的变速箱不能适配新能源车一样。”蚂蚁集团CEO韩歆毅在WAIC 2025上说道，蚂蚁希望打通AI时代支付的“最后一公里”。

今年5月份发布了国内首个支付，探索智能体间的自然语言调用支付这一变革趋势。

从数字化到通证化的趋势，正在推动跨境支付结算进入秒级时代，7×24小时不间断运转，成本大幅降低。蚂蚁集团旗下全球跨境支付解决方案Alipay+让全球游客一个钱包走遍天下；万里汇（WorldFirst）首批参与浦东丝路电商先行试验区，助力中小微企业贸易出海。

蚂蚁不再局限于支付，分享了对AI应用的几点思考。AI驱动的智能化服务是专业的、个性的和自动化的，AI时代的应用不仅局限在数字世界，也应与物理世界实现数实协同。“我们正在聚焦AI应用，努力让智能上限的突破，惠及老百姓的生活日常。围绕生活服务、金融服务和医疗健康服务三个垂直领域，蚂蚁正在打造人人可用的生活管家、金融管家和医疗健康管家。”韩歆毅说。同时，蚂蚁正在探索AI从数字世界到物理世界的跃迁，比如在浦东张江落户的蚂蚁灵波科技，探索领域和服务机器人的研发与应用。

“人工智能的发展还面临着多重挑战，而多技术融合创新，将提升人工智能的下限。”韩歆毅说。蚂蚁在AI研发之外，也在全面推进包括核身、安全、数据要素等底层技术，支撑未来人工智能大规模应用时代的到来。过去三年来，蚂蚁集团每年的研发投入超过营收的10%，2024年投入的234.5亿元更是创下历史新高。

大模型成为

金融竞争力的关键要素

金融科技是上海的核心赛道，也是蚂蚁的核心业务。金融行业的技术能力，可以说是各行各业中的珠穆朗玛峰。要与金融行业携手进入AI时代，自身的技术能力必然要过硬，否则连金融客户的要求都听不懂。大模型深入金融行业实际业务场景，往往需要高度专业的金融知识、复杂的业务逻辑推理能力以及严格的金融安全合规要求。

“通用大模型距离产业实际应用存在知识鸿沟。构建专业的金融大模型是推进金融与AI深度融合的必然路径，未来，金融大模型的应用深度将成为金融机构竞争力的关键要素。”蚂蚁数科CEO赵闻飙在WAIC 2025演讲中表示。

7月28日，蚂蚁集团旗下独立科技子公司蚂蚁数科发布金融推理大模型Agentar-Fin-R1，为金融AI应用打造“可靠、可控、可优化”的智能中枢。Agentar-Fin-R1基于Qwen3研发，在FinEval1.0、FinanceIQ等权威金融大模型评测基准上超越Deepseek-R1等同尺寸开源通用大模型以及金融大模型，其三大优势正是金融专业性、推理能力与安全合规能力。

要让模型“天生懂金融，出厂即专家”，必须“投喂”大量的高质量数据。基于蚂蚁集团多年在金融科技领域的积累，蚂蚁数科构建了千亿级金融专业数据语料库，包括6大类、66小类场景，覆盖银行、证券、保险、基金、信托等金融全场景。此外，模型还能吸收最新的金融政策、市场动态等关键信息。

在可信数据合成技术与专家标注的金融思维链构造机制的主导下，使用加权训练算法，大模型得以显著减少二次微调的数据需求与算力消耗，降低大模型在企业落地的门槛与成本。

为了考查大模型在实际金融场景中部署的能力，蚂蚁数科还联合中国工商银行、宁波银行、北京前沿金融监管科技研究院、上海人工智能行业协会等机构推出Finova大模型金融应用评测基准，深度考查智能体能力、复杂推理能力以及安全合规能力。在Finova评测中，Agentar-Fin-R1取得最高评分，甚至超越更大参数规模的通用模型。目前Finova已经全面开源，推动行业共同提升大模型在金融领域的应用水平。

近年来，蚂蚁数科一直在前沿技术上探索，从Web3到AI，从金融到新能源行业，此前曾推出金融智能体平台Agentar，成为首批通过信通院评测的智能体平台产品，并获最高评级5级。蚂蚁数科还联合行业合作伙伴，推出超百个金融智能体解决方案，加速大模型在金融业规模化应用。

蚂蚁数科助力上海某银行打造了AI手机银行，创新“对话即服务”模式，用户通过自然对话即可获取各类金融服务，推动银行老年客户满意度显著提升，月活用户同比增长25%。目前，蚂蚁数科累计已服务100%的国有银行和股份制银行、超60%的地方性商业银行、数百家金融机构。

没有十全十美的大模型

没有十全十美的大模型，就像没有不犯错的人一样，幻觉是智力的必然代价。

大模型的专业化应用，首要问题是可靠性。尽管当前SOTA（最先进、性能最优的模型）已经达到80%到90%的水平，但其可靠性距离医疗、工业、金融等专业场景的要求仍有显著差距。浙江大学教授、区块链与数据安全全国重点实验室主任陈纯在WAIC 2025上表示，有人将这一问题简单归结为“幻觉”，但我想强调：幻觉是智力的必然代价。若消除所有幻觉，大模型将退化为机械的检索工具。因此，可靠性的突破不在于消灭“智力特征”，而在于构建工程化保障框架。

如何突破大模型在专业化应用中的可靠性困境？蚂蚁集团副总裁、蚂蚁密算董事长韦韬认为，技术上不应当只依赖于大模型“十全十美”不犯错，而是通过智能体系和工程体系的结合，实现专业应用可靠性的保障。正如每个人作为个体，是容易犯错、容易有幻觉的，但人类几千年以来不断在工程体系上的进步，能够在易错的个体之上构建庞大而可靠的工程体系，完成诸如登月、探访火星等巨型任务。他提出，通过全新的程序表达、场景知识嵌入和闭环核验反馈机制，可以将大模型中不确定的智力输出转化为可信的专业生产力。

对此，蚂蚁密算正在探索高阶程序（High-Order Program）大模型可信应用技术框架，核心组件包括业务逻辑的程序化表达、场景知识图谱和受控工具链，在全流程中贯穿核验机制，对关键执行结果进行及时、有效的核验和处理。该框架借鉴了人类在工程管理体系中的成功经验，如通过标准作业程序（SOP）和检查清单等机制，构建一个能够有效复用、验证、扩展和派生的机制，使大模型在应用过程中即使出现幻觉问题，也能保证大模型达到专业领域所需的精确性和可靠性。

目前，高阶程序技术框架已经在金融风控全链路、网络入侵检测、医疗重复计费等多行业场景中初步应用。在传统金融风控体系下，从数据探查、处理到模型构建与调优的全链路操作，高度依赖人工干预，导致流程冗长、响应缓慢，并且容易受人员主观因素影响，制约了金融风控联合建模的效率与一致性。在应用HOP技术框架后，将复杂的SOP转化为可执行的流程和代码，实现风控全链路的智能化编排与自动化执行。相较于传统建模人员手动进行数据分析和代码开发，大模型结合HOP不但能降低处理成本，还能缓解专业人才紧缺的局面。

韦韬表示，“大模型可靠性的关键，不在于大模型本身，而在于工程化和智能化的融合。解决了可靠性问题，大模型即将涌现新的Killer App（杀手级应用）。我们开源高阶程序HOP，希望与行业一起把大模型从人类助手正在变成规模化专业生产力。”

排版／季嘉颖

图片／蚂蚁集团

来源／《IT时报》公众号vittimes

E N D

公示

根据中国记协《关于2025年向资深新闻工作者颁发荣誉证书和证章的通知》要求，《IT时报》拟申报资深新闻工作者荣誉证书证章的人员名单：赖真。

赖真同志工作经历：1994年8月-2024年12月，《IT时报》社(原《上海邮电报》社)从事新闻采编等相关工作，历任《上海邮电报》记者、编辑、编辑部副主任；《IT时报》编辑部副主任、编辑部主任；IT时报/上海电信报副总编、总编。

《IT时报》申报总人数：1人。

公示时间：2025年8月1日-2025年8月7日（5个工作日）。

《IT时报》监督举报电话：021-63632331。