
燃油车变速箱配不上新能源车,打通AI服务“最后一公里”
作者/ IT时报记者 孙妍
编辑/ 孙妍
多年前,《IT时报》就曾评论:“错过了BAT的上海,这次没错过‘新BAT’——哔哩哔哩(bilibili)、蚂蚁集团(Ant Group)和商汤(Sense Time)。”
上海向来都是务实派,战略说到做到的强力执行派。这些年,上海逐渐走出了自己的科技之路,归纳为一大基础、两大中心和两大核心。智云上海、5G等新基建是一大基础,科创中心和国际金融中心是其两大中心,与两大中心对应的核心赛道是AI和金融科技。
而AI和金融科技,正是蚂蚁集团既定的赛道。
AI理财助理“蚂小财”连通200多家金融机构,不仅能帮用户“盯盘”,还能深度“诊基”;在上亿人的手机里,都有一位健康管家AQ,“最近为什么提不起精神?”“每天喝奶茶患糖尿病的概率会增加多少?”有什么健康疑虑都可以问它,去医院不了解挂什么科也可以问它;看一下就能支付,Rokid、小米、雷鸟等终端都推出了可支付的AI智能眼镜,以后支付都不用掏手机了;在沪上阿姨上万家门店里,数字码力“AI督导员”正在巡店,助力规范设备卫生、原料有效期、物料摆放、茶饮制作等流程,比以往的人海战术提效15倍……
蚂蚁创业已经21年,第一个十年,参与了移动支付的进程,让二维码支付深入老百姓的日常生活。第二个十年,参与了中国数字普惠金融的实践,让普通用户和千万小微商家平等享受到金融服务。面向下一个十年,蚂蚁确立了支付宝双飞轮、AI first、加速全球化的战略,既要探索AI的智能上限,也要守住科技的下限。
打通AI服务“最后一公里”
AI时代的支付应该是什么样?移动支付在移动互联网时代迅猛发展,全世界都惊讶于中国的移动支付便捷程度。
“今天在AI时代,数字支付仍然是支付的基础,但是它并不完全适用于AI时代,就像传统油车的变速箱不能适配新能源车一样。”蚂蚁集团CEO韩歆毅在WAIC 2025上说道,蚂蚁希望打通AI时代支付的“最后一公里”。
今年5月份发布了国内首个支付,探索智能体间的自然语言调用支付这一变革趋势。
从数字化到通证化的趋势,正在推动跨境支付结算进入秒级时代,7×24小时不间断运转,成本大幅降低。蚂蚁集团旗下全球跨境支付解决方案Alipay+让全球游客一个钱包走遍天下;万里汇(WorldFirst)首批参与浦东丝路电商先行试验区,助力中小微企业贸易出海。
蚂蚁不再局限于支付,分享了对AI应用的几点思考。AI驱动的智能化服务是专业的、个性的和自动化的,AI时代的应用不仅局限在数字世界,也应与物理世界实现数实协同。“我们正在聚焦AI应用,努力让智能上限的突破,惠及老百姓的生活日常。围绕生活服务、金融服务和医疗健康服务三个垂直领域,蚂蚁正在打造人人可用的生活管家、金融管家和医疗健康管家。”韩歆毅说。同时,蚂蚁正在探索AI从数字世界到物理世界的跃迁,比如在浦东张江落户的蚂蚁灵波科技,探索领域和服务机器人的研发与应用。
“人工智能的发展还面临着多重挑战,而多技术融合创新,将提升人工智能的下限。”韩歆毅说。蚂蚁在AI研发之外,也在全面推进包括核身、安全、数据要素等底层技术,支撑未来人工智能大规模应用时代的到来。过去三年来,蚂蚁集团每年的研发投入超过营收的10%,2024年投入的234.5亿元更是创下历史新高。
大模型成为
金融竞争力的关键要素
金融科技是上海的核心赛道,也是蚂蚁的核心业务。金融行业的技术能力,可以说是各行各业中的珠穆朗玛峰。要与金融行业携手进入AI时代,自身的技术能力必然要过硬,否则连金融客户的要求都听不懂。大模型深入金融行业实际业务场景,往往需要高度专业的金融知识、复杂的业务逻辑推理能力以及严格的金融安全合规要求。
“通用大模型距离产业实际应用存在知识鸿沟。构建专业的金融大模型是推进金融与AI深度融合的必然路径,未来,金融大模型的应用深度将成为金融机构竞争力的关键要素。”蚂蚁数科CEO赵闻飙在WAIC 2025演讲中表示。
7月28日,蚂蚁集团旗下独立科技子公司蚂蚁数科发布金融推理大模型Agentar-Fin-R1,为金融AI应用打造“可靠、可控、可优化”的智能中枢。Agentar-Fin-R1基于Qwen3研发,在FinEval1.0、FinanceIQ等权威金融大模型评测基准上超越Deepseek-R1等同尺寸开源通用大模型以及金融大模型,其三大优势正是金融专业性、推理能力与安全合规能力。
要让模型“天生懂金融,出厂即专家”,必须“投喂”大量的高质量数据。基于蚂蚁集团多年在金融科技领域的积累,蚂蚁数科构建了千亿级金融专业数据语料库,包括6大类、66小类场景,覆盖银行、证券、保险、基金、信托等金融全场景。此外,模型还能吸收最新的金融政策、市场动态等关键信息。
在可信数据合成技术与专家标注的金融思维链构造机制的主导下,使用加权训练算法,大模型得以显著减少二次微调的数据需求与算力消耗,降低大模型在企业落地的门槛与成本。
为了考查大模型在实际金融场景中部署的能力,蚂蚁数科还联合中国工商银行、宁波银行、北京前沿金融监管科技研究院、上海人工智能行业协会等机构推出Finova大模型金融应用评测基准,深度考查智能体能力、复杂推理能力以及安全合规能力。在Finova评测中,Agentar-Fin-R1取得最高评分,甚至超越更大参数规模的通用模型。目前Finova已经全面开源,推动行业共同提升大模型在金融领域的应用水平。
近年来,蚂蚁数科一直在前沿技术上探索,从Web3到AI,从金融到新能源行业,此前曾推出金融智能体平台Agentar,成为首批通过信通院评测的智能体平台产品,并获最高评级5级。蚂蚁数科还联合行业合作伙伴,推出超百个金融智能体解决方案,加速大模型在金融业规模化应用。
蚂蚁数科助力上海某银行打造了AI手机银行,创新“对话即服务”模式,用户通过自然对话即可获取各类金融服务,推动银行老年客户满意度显著提升,月活用户同比增长25%。目前,蚂蚁数科累计已服务100%的国有银行和股份制银行、超60%的地方性商业银行、数百家金融机构。
没有十全十美的大模型
没有十全十美的大模型,就像没有不犯错的人一样,幻觉是智力的必然代价。
大模型的专业化应用,首要问题是可靠性。尽管当前SOTA(最先进、性能最优的模型)已经达到80%到90%的水平,但其可靠性距离医疗、工业、金融等专业场景的要求仍有显著差距。浙江大学教授、区块链与数据安全全国重点实验室主任陈纯在WAIC 2025上表示,有人将这一问题简单归结为“幻觉”,但我想强调:幻觉是智力的必然代价。若消除所有幻觉,大模型将退化为机械的检索工具。因此,可靠性的突破不在于消灭“智力特征”,而在于构建工程化保障框架。
如何突破大模型在专业化应用中的可靠性困境?蚂蚁集团副总裁、蚂蚁密算董事长韦韬认为,技术上不应当只依赖于大模型“十全十美”不犯错,而是通过智能体系和工程体系的结合,实现专业应用可靠性的保障。正如每个人作为个体,是容易犯错、容易有幻觉的,但人类几千年以来不断在工程体系上的进步,能够在易错的个体之上构建庞大而可靠的工程体系,完成诸如登月、探访火星等巨型任务。他提出,通过全新的程序表达、场景知识嵌入和闭环核验反馈机制,可以将大模型中不确定的智力输出转化为可信的专业生产力。
对此,蚂蚁密算正在探索高阶程序(High-Order Program)大模型可信应用技术框架,核心组件包括业务逻辑的程序化表达、场景知识图谱和受控工具链,在全流程中贯穿核验机制,对关键执行结果进行及时、有效的核验和处理。该框架借鉴了人类在工程管理体系中的成功经验,如通过标准作业程序(SOP)和检查清单等机制,构建一个能够有效复用、验证、扩展和派生的机制,使大模型在应用过程中即使出现幻觉问题,也能保证大模型达到专业领域所需的精确性和可靠性。
目前,高阶程序技术框架已经在金融风控全链路、网络入侵检测、医疗重复计费等多行业场景中初步应用。在传统金融风控体系下,从数据探查、处理到模型构建与调优的全链路操作,高度依赖人工干预,导致流程冗长、响应缓慢,并且容易受人员主观因素影响,制约了金融风控联合建模的效率与一致性。在应用HOP技术框架后,将复杂的SOP转化为可执行的流程和代码,实现风控全链路的智能化编排与自动化执行。相较于传统建模人员手动进行数据分析和代码开发,大模型结合HOP不但能降低处理成本,还能缓解专业人才紧缺的局面。
韦韬表示,“大模型可靠性的关键,不在于大模型本身,而在于工程化和智能化的融合。解决了可靠性问题,大模型即将涌现新的Killer App(杀手级应用)。我们开源高阶程序HOP,希望与行业一起把大模型从人类助手正在变成规模化专业生产力。”
排版/ 季嘉颖
图片/ 蚂蚁集团
来源/《IT时报》公众号vittimes
E N D
公 示
根据中国记协《关于2025年向资深新闻工作者颁发荣誉证书和证章的通知》要求,《IT时报》拟申报资深新闻工作者荣誉证书证章的人员名单:赖真。
赖真同志工作经历:1994年8月-2024年12月,《IT时报》社(原《上海邮电报》社)从事新闻采编等相关工作,历任《上海邮电报》记者、编辑、编辑部副主任;《IT时报》编辑部副主任、编辑部主任;IT时报/上海电信报副总编、总编。
《IT时报》申报总人数:1人。
公示时间:2025年8月1日-2025年8月7日(5个工作日)。