分享好友 最新资讯首页 最新资讯分类 切换频道
原汁原味还原声线、音色、气口……世界人工智能大会上“AI原声翻译”惊艳众人
2025-08-06 09:14

自动擦除中文字幕改为英文、弹幕翻译,还能完美还原UP主的声线、音色、气口,甚至基于翻译语言进行口型模拟,海外用户也可以看到原汁原味的“本地化”翻译视频了?在今年的世界人工智能大会上,B站公布了其全新自研的“AI原声翻译功能”,这种AI原生翻译不仅可以让海外用户更好体验游戏、科技、二次元等主推内容,也被业界认为是B站出海的重要落子。

自今年5月哔哩哔哩(B站)宣布将下架原国际版APP,与国内版合并为一个统一APP后,B站的出海下一步便引来各方关注。在今年的世界人工智能大会上,B站“AI原声翻译功能”的亮相,被业内人士视为其在完成了APP合并、海外用户页面多语种适配、特别是视频原声翻译功能上线后,正在蓄力开拓海外市场。

图片

海外用户页面

在大会上记者看到,“AI原声翻译”除了自动擦除中文字幕改为英文、弹幕翻译及各类按钮英文适配等基础的文本互译之外,还能完美还原UP主的声线、音色、气口,而非传统的机器音翻译,同时还能基于翻译语言进行口型模拟。这意味着在未来中文用户观看外语UP主视频或者海外用户观看中文UP主视频时,能无差别体验原汁原味的“本地化”翻译视频,拜托翻译不好时的尴尬体验。据介绍,后续B站还将视需求把日语等语言加入“AI原声翻译”功能中。

技术人员介绍说,目前“AI原声翻译功能”中,跨语言声音还原技术源自内部代号为「 IndexTTS2」的语音生成模型。该模型引入了一种新颖、通用且兼容自回归架构的语音时长及情感控制方法。为攻克“AI原声翻译功能”中的核心挑战——尤其在游戏、二次元等专业名词或者流行梗点密集领域——实现原风格精准保留与语音时长完美对应,技术团队基于大语言模型(LLM)构建翻译引擎,独创性基于语音时长匹配、原声翻译标准与UP主独特风格构建多目标奖励模型,并采用对抗式强化学习(RL)训练驱动模型持续进化与精准适配。同时,引入Deep Research深度挖掘技术,专攻专有名词与流行梗点的翻译难点,确保最终译文准确、地道、传神。字幕擦除部分则结合了先进的OCR技术和基于STTN网络的视频重绘技术,实现字幕区域的精准检测与高还原度擦除。

大鹏 小风


校对 陶善工

最新文章
南宁市青秀区2025年秋季学期小学一年级新生摸底调查公告
为有序推进城区2025年招生工作,经研究,决定于3月12日—18日开展2025年秋季学期小学一年级新生摸底工作。具体事项安排如下:一
“五一”成都“乡”当潮,10条乡村旅游路线发布!
“乡当美”——观花线路线路1:成都市区-彭州-温江-崇州崇州、新都、彭州……有欧式浪漫花海与中式田园风光,满足游客对不同花卉
双重身份的人性书写与文化根脉的深描——评李敬宇长篇小说《沉沙》的现实关照与历史叙事
李风宇与南京作家李敬宇相识已久,我在《雨花》杂志当编辑期间,他在《雨花》杂志上不仅发表了中短篇小说,还发表了中篇散文《老
家庭用手机远程监控器
作为守护家人安全的一道防线,正在逐渐得到更多家庭用户的青睐,它的主要优势表现如下:1.百万高清、广角镜头、自动红外切换;2.
健康微课·甩肉行动|终身“重”事!专家教你量身定制减重食谱
编者按:在2025年全国两会期间,“减肥”冲上热搜。3月9日,在十四届全国人大三次会议民生主题记者会上,国家卫生健康委员会主任
搜狐新闻(随机频道)媒体代发 新闻稿发布平台_媒介_为客户提供_企业
【搜狐新闻(随机频道)媒体代发 新闻稿发布平台】随着信息传播的多元化和互联网技术的发展,新闻稿的发布渠道也变得极为丰富。
2024公认拍照最好的3款手机,画质细腻堪比单反,几乎零差评
以前拍照人们都会比较喜欢买单反数码相机,可是随着科技进步,手机拍照越来越清晰 。大家反而不再喜欢用数码相机拍照,出门在外
2025年首只10倍股诞生,大牛股的基因有哪些?高手这样看
每经编辑:吴永久周一,PCB产业链表现强劲,这也刺激了铜箔、覆铜板股票大涨。此外,固态电池概念也表现出色。消息面上,7月25日
点点互动再出一SLG新品!砍树+战舰+SLG?能否再造一《寒霜启示录》?
1月9日,点点互动在全球160多个市场上线了SLG新游《小舰舰超勇》(欧美版本名为《High Seas Hero》)。根据点点数据预估,截止至