分享好友 最新资讯首页 最新资讯分类 切换频道
原汁原味还原声线、音色、气口……世界人工智能大会上“AI原声翻译”惊艳众人
2025-08-06 09:14

自动擦除中文字幕改为英文、弹幕翻译,还能完美还原UP主的声线、音色、气口,甚至基于翻译语言进行口型模拟,海外用户也可以看到原汁原味的“本地化”翻译视频了?在今年的世界人工智能大会上,B站公布了其全新自研的“AI原声翻译功能”,这种AI原生翻译不仅可以让海外用户更好体验游戏、科技、二次元等主推内容,也被业界认为是B站出海的重要落子。

自今年5月哔哩哔哩(B站)宣布将下架原国际版APP,与国内版合并为一个统一APP后,B站的出海下一步便引来各方关注。在今年的世界人工智能大会上,B站“AI原声翻译功能”的亮相,被业内人士视为其在完成了APP合并、海外用户页面多语种适配、特别是视频原声翻译功能上线后,正在蓄力开拓海外市场。

图片

海外用户页面

在大会上记者看到,“AI原声翻译”除了自动擦除中文字幕改为英文、弹幕翻译及各类按钮英文适配等基础的文本互译之外,还能完美还原UP主的声线、音色、气口,而非传统的机器音翻译,同时还能基于翻译语言进行口型模拟。这意味着在未来中文用户观看外语UP主视频或者海外用户观看中文UP主视频时,能无差别体验原汁原味的“本地化”翻译视频,拜托翻译不好时的尴尬体验。据介绍,后续B站还将视需求把日语等语言加入“AI原声翻译”功能中。

技术人员介绍说,目前“AI原声翻译功能”中,跨语言声音还原技术源自内部代号为「 IndexTTS2」的语音生成模型。该模型引入了一种新颖、通用且兼容自回归架构的语音时长及情感控制方法。为攻克“AI原声翻译功能”中的核心挑战——尤其在游戏、二次元等专业名词或者流行梗点密集领域——实现原风格精准保留与语音时长完美对应,技术团队基于大语言模型(LLM)构建翻译引擎,独创性基于语音时长匹配、原声翻译标准与UP主独特风格构建多目标奖励模型,并采用对抗式强化学习(RL)训练驱动模型持续进化与精准适配。同时,引入Deep Research深度挖掘技术,专攻专有名词与流行梗点的翻译难点,确保最终译文准确、地道、传神。字幕擦除部分则结合了先进的OCR技术和基于STTN网络的视频重绘技术,实现字幕区域的精准检测与高还原度擦除。

大鹏 小风


校对 陶善工

最新文章
2024年韩国娱乐圈,众多明星宣布恋爱和结婚
宝子们,马上就2024年年底了,咱们今年的韩娱圈可是彻底变成了“爱的战场”!不管是恋爱还是婚礼消息,全都排着队冲上热搜,真·
助力开平经济上升发展 开平市工商联(总商会)出实招
8月29日下午,开平市工商联(总商会)十六届一次主席(会长)会议召开。会议透露,将出台《开平市工商联(总商会)助力全市经济
扶风县线上教学系列报道(三)
扶风二小停课不停教 停课不停研疫情无情,人间有爱。一路坚守,春暖花开。二小人“停课不停教 停课不停学”已开展四天。教学态势
唐军长银币升值潜力分析
军务院抚军长唐俗称唐军长银币搜狐网报道唐继尧三钱六分银元,拍卖成交价格USD 377000美元,拍卖成交时间拍卖专场为SBP2015年香
美国“加密周”,数万亿美元传统资产要冲进区块链?
作者:Matt Hougan,Bitwise首席投资官;编译:AIMan@金色财经摘要:本周,多项支持加密货币的法案在华盛顿推进,加密货币的时代
韩国大林BASELLPPH2150
韩国大林BASELLPPH2150优势说明:可提供相应有效的报告证明、品质保证及有关性能测试报告,如:材质证明及物质安全资料表(MSDS)
国家金融监督管理总局安徽监管局关于 推进快速成长期科技型企业 金融服务的指导意见
国家金融监督管理总局安徽监管局关于推进快速成长期科技型企业金融服务的指导意见皖金发〔2023〕2号各国家金融监督管理总局市级
成为美少女,已花光她一生的运气?
编辑 | 周三三这些年日娱日薄西山,输出能力四舍五入等于没有,还能有效传播来我们这儿的娱乐新闻,一年也刷不到两三条。而广末
搜狐要闻小时报2025082618期
以色列的此次袭击再次引发国际社会震怒,美国总统特朗普称“对此感到不高兴”,联合国秘书长古特雷斯要求“立即、公正地进行调查
收费8898元后“缩水”服务,知名婚恋平台“牵手APP”遭公开警示
近日,天津市消费者协会对“牵手APP”运营主体——天津来福文化发展有限公司(以下简称“天津来福文化”)发布警示,要求该公司