# 讯飞开放平台语音识别音频文件格式说明

核心提示：讯飞语音能力一般情况下支持如下音频格式： pcm（pcm_s16le），wav，speex(speex-wb) 采样率为16000 或者 8000. 推荐使用16000，

讯飞语音能力一般情况下支持如下音频格式：

建议您自行下载Cool Edit Pro软件查看音频格式是否符合要求。

FFmpeg是一套可以用来记录、转换数字音频、视频，并能将其转化为流的开源计算机程序。详情可参考：http://ffmpeg.org/

Mp3 转换为 16k 16bit 单声道 pcm

wav 转换为 16k 16bit 单声道 pcm

44100,16bit,单声道pcm 转换为 16k 16bit 单声道 pcm

参数解释：

-y：表示无需询问,直接覆盖输出文件;

-acodec：用于设置音频的编码器和解码器；

-f s16le：用于设置文件格式为 s16le;

-ar 16000：用于设置音频采样频率为 16k;

-ac 1：用于设置通道数为 1;

-i：用于设置输入文件；

讯飞开放平台rest_api支持speex编码压缩音频文件，相较于PCM可以节约网络传输成本，推荐使用speex格式。
请注意压缩前的原始音频文件，必须为采样率16K、16bit、单声道的PCM格式。

接口支持标准开源speex编码（speex-size参数必传）和讯飞定制speex编码（讯飞定制speex，无需额外传speex-size参数）

特别提示：本信息由相关用户自行提供，真实性未证实，仅供参考。请谨慎采用，风险自负。

点赞 0举报收藏 0打赏 0评论 0

更多>同类最新资讯

0 条相关评论

相关文章

最新文章

推荐文章

推荐图文

最新资讯

点击排行

• MC这五种生物彻底女性化后,末影龙变得“风情万	• php百度推送代码怎么写
• zblog怎么配置又拍云CDN服务	• TDP-【tomat彻底解决】检测到目标主机可能存在
• Rutgers University最新USNEWS排名	• 【A916（黄金斗士青春版／联通4G）UC浏览器下载
• iOS 18.1 AI功能大汇总新增这么多功能但也有	• Python爬虫之xpath的详细使用（爬虫）
• WordPress站长联系及社交信息小工具插件Contact	• NLP之智能对话系统