# 讯飞开放平台语音识别音频文件格式说明

   日期:2024-12-31     作者:emgzh       评论:0    移动:http://3jjewl.riyuangf.com/mobile/news/15811.html
核心提示:讯飞语音能力一般情况下支持如下音频格式: pcm(pcm_s16le),wav,speex(speex-wb) 采样率为16000 或者 8000. 推荐使用16000,

讯飞语音能力一般情况下支持如下音频格式:

# 讯飞开放平台语音识别音频文件格式说明

  1. pcm(pcm_s16le),wav,speex(speex-wb)
  2. 采样率为16000 或者 8000. 推荐使用16000,比特率为16bit
  3. 单声道

建议您自行下载Cool Edit Pro软件查看音频格式是否符合要求。

FFmpeg是一套可以用来记录、转换数字音频、视频,并能将其转化为流的开源计算机程序。 详情可参考:http://ffmpeg.org/

Mp3 转换为 16k 16bit 单声道 pcm

wav 转换为 16k 16bit 单声道 pcm

44100,16bit,单声道pcm 转换为 16k 16bit 单声道 pcm

参数解释:

-y: 表示无需询问,直接覆盖输出文件;

-acodec: 用于设置音频的编码器和解码器;

-f s16le: 用于设置文件格式为 s16le;

-ar 16000: 用于设置音频采样频率为 16k;

-ac 1: 用于设置通道数为 1;

-i: 用于设置输入文件;

讯飞开放平台rest_api支持speex编码压缩音频文件,相较于PCM可以节约网络传输成本,推荐使用speex格式。
请注意压缩前的原始音频文件,必须为采样率16K、16bit、单声道的PCM格式。

接口支持标准开源speex编码(speex-size参数必传)和讯飞定制speex编码(讯飞定制speex,无需额外传speex-size参数)

 
特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。

举报收藏 0打赏 0评论 0
 
更多>同类最新资讯
0相关评论

相关文章
最新文章
推荐文章
推荐图文
最新资讯
点击排行
{
网站首页  |  关于我们  |  联系方式  |  使用协议  |  隐私政策  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号