人工智能初识(百度ai) - 公司新闻 - 昌邑市雅蕊科技公司

会员登录|免费注册|忘记密码|管理入口返回主站||保存桌面

人工智能初识(百度ai)

2024-12-01IP属地湖北2

人工智能初识(百度ai) 人工智能

语音识别:小米的小爱同学,苹果的siri,微软的Cortana语音合成:小米的小爱同学,苹果的siri,微软的Cortana图像识别:交通摄像头拍违章,刷脸解锁手机等视频识别:抖音内容审核,视频社交APP的审核机制文字识别:从身份证照片提取身份证号码,扫一扫翻译语义理解:智能问答机器人,也包含小米的小爱同学,苹果的siri,微软的Cortana

人工智能初识(百度ai)

银行办卡刷脸就行车辆违章有牌儿就跑不了违法犯罪路过天眼,等于自投罗网“小爱同学”,”哎~”,”打开电视”,”好的!”“欢迎使用10010智能语音系统”,”我还有多少话费”,”您的话费余额为0.01元”扫一扫翻译看不懂的文字(支持26国语言)

开启人工智能技术的大门 : http://ai.baidu.com/

回到应用列表我们可以看到已创建的应用了

人工智能初识(百度ai)

这里面有三个值 AppID , API Key , Secret Key 记住可以从这里面看到 , 在之后的学习中我们会用到

安装SDK

首先咱们要 pip install baidu-aip 安装一个百度人工智能开放平台的Python SDK实在是太方便了,这也是为什么我们选择百度人工智能的最大原因

点击左侧的技术文档

人工智能初识(百度ai)

点击左边的语言合成->SDK文档->Python SDK

人工智能初识(百度ai)

请严格按照文档里描述的参数进行开发。请注意以下几个问题：

合成文本长度必须小于1024字节，如果本文长度较长，可以采用多次请求的方式。切忌文本长度超过限制。
语音合成 rest api不限制调用量，但是初始的QPS为100，如果默认配额不能满足您的业务需求，请从控制台中申请提高配额，我们会在两个工作日内完成审批
必填字段中，严格按照文档描述中内容填写。

点击左边的百度语言->语音识别->Python SDK

人工智能初识(百度ai)

建议使用pcm，因为它比较好实现。而另外2种语言格式，有非常高的要求，只有专业级别的设备才能录制。它才能达到百度的要求。

哎,每次到这里,我都默默无语泪两行,声音这个东西格式太多样化了,如果要想让百度的SDK识别咱们的音频文件,就要想办法转变成百度SDK可以识别的格式PCM

目前已知可以实现自动化转换格式并且屡试不爽的工具 : FFmpeg 这个工具的下载地址是 : 链接：https://pan.baidu.com/s/1jonSAa_TG2XuaJEy3iTmHg 密码：w6hk

人工智能初识(百度ai)

命令是 :

目前系统支持的语音时长上限为60s，请不要超过这个长度，否则会返回错误。

上图的16000表示采样率

1536表示能识别中文和英文，它的容错率比较高

1537必须是标准的普通话，带点地方口音是不行的。

所以建议使用1536

人工智能初识(百度ai)

图灵机器人 web录音实现自动交互问答

图灵机器人是以语义技术为核心驱动力的人工智能公司，致力于“让机器理解世界”，产品服务包括机器人开放平台、机器人OS和场景方案。

官方地址为：

http://www.tuling123.com/

人工智能初识(百度ai)

-----------------FAQ.py

------------------app.py

------------------index.html

人工智能初识(百度ai)

相关文章

相关动态

最新文章