可以通过上传个性化热词实现。个性化热词支持建立个性化的词条语言模型,调整识别参数,持续优化识别效果,提高用户的个性化词条识别准确率。
热词上传方式参考听写个性化热词---应用级热词&用户级热词
目前语音听写不能实现一个字一个字识别的效果,单次识别是实时返回60秒以内的音频转文字。
造成识别率很低的原因有很多,排查的思路(音量格式不符合要求、音频质量较差、设置的方言语种采样率等参数不对等等)。
1.webapi听写普通版和sdk应用的语音听写:语音听写目前支持的格式是 pcm 和 wav 格式、音频采样率要是 16k 或者 8k(仅在线支持)、采样精度16 位、单声道音频;
2.webapi听写流式版:支持的格式是pcm、speex、speex-wb,音频采样率要是 16k 或者 8k、采样精度16 位、单声道音频,其中中文普通话和英文还支持mp3格式,可见web流式听写开发文档。
进入讯飞开放平台页面后,点击右上角控制台----点击应用中的服务---个性化热词---上传热词---发布热词(一般生效时间1小时以后);
热词上传方式参考听写个性化热词---应用级热词&用户级热词。
可以通过上传个性化热词实现。个性化热词支持建立个性化的词条语言模型,调整识别参数,持续优化识别效果,提高用户的个性化词条识别准确率; 热词上传方式参考听写个性化热词---应用级热词&用户级热词。
目前语音听写支持中、英文以及部分国内方言,方言语种可以在语音听写页面上详细查询到。
语音听写方言添加测试权限---我的应用---语音听写(流式版)---添加新语种/方言---代码里修改语言参数(参考api文档)安卓api文档
目前平台上展示的方言识别需要单独购买,授权价格为:2万/个/年,可在应用控制台---添加方言---试用/购买。
我的应用---控制台---语音听写---购买服务量---在线购买服务量。