产品优势
准确率高,高效稳定
行业先进的语音识别技术,通用语音识别率98%(注:安徽电子产品监督检验所检测,报告编号151209010027)
个性热词,效果优化
无需算法开发,简单上传常用词句。优化识别效果,提高个性化准确率
格式转化,标点预测
对数字、日期、时间等返回格式化文本,根据对话语境,智能断句并匹配标点
方言语种,高效识别
支持除中英文外的多方言语种识别,适应复杂的语言环境
产品价格
套餐一
按时长套餐计费
时长
20小时
有效期
一年
方言/语种
中英文
套餐二
按时长套餐计费
时长
200小时
有效期
一年
方言/语种
中英文
套餐三
按时长套餐计费,赠送3个方言/语种
时长
1000小时
有效期
一年
方言/语种
额外赠送3个
套餐四
按时长套餐计费, 赠送5个方言/语种
时长
3000小时
有效期
一年
方言/语种
额外赠送5个
商务定制
有特殊环境或功能需求的客户
私有化部署
个性化功能
专属并发
定制方言/语种
大量采购
商务优惠
方言语种
类型
温馨提示:
1、 默认支持中文、英文、中英混合识别;中文包含普通话、天津话、河北话、东北话、甘肃话、山东话、太原话;
2、 西南官话包含云南话、贵州话、重庆话、四川话;
3、 购买时长套餐,可在控制台领取方言/语种;藏语和维语不参与套餐赠送。
技术规格
输入
接口输入规格
形式:
已录制音频
声道:
单声道&多声道
支持格式:
wav,flac,opus,m4a,mp3
采样率:
8KHz,16KHz
采样精度:
8bits,16bits
输出
接口输出规格
形式:
JSON格式字符串
编码:
UTF-8
结果:
分词形式&完整句子形式,词&句置信息度词&句时间戳,词属性,多候选词,文法格式智能转换,多发音人分离
开发者资源
WebAPI
可直接调用的WebAPI接口,具备流式传输能力,具备轻量、跨平台的特点
Java
Java平台智能语音SDK开发者资源,快速集成智能语音能力
常见问题
1、 “语音转写 ”与 “语音听写 ”的区别是?
产品名称 | 支持的音频时长 | 使用场景 |
语音听写 | 一分钟以内 | 人机对话,如输入法、语音搜索 |
语音转写 | 五小时以内 | 更自然地贴近日常的对话、演讲 |
2、 “已录制音频转写”和“实时音频流转写”的区别是?
已录制音频(recorded audio)转写:将预先录制完毕的完整音频文件传输至云端,转写服务处理完成后将输出此音频对应的完整文字结果。该流程为异步&非实时;
实时音频流(real-time streaming)转写:在采集音频的同时,连续上传音频流至云端,转写服务将实时返回文字结果,实现文字和声音的同步展现。
实时语音转写已上线,欢迎使用。
3、语音转写支持什么语言?
答:默认支持中文、英文、中英混合识别;中文包括普通话、天津话、河北话、东北话、甘肃话、山东话、太原话;其他方言/语种需购买套餐或语种授权。目前可支持:
l 方言:广东话、河南话、西南官话(云南话、贵州话、重庆话、四川话)
l 语种:中文、英文、日语、韩语、法语、俄语、越南语、西班牙语
l 民族语言:藏语、维语
4、目前语音转写支持的音频格式为:
已录制音频(5小时内),wav,flac,opus,m4a,mp3,单声道&多声道;采样率:8KHz,16KHz
5、语音转写支不支持并发?
答:支持,要保证同一个appid每秒请求接口次数最大值在20次以下。