这里介绍的是Windows&Linux API全部文件的函数及其说明,点击右侧目录可快速找到相应文件。
通用接口(Mobile Speech Platform Common Interface Header File)
类型 | 说明 |
---|---|
int MSPAPI | MSPLogin(const char *usr, const char *pwd, const char *params) 初始化msc,用户登录。 |
const char *MSPAPI | MSPUploadData(const char *dataName, void *data, unsigned int dataLen, const char*params, int *errorCode) 用户数据上传。 |
int MSPAPI | MSPLogout 退出登录。 |
int MSPAPI | MSPSetParam(const char *paramName, const char *paramValue) 参数设置接口、离线引擎初始化接口。 |
int MSPAPI | MSPGetParam(const char *paramName, char *paramValue, unsigned int *valueLen) 获取MSC的设置信息。 |
const char *MSPAPI | MSPGetVersion(const char *verName, int *errorCode) 获取MSC或本地引擎版本信息。 |
通用接口(Mobile Speech Platform Common Interface Header File)
This file contains the quick common programming interface (API) declarations of MSP. Developer can include this file in your project to build applications. For more information, please read the developer guide.
Use of this software is subject to certain restrictions and limitations set forth in a license agreement entered into between iFLYTEK, Co,LTD. and the licensee of this software. Please refer to the license agreement for license use rights and restrictions.
Copyright (C) by iFLYTEK, Co,LTD. All rights reserved.
int MSPAPI MSPLogin (const char * usr,
const char * pwd,
const char * params
)
初始化msc,用户登录。
参数:
usr[in]
此参数保留,传入NULL即可。
pwd[in]
此参数保留,传入NULL即可。
params[in]
参见下表:
格式说明:每个参数和参数值通过key=value的形式组成参数对;如果有多个参数对,再用逗号进行拼接,如:key_1=value_1,key_2=value_2
注意:每个参数(key)和参数值(value)均不得含有逗号(,)和等号(=),否则会被截断
在线/离线业务 | 参数 | 名称 | 说明 |
---|---|---|---|
通用 | appid | 应用ID | SDK申请成功后获取到的appid。申请SDK请前往讯飞开放平台,此参数必须传入 |
离线 | engine_start | 离线引擎启动 | 启动离线引擎,支持参数,ivw:唤醒,asr:识别 |
离线 | [xxx]_res_path | 离线引擎资源路径 | 设置ivw、asr引擎离线资源路径,详细格式如下:fo|[path]|[offset]|[length]|xx|xx。 示例如下,单个资源路径: ivw_res_path=fo|res/ivw/wakeupresource.jet, 多个资源路径:asr_res_path=fo|res/asr/common.jet;fo|res/asr/sms.jet |
返回
成功返回MSP_SUCCESS,否则返回错误代码,详见错误码列表。
备注
使用其他接口前必须先调用MSPLogin,可以在应用程序启动时调用。
参见:
const char* usr = NULL;
const char* pwd = NULL;
const char* lgi_param = "appid = ********";
int ret = MSPLogin(usr, pwd, lgi_param);
if( MSP_SUCCESS != ret )
{
printf( "MSPLogin failed, error code is: %d", ret );
}
const char* MSPAPI MSPUploadData (const char * dataName,
void * data,
unsigned int dataLen,
const char * params,
int * errorCode
)
用户数据上传。
参数:
dataName[in]
数据名称字符串。
data[in]
待上传数据缓冲区的起始地址。
dataLen[in]
数据长度(如果是字符串,则不包含'\0')。
params[in]
目前支持以下四种。具体如下:
在线/离线业务 | 参数 | 功能 | 应用业务 | 文件编码 |
---|---|---|---|---|
在线 | "sub = uup,dtt = userword" | 上传用户词表 | iat | UTF-8 |
在线 | "sub = uup,dtt = contact" | 上传联系人 | iat | UTF-8 |
返回
上传成功后,联系人、用户词表功能返回值NULL。
备注
使用其他接口前必须先调用MSPLogin,可以在应用程序启动时调用。
参见:
const char* dataname = "userword";
const char* params = "sub=uup,dtt=userword";
const char* result = NULL;
char* data = NULL;
int data_len = 0;
FILE* fp = fopen("userwords.txt ", "rb");
if(NULL==fp)
{
... //错误处理
}
fseek(fp, 0, SEEK_END);
data_len = ftell(fp);
fseek(fp, 0, SEEK_SET);
data = (char*)malloc(data_len+1);
if(NULL==data)
{
... //错误处理
}
data_len = fread(data,1,data_len,fp);
if(data_len == 0)
{
... //错误处理
}
data[data_len] = '\0';
result = MSPUploadData( dataName, data, data_len, params, &errorcode);
if( MSP_SUCCESS != errorcode )
{
printf( "MSPUploadData failed, error code is: %d", ret );
}
fclose(fp);
.
int MSPAPI MSPLogout()
退出登录。
返回
如果函数调用成功返回MSP_SUCCESS,否则返回错误代码,详见错误码列表。
备注
本接口和MSPLogin配合使用。确保其他接口调用结束之后调用MSPLogout,否则结果不可预期。
参见:
int ret = MSPLogout( );
if(MSP_SUCCESS != ret)
{
printf("MSPLogout failed, error code is: %d", ret);
}
int MSPAPI MSPSetParam(const char * paramName,
const char * paramValue
)
参数设置接口、离线引擎初始化接口。
参数:
paramName[in]
参数名,可设置参数如下:
在线/离线业务 | 参数 | 名称 | 说明 |
---|---|---|---|
离线 | engine_start | engine_start 启动离线引擎 | 启动引擎: 设置paramName为engine_start paramValue为engine_start=asr、ivw离线业务 之后加资源所在路径 例如engine_start=asr,asr_res_path=fo|file_path|[offset]|[length] |
离线 | engine_destroy | 销毁离线引擎 | 销毁引擎: 设置paramName 为engine_destroy paramValue 为asr 、tts 、ivw ( 如engine_destroy=tts)离线业务 |
paramValue[in]
参数值。
返回
函数调用成功则其值为MSP_SUCCESS,否则返回错误代码,详见错误码列表。
备注
无
参见:
const char* paramsName= "engine_start";
const char* paramsValue="engine_start = ivw,ivw_res_path =fo|res/ivw/wakeupresource.jet";
errorcode = MSPSetParam (paramsName, paramsValue);
if( MSP_SUCCESS != errorcode )
{
printf( "MSPSetParam failed, error code is: %d", ret );
}
.
int MSPAPI MSPGetParam (const char * paramName,
char * paramValue,
unsigned int * valueLen
)
获取MSC的设置信息。
参数:
paramName[in]
参数名,一次调用只支持查询一个参数。参数如下:
在线/离线业务 | 参数 | 描述 |
---|---|---|
在线 | upflow | 上行数据量 |
在线 | downflow | 下行数据量 |
paramValue[in/out]
输入:buffer首地址
输出:向该buffer写入获取到的信息
valueLen[in/out]
输入:buffer的大小
输出:信息实际长度(不含'\0')
返回
函数调用成功返回MSP_SUCCESS,否则返回错误代码,详见错误码列表。
备注
以查询上行流量为例,获取到的是当前累计的上行流量。下行流量查询与此相似。
参见:
const char* para_name = "upflow";
char para_value[32] = {'\0'};
unsigned int value_len = 32;
int ret = MSPGetParam (para_name, para_value, &value_len);
if(MSP_SUCCESS != ret)
{
printf("MSPGetParam failed, error code is: %d", ret);
}
.
const char* MSPAPI MSPGetVersion (const char * verName,
int * errorCode
)
获取MSC或本地引擎版本信息
参数:
verName[in]
参数名,一次调用只支持查询一个参数。参数如下:
在线/离线业务 | 参数 | 描述 |
---|---|---|
离线 | ver_msc | MSC版本号 |
离线 | ver_asr | 离线识别版本号,目前不支持 |
离线 | ver_tts | 离线合成版本号 |
离线 | ver_ivw | 离线唤醒版本号 |
errorCode[out]
如果函数调用成功返回MSP_SUCCESS,否则返回错误代码,详见错误码列表。
返回
成功返回缓冲区指针,失败或数据不存在返回NULL。
备注
使用其他接口前必须先调用MSPLogin,可以在应用程序启动时调用。
参见
无
语音识别(iFLY Speech Recognizer Header File)
语音识别(iFLY Speech Recognizer Header File)
类型 | 说明 |
---|---|
const char *MSPAPI | QISRSessionBegin(const char *grammarList, const char *params, int *errorCode) 开始一次语音识别。 |
int MSPAPI | QISRAudioWrite(const char *sessionID, const void *waveData, unsigned int waveLen, int audioStatus, int *epStatus, int *recogStatus) 写入本次识别的音频。 |
const char *MSPAPI | QISRGetResult(const char *sessionID, int *rsltStatus, int waitTime, int *errorCode) 获取识别结果。 |
int MSPAPI | QISRSessionEnd(const char *sessionID, const char *hints) 结束本次语音识别。 |
int MSPAPI | QISRGetParam(const char *sessionID, const char *paramName, char *paramValue, unsigned int *valueLen) 获取当次语音识别信息,如上行流量、下行流量等。 |
int MSPAPI | QISRBuildGrammar(const char *grammarType, const char *grammarContent, unsigned int grammarLength, const char *params, GrammarCallBack callback, void *userData) 构建语法,生成语法ID。 |
int MSPAPI | QISRUpdateLexicon(const char *lexiconName, const char *lexiconContent, unsigned int lexiconLength, const char *params, LexiconCallBack callback, void *userData) 更新本地语法词典。 |
语音识别(iFLY Speech Recognizer Header File)
This file contains the quick application programming interface (API) declarations of ISR. Developer can include this file in your project to build applications. For more information, please read the developer guide.
Use of this software is subject to certain restrictions and limitations set forth in a license agreement entered into between iFLYTEK, Co,LTD. and the licensee of this software. Please refer to the license agreement for license use rights and restrictions.
Copyright (C) by iFLYTEK, Co,LTD. All rights reserved.
const char* MSPAPI QISRSessionBegin (const char * grammarList,
const char * params,
int * errorCode
)
开始一次语音识别。
参数:
grammarList[in]
此参数保留,传入NULL即可。
params[in]
参见下表:
格式说明:每个参数和参数值通过key=value的形式组成参数对;如果有多个参数对,再用逗号进行拼接,如:key_1=value_1,key_2=value_2
注意:每个参数(key)和参数值(value)均不得含有逗号(,)和等号(=),否则会被截断
在线/离线业务 | 参数 | 名称 | 说明 |
---|---|---|---|
通用 | engine_type | 引擎类型 | 可取值: cloud:在线引擎 local:离线引擎 默认值:cloud |
在线 | sub | 本次识别请求的类型 | iat:语音听写 asr:命令词识别。 默认为iat |
在线 | language | 语言 | 可取值: zh_cn:简体中文 en_us:英文 默认值:zh_cn |
在线 | domain | 领域 | iat:语音听写(默认值) |
在线 | accent | 语言区域 | 可取值: mandarin:普通话(默认值) 其他方言请前往讯飞开放平台控制台查看 |
通用 | sample_rate | 音频采样率 | 可取值:16000,8000 默认值:16000 离线识别不支持8000采样率音频 |
离线 | asr_threshold | 识别门限 | 离线语法识别结果门限值,设置只返回置信度得分大于此门限值的结果 可取值:0~100,默认值:0 |
离线 | asr_denoise | 是否开启降噪功能 | 可取值: 0:不开启,1:开启 默认不开启 |
离线 | asr_res_path | 离线识别资源路径 | 离线识别资源所在路径,对应格式如下: access_type1|file_info1|[offset1]|[length1];access_type2|file_info2|[offset2]|[length2] 各字段含义如下: access_type:文件访问方式,支持路径方式(fo)和文件描述符方式(fd); file_info:此字段和access_type 对应,文件路径对应fo,文件描述符对应fd, |
离线 | grm_build_path | 离线语法生成路径 | 构建离线语法所生成数据的保存路径(文件夹) |
通用 | result_type | 结果格式 | 可取值:plain,json 默认值:plain |
通用 | text_encoding | 文本编码格式 | 表示参数中携带的文本编码格式 |
离线 | local_grammar | 离线语法id | 构建离线语法后获得的语法ID |
通用 | ptt | 添加标点符号(仅sub=iat时有效) | 0:无标点符号;1:有标点符号。默认为1 |
在线 | aue | 音频编码格式和压缩等级 | 编码算法:raw;speex;speex-wb;ico 编码等级:raw:不进行压缩。speex系列:0-10; 默认为speex-wb;7 speex对应sample_rate=8000 speex-wb对应sample_rate=16000 ico对应sample_rate=16000 |
通用 | result_encoding | 识别结果字符串所用编码格式 | GB2312;UTF-8;UNICODE 不同的格式支持不同的编码: plain:UTF-8,GB2312 json:UTF-8 |
通用 | vad_enable | VAD功能开关 | 是否启用VAD 默认为开启VAD 0(或false)为关闭 |
通用 | vad_bos | 允许头部静音的最长时间(目前未开启该功能) | 0-10000毫秒。默认为10000 如果静音时长超过了此值,则认为用户此次无有效音频输入。此参数仅在打开VAD功能时有效。 |
通用 | vad_eos | 允许尾部静音的最长时间 | 0-10000毫秒。默认为2000 如果尾部静音时长超过了此值,则认为用户音频已经结束,此参数仅在打开VAD功能时有效。 |
返回
函数调用成功返回字符串格式的sessionID,失败返回NULL。sessionID是本次识别的句柄。 。
备注
参数只在当次识别中生效。
参见:
const char * params = "engine_type = local, asr_res_path = ****, sample_rate = ****, grm_build_path = ****, local_grammar = ****, result_type = json, result_encoding = UTF-8";
int ret = 0;
const char* sessionID = QISRSessionBegin( NULL, params, &ret );
if( MSP_SUCCESS != ret )
{
printf( "QISRSessionBegin failed, error code is: %d", ret );
}
.
int MSPAPI QISRAudioWrite (const char * sessionID,
const void * waveData,
unsigned int waveLen,
int audioStatus,
int * epStatus,
int * recogStatus
)
写入本次识别的音频。
参数:
sessionID[in]
由QISRSessionBegin返回的句柄。
waveData[in]
音频数据缓冲区起始地址。
waveLen[in]
音频数据长度,单位字节。
audioStatus[in]
用来告知MSC音频发送是否完成,典型值如下:
枚举常量 | 简介 |
---|---|
MSP_AUDIO_SAMPLE_FIRST = 1 | 第一块音频 |
MSP_AUDIO_SAMPLE_CONTINUE = 2 | 还有后继音频 |
MSP_AUDIO_SAMPLE_LAST = 4 | 最后一块音频 |
epStatus[out]
端点检测(End-point detected)器所处的状态,可能的值如下:
枚举常量 | 简介 |
---|---|
MSP_EP_LOOKING_FOR_SPEECH = 0 | 还没有检测到音频的前端点。 |
MSP_EP_IN_SPEECH = 1 | 已经检测到了音频前端点,正在进行正常的音频处理。 |
MSP_EP_AFTER_SPEECH = 3 | 检测到音频的后端点,后继的音频会被MSC忽略。 |
MSP_EP_TIMEOUT = 4 | 超时。 |
MSP_EP_ERROR = 5 | 出现错误。 |
MSP_EP_MAX_SPEECH = 6 | 音频过大。 |
rsltStatus[out]
识别器返回的状态,提醒用户及时开始\停止获取识别结果。典型值如下:
枚举常量 | 简介 |
---|---|
MSP_REC_STATUS_SUCCESS = 0 | 识别成功,此时用户可以调用QISRGetResult来获取(部分)结果。 |
MSP_REC_STATUS_NO_MATCH = 1 | 识别结束,没有识别结果。 |
MSP_REC_STATUS_INCOMPLETE = 2 | 正在识别中。 |
MSP_REC_STATUS_COMPLETE = 5 | 识别结束。 |
返回
函数调用成功则其值为MSP_SUCCESS,否则返回错误代码,详见错误码列表。
备注:
本接口需不断调用,直到音频全部写入为止。上传音频时,需更新audioStatus的值。具体来说:
当写入首块音频时,将audioStatus置为MSP_AUDIO_SAMPLE_FIRST
当写入最后一块音频时,将audioStatus置为MSP_AUDIO_SAMPLE_LAST
其余情况下,将audioStatus置为MSP_AUDIO_SAMPLE_CONTINUE
同时,需定时检查两个变量:epStatus和rsltStatus。具体来说:
当epStatus显示已检测到后端点时,MSC已不再接收音频,应及时停止音频写入
当rsltStatus显示有识别结果返回时,即可从MSC缓存中获取结果
参见:
char audio_data[ 5120 ] ={'\0'};
unsigned int audio_len = 0;
int audio_status = 2;
int ep_status = 0;
int rec_status = 0;
int ret = 0;
while(MSP_AUDIO_SAMPLE_LAST != audio_status )
{
// 读取音频到缓冲区audio_data 中,设置音频长度audio_len,音频状态audio_status。
ret = QISRAudioWrite( sessionID, audio_data, audio_len, audio_status, &ep_status, &rec_status );
if( MSP_SUCCESS ! = ret )
{
printf( "QISRAudioWrite failed, error code is: %d", ret );
break;
}
else if(MSP_EP_AFTER_SPEECH == ep_status ) // 检测到音频后端点,停止写入音频
{
printf( "end point of speech has been detected!" );
break;
}
// 如果是实时采集音频,可以省略此操作。5KB 大小的16KPCM 持续的时间是160 毫秒
Sleep( 160 );
}
.
const char* MSPAPI QISRGetResult (const char * sessionID,
int * rsltStatus,
int waitTime,
int * errorCode
)
获取识别结果。
参数:
sessionID[in]
由QISRSessionBegin返回的句柄。
rsltStatus[out]
识别结果的状态,其取值范围和含义请参考QISRAudioWrite 的参数recogStatus。
waitTime[in]
此参数做保留用。
errorCode[out]
函数调用成功则其值为MSP_SUCCESS,否则返回错误代码,详见错误码列表。
返回:
函数执行成功且有识别结果时,返回结果字符串指针;其他情况(失败或无结果)返回NULL。
备注:
当写入音频过程中已经有部分识别结果返回时,可以获取结果。在音频写入完毕后,用户需反复调用此接口,直到识别结果获取完毕(rlstStatus值为5)或返回错误码。 注意:如果某次成功调用后暂未获得识别结果,请将当前线程sleep一段时间,以防频繁调用浪费CPU资源。
参见:
char rslt_str[ 2048 ] ={'\0'};
const char* rec_result = NULL;
int rslt_status = 0;
int ret = 0;
while(MSP_REC_STATUS_SPEECH_COMPLETE != rslt_status )
{
rec_result = QISRGetResult ( sessionID, &rslt_status, 5000, &ret );
if( MSP_SUCCESS != ret )
{
printf( "QISRGetResult failed, error code is: %d", ret );
break;
}
if( NULL != rec_result )
{
// 用户可以用其他的方式保存识别结果
strcat( rslt_str, rec_result );
continue;
}
// sleep 一下很有必要,防止MSC 端无缓存的识别结果时浪费CPU 资源
Sleep( 200 );
}
.
int MSPAPI QISRSessionEnd(const char * sessionID,
const char * hints
)
结束本次语音识别。
参数
返回 函数调用成功则其值为MSP_SUCCESS,否则返回错误代码,详见错误码列表。
备注 本接口和QISRSessionBegin对应,调用此接口后,该句柄对应的相关资源(参数、语法、音频、实例等)都会被释放,用户不应再使用该句柄。
参见
int ret = QISRSessionEnd ( sessionID, "normal end" );
if( MSP_SUCCESS != ret )
{
printf( "QISRSessionEnd failed, error code is: %d", ret );
}
.
int MSPAPI QISRGetParam (const char * sessionID,
const char * paramName,
char * paramValue,
unsigned int * valueLen
)
获取当次语音识别信息,如上行流量、下行流量等。
参数
sessionID[in]
由QISRSessionbegin返回的句柄,如果为NULL,获取MSC的设置信息。
paramName[in]
参数名,一次调用只支持查询一个参数。参数如下:
在线/离线业务 | 参数 | 描述 |
---|---|---|
在线 | sid | 服务端会话ID,长度为32字节 |
在线 | upflow | 上行数据量 |
在线 | downflow | 下行数据量 |
通用 | volume | 最近一次写入的音频的音量 |
paramValue[out]
输入:buffer首地址
输出:向该buffer写入获取到的信息
valueLen[out]
输入:buffer的大小
输出:信息实际长度(不含’\0’)
返回
函数调用成功返回MSP_SUCCESS,否则返回错误代码,详见错误码列表。
备注
以查询上行流量为例,获取到的是本次识别当前累计的上行流量。下行流量查询与此相似。
参见
const char * para_name = "upflow";
char para_value[32] = {'\0'};
unsigned int value_len = 32;
int ret = QISRGetParam ( sessionID, para_name, para_value, &value_len );
if( MSP_SUCCESS != ret )
{
printf( "QISRGetParam failed, error code is: %d", ret );
}
.
int MSPAPI QISRBuildGrammar (const char * grammarType,
const char * grammarContent,
unsigned int grammarLength,
const char * params,
GrammarCallBack callback,
void * userData
)
构建语法,生成语法ID。
参数
grammarType[in]
语法类型,离线识别采用bnf 格式语法。
grammarContent[in]
语法内容。
grammarLength[in]
语法长度。
params[in]
参见下表:
格式说明:每个参数和参数值通过key=value的形式组成参数对;如果有多个参数对,再用逗号进行拼接,如:key_1=value_1,key_2=value_2
注意:每个参数(key)和参数值(value)均不得含有逗号(,)和等号(=),否则会被截断
在线/离线业务 | 参数 | 名称 | 说明 |
---|---|---|---|
通用 | engine_type | 引擎类型 | 可取值: local:离线引擎 |
通用 | sample_rate | 音频采样率 | 可取值:16000,8000, 默认值:16000 |
离线 | asr_res_path | 离线识别资源路径 | 离线识别资源所在路径,对应格式如下: access_type1|file_info1|[offset1]|[length1];access_type2|file_info2|[offset2]|[length2] 各字段含义如下: access_type:文件访问方式,支持路径方式(fo)和文件描述符方式(fd); file_info:此字段和access_type 对应,文件路径对应fo,文件描述符对应fd, 其中文件路径必须是包含文件名的完整路径; offset:资源文件在此传入文件中的偏移; length:资源文件大小。 |
离线 | grm_build_path | 离线语法生成路径 | 构建离线语法所生成数据的保存路径(文件夹) |
callback[in]
构建语法回调接口。typedef int ( GrammarCallBack)( int errorCode, const char info, void* userData);
userData[in/out]
用户数据。
返回
函数调用成功返回MSP_SUCCESS,否则返回错误代码,详见错误码列表。
备注
无
参见
无
int MSPAPI QISRUpdateLexicon(const char * lexiconName,
const char * lexiconContent,
unsigned int lexiconLength,
const char * params,
LexiconCallBack callback,
void * userData
)
更新本地语法词典。
参数
lexiconName[in]
词典名称。更新本地语法词典:传递语法中需要更新的词典槽名称
lexiconContent[in]
词典内容。本地语法词典:词典内容为换行符分割的字符串列表,如:"词条1\n 词条2\n 词条3\n 词条4"
lexiconLength[in]
词典内容长度。
params[in]
参见下表:
格式说明:每个参数和参数值通过key=value的形式组成参数对;如果有多个参数对,再用逗号进行拼接,如:key_1=value_1,key_2=value_2
注意:每个参数(key)和参数值(value)均不得含有逗号(,)和等号(=),否则会被截断
在线/离线业务 | 参数 | 名称 | 说明 |
---|---|---|---|
通用 | engine_type | 引擎类型 | 可取值: cloud:在线引擎, local:离线引擎, 默认值:cloud |
在线 | subject | 业务类型 | 必须由用户指定,更新云端词典设置为uup |
在线 | data_type | 数据类型 | 必须由用户指定。 更新云端联系人:contact 更新云端个性化词表:userword |
通用 | text_encoding | 文本编码格式 | 表示参数中携带的文本编码格式 可取值:GB2312,GBK,UTF-8,UTF-16LE,UTF-16BE |
通用 | sample_rate | 音频采样率 | 可取值:16000,8000, 默认值:16000 |
离线 | asr_res_path | 离线识别资源路径 | 离线识别资源所在路径,对应格式如下: access_type1|file_info1|[offset1]|[length1];access_type2|file_info2|[offset2]|[length2] 各字段含义如下: access_type:文件访问方式,支持路径方式(fo)和文件描述符方式(fd); file_info:此字段和access_type 对应,文件路径对应fo,文件描述符对应fd, 其中文件路径必须是包含文件名的完整路径; offset:资源文件在此传入文件中的偏移; length:资源文件大小。 |
离线 | grm_build_path | 离线语法生成路径 | 构建离线语法所生成数据的保存路径(文件夹) |
离线 | grammar_list | 语法id 列表 | 指定需要更新的离线语法id 列表,支持一次性更新多个语法, 格式如下:id1;id2 |
callback[in]
更新词典回调接口。typedef int (LexiconCallBack)(int errorCode, const char info, void* userData);
userData[in/out]
用户数据。
返回
函数调用成功则其值为MSP_SUCCESS,否则返回错误代码,详见错误码列表。
备注
无
参见
无
语音合成(iFLY Speech Synthesizer Header File)
类型 | 说明 |
---|---|
const char *MSPAPI | QTTSSessionBegin(const char *params, int *errorCode) 开始一次语音合成,分配语音合成资源。 |
int MSPAPI | QTTSTextPut(const char *sessionID, const char *textString, unsigned int textLen, const char *params) 写入要合成的文本。 |
const void *MSPAPI | QTTSAudioGet(const char *sessionID, unsigned int *audioLen, int *synthStatus, int *errorCode) 获取合成音频。 |
int MSPAPI | QTTSSessionEnd(const char *sessionID, const char *hints) 结束本次语音合成。 |
int MSPAPI | QTTSGetParam(const char *sessionID, const char *paramName, char *paramValue, unsigned int *valueLen) 获取当前语音合成信息,如当前合成音频对应文本结束位置、上行流量、下行流量等。 |
语音合成(iFLY Speech Synthesizer Header File)
This file contains the quick application programming interface (API) declarations of TTS. Developer can include this file in your project to build applications. For more information, please read the developer guide.
Use of this software is subject to certain restrictions and limitations set forth in a license agreement entered into between iFLYTEK, Co,LTD. and the licensee of this software. Please refer to the license agreement for license use rights and restrictions.
Copyright (C) by iFLYTEK, Co,LTD. All rights reserved.
const char* MSPAPI QTTSSessionBegin(const char * params,
int * errorCode
)
开始一次语音合成,分配语音合成资源。
参数
params[in]
传入的参数列表,支持以下参数:
格式说明:每个参数和参数值通过key=value的形式组成参数对;如果有多个参数对,再用逗号进行拼接,如:key_1=value_1,key_2=value_2
注意:每个参数(key)和参数值(value)均不得含有逗号(,)和等号(=),否则会被截断
在线/离线业务 | 参数 | 名称 | 说明 |
---|---|---|---|
通用 | engine_type | 引擎类型 | 可取值: cloud:在线引擎 local:离线引擎,默认为cloud |
通用 | voice_name | 发音人 | 不同的发音人代表了不同的音色, 如男声、女声、童声等,具体参数值请到控制台-发音人授权管理确认 |
通用 | speed | 语速 | 合成音频对应的语速, 取值范围:[0,100],数值越大语速越快。 默认值:50 |
通用 | volume | 音量 | 合成音频的音量, 取值范围:[0,100],数值越大音量越大。 默认值:50 |
通用 | pitch | 语调 | 合成音频的音调, 取值范围:[0,100],数值越大音调越高。 默认值:50 |
离线 | tts_res_path | 合成资源路径 | 合成资源所在路径,支持fo 方式参数设置,对应格式如下: fo|[file_info]|[offset]|[length] (1)若是合并资源,则只需传入一个资源路径,如:fo| combined.jet|0|1024 (2)若是分离资源,则需传两个资源路径,如:fo|common.jet|0|1024;fo| xiaoyan.jet|0|1024 |
通用 | rdn | 数字发音 | 合成音频数字发音,支持参数, 0 数值优先, 1 完全数值, 2 完全字符串, 3 字符串优先, 默认值:0 |
离线 | rcn | 1 的中文发音 | 支持参数: 0:表示发音为yao 1:表示发音为yi 默认值:0 |
通用 | text_encoding | 文本编码格式(必传) | 合成文本编码格式,支持参数,GB2312,GBK,BIG5,UNICODE,GB18030,UTF8 |
通用 | sample_rate | 合成音频采样率 | 合成音频采样率,支持参数,16000,8000(离线高品质合成暂不支持),默认为16000 |
在线 | background_sound | 背景音 | 合成音频中的背景音,支持参数, 0:无背景音乐, 1:有背景音乐 |
在线 | aue | 音频编码格式和压缩等级 | 码算法:raw;speex;speex-wb;ico 编码等级:raw:不进行解压缩 speex系列:0-10; 默认为speex-wb;7 speex对应sample_rate=8000 speex-wb对应sample_rate=16000 ico对应sample_rate=16000 |
在线 | ttp | 文本类型 | 合成文本类型,支持参数, text: 普通格式文本 cssml:cssml 格式文本 默认值:text |
离线 | speed_increase | 语速增强 | 通过设置此参数控制合成音频语速基数,取值范围, 1:正常 2:2 倍语速 4:4 倍语速 |
离线 | effect | 合成音效 | 合成音频的音效,取值范围, 0 无音效,1 忽远忽近,2 回声,3 机器人,4 合唱,5 水下,6 混响,7 阴阳怪气 |
注意:没有默认值的参数必须由外部设定其值
errorCode[out]
函数调用成功则其值为MSP_SUCCESS,否则返回错误代码,详见错误码列表。
返回
函数调用成功返回字符串格式的sessionID,失败返回NULL。sessionID是本次合成的句柄。
备注
参数只在本次合成中生效。
参见
const char* params= "engine_type = local, voice_name=xiaoyan, tts_res_path =fo|res\\tts\\xiaoyan.jet;fo|res\\tts\\common.jet, sample_rate = 16000" ;
int ret = 0;
const char* sessionID = QTTSSessionBegin( params, &ret );
if( MSP_SUCCESS != ret )
{
printf( "QTTSSessionBegin failed, error code is: %d", ret );
}
.
int MSPAPI QTTSTextPut (const char * sessionID,
const char * textString,
unsigned int textLen,
const char * params
)
写入要合成的文本。
参数
sessionID[in]
由QTTSSessionBegin返回的句柄。
textString[in]
字符串指针。指向待合成的文本字符串。
textLen[in]
合成文本长度,最大支持8192个字节(不含’\0’)。
params[in]
本次合成所用的参数,只对本次合成的文本有效。目前为空。
返回
函数调用成功则其值为MSP_SUCCESS,否则返回错误代码,详见错误码列表。
备注
本接口不支持连续被调用。调用本接口写入合成文本后,用户需要反复调用QTTSAudioGet 接口来获取音频。
参见
const char* text_str = "科大讯飞股份有限公司";
unsigned int text_len = strlen( textString ); //textLen 参数为合成文本所占字节数
int ret = QTTSTextPut( sessionID, text_str, text_len, NULL );
if( MSP_SUCCESS != ret )
{
printf( "QTTSTextPut failed, error code is: %d", ret );
}
.
const void* MSPAPI QTTSAudioGet (const char * sessionID,
unsigned int * audioLen,
int * synthStatus,
int * errorCode
)
获取合成音频。
参数
sessionID[in]
由QTTSSessionBegin返回的句柄。
audioLen[out]
合成音频长度,单位字节。
synthStatus[out]
合成音频状态,可能的值如下:
枚举常量 | 简介 |
---|---|
MSP_TTS_FLAG_STILL_HAVE_DATA = 1 | 音频还没取完,还有后继的音频 |
MSP_TTS_FLAG_DATA_END = 2 | 音频已经取完 |
errorCode[out]
函数调用成功则其值为MSP_SUCCESS,否则返回错误代码,详见错误码列表。
返回
函数调用成功且有音频数据时返回非空指针。调用失败或无音频数据时,返回NULL。
备注
用户需要反复获取音频,直到音频获取完毕或函数调用失败。在重复获取音频时,如果暂未获得音频数据,需要将当前线程sleep一段时间,以防频繁调用浪费CPU资源。
参见
FILE* fp = fopen("tts.pcm", "wb");
while (1)
{
const void * data = QTTSAudioGet(sessionID, &audio_len, &synth_status, &ret);
if (NULL != data)
{
fwrite(data, audio_len, 1, fp);
}
if (MSP_TTS_FLAG_DATA_END == synth_status || MSP_SUCCESS != ret)
{
break;
}
}
fclose(fp);
.
int MSPAPI QTTSSessionEnd(const char * sessionID,
const char * hints
)
结束本次语音合成。
参数
sessionID[in]
由QTTSSessionBegin返回的句柄。
hints[in]
结束本次语音合成的原因描述,为用户自定义内容。
返回
函数调用成功则其值为MSP_SUCCESS,否则返回错误代码,详见错误码列表。
备注
本接口和QTTSSessionBegin对应,调用此接口后,该句柄对应的相关资源(参数,合成文本,实例等)都会被释放,用户不应再使用该句柄。
参见
int ret = QTTSSessionEnd ( sessionID, "normal end" );
if( MSP_SUCCESS != ret )
{
printf( "QTTSSessionEnd failed, error code is: %d", ret );
}
.
int MSPAPI QTTSGetParam (const char * sessionID,
const char * paramName,
char * paramValue,
unsigned int * valueLen
)
获取当前语音合成信息,如当前合成音频对应文本结束位置、上行流量、下行流量等。
参数
sessionID[in]
由QTTSSessionBegin返回的句柄,如果为NULL,获取MSC的设置信息。
paramName[in]
参数名,一次调用只支持查询一个参数。参数如下:
在线/离线业务 | 参数名称 | 意义 |
---|---|---|
在线 | sid | 服务端会话ID,长度为32字节 |
在线 | upflow | 上行数据量。 |
在线 | downflow | 下行数据量 |
通用 | ced | 当前合成音频对应文本结束位置 |
paraValue[in/out]
输入:buffer首地址
输出:向该buffer写入获取到的信息
valueLen[in/out]
输入:buffer的大小
输出:信息实际长度(不含'\0')
返回
函数调用成功则其值为MSP_SUCCESS,否则返回错误代码,详见错误码列表。
备注
以查询上行流量为例,获取到的是本次合成当前累计的上行流量。下行流量查询与此相似。
参见
const char* para_name = "upflow";
char para_value[ 32 ] = {'\0'};
unsigned int value_len = 32;
int ret = QTTSGetParam ( sessionID, para_name, para_value, &value_len );
if( MSP_SUCCESS != ret )
{
printf( "QTTSGetParam failed, error code is: %d", ret );
}
.
语音评测(iFLY Speech Evaluation Header File)
类型 | 说明 |
---|---|
const char *MSPAPI | QISESessionBegin(const char *params, const char *userModelId, int *errorCode) 开始一次语音评测。 |
int MSPAPI | QISETextPut(const char *sessionID, const char *textString, unsigned int textLen, const char *params) 写入待评测的文本。 |
int MSPAPI | QISEAudioWrite (const char *sessionID, const void *waveData, unsigned int waveLen, int audioStatus, int *epStatus, int *Status) 写入本次评测的音频。 |
const char *MSPAPI | QISEGetResult(const char *sessionID, unsigned int *rsltLen, int *rsltStatus, int *errorCode) 获取评测结果。 |
int MSPAPI | QISESessionEnd(const char *sessionID, const char *hints) 结束本次语音评测。 |
语音评测(iFLY Speech Evaluation Header File)
This file contains the quick application programming interface (API) declarations of evaluation. Developer can include this file in your project to build applications. For more information, please read the developer guide.
Use of this software is subject to certain restrictions and limitations set forth in a license agreement entered into between iFLYTEK, Co,LTD. and the licensee of this software. Please refer to the license agreement for license use rights and restrictions.
Copyright (C) by iFLYTEK, Co,LTD. All rights reserved.
const char* MSPAPI QISESessionBegin(const char * params,
const char * userModelId,
int * errorCode
)
开始一次语音评测。
参数
params[in]
传入的参数列表,支持以下参数:
格式说明:每个参数和参数值通过key=value的形式组成参数对;如果有多个参数对,再用逗号进行拼接,如:key_1=value_1,key_2=value_2
注意:每个参数(key)和参数值(value)均不得含有逗号(,)和等号(=),否则会被截断
参数 | 参数说明 | 值 |
---|---|---|
sub | 本次评测请求的类型 | ise |
aue | 音频编码格式和压缩等级 | 编码算法:raw;speex;speex-wb;ico 编码等级:raw:无等级。speex系列:0-10; 默认为speex-wb;7 speex-wb对应audio/L16;rate=16000 ico对应audio/L16;rate=16000 |
auf | 音频格式 | audio/L16;rate=16000 默认为audio/L16;rate=16000 |
rse | 评测结果字符串所用编码格式 | gb2312 |
vad_timeout | 允许头部静音的最长时间 | 0-10000毫秒。默认为10000 如果静音时长超过了此值,则认为用户此次无有效音频输入。此参数仅在打开VAD功能时有效。 |
vad_speech_tail | 允许尾部静音的最长时间 | 0-10000毫秒。默认为2000 如果尾部静音时长超过了此值,则认为用户音频已经结束,此参数仅在打开VAD功能时有效。 |
vad_enable | VAD功能开关 | 是否启用VAD 默认为开启VAD 0(或false)为关闭 |
category | 评测类型 | read_syllable(当language=en_us时,不支持) read_word read_sentence |
language | 评测语言 | zh_cn:简体中文 en_us:英语 默认为zh_cn |
注意:没有默认值的参数必须由外部设定其值
userModelId[in]
此参数保留,传入NULL即可。
errorCode[out]
函数调用成功则其值为MSP_SUCCESS,否则返回错误代码,详见错误码列表。
返回
函数调用成功返回字符串格式的sessionID,失败返回NULL。sessionID是本次评测的句柄。
备注
参数只在当次评测中生效.
参见
const char * params = "sub=ise,category=read_syllable,language=zh_cn,aue=speex-wb;7,auf=audio/L16;rate=16000";
int ret = 0;
const char* sessionID = QISESessionBegin( params,NULL,&ret );
if( MSP_SUCCESS != ret )
{
printf( "QISESessionBegin failed, error code is: %d", ret );
}
.
int MSPAPI QISETextPut(const char * sessionID,
const char * textString,
unsigned int textLen,
const char * params
)
写入待评测的文本。
参数
sessionID[in]
由QISESessionBegin返回的句柄。
textString[in]
字符串指针。指向待评测的文本字符串。
textLen[in]
评测文本长度。
params[in]
本次评测所用的参数,只对本次评测的文本有效。
返回
函数调用成功返回MSP_SUCCESS,否则返回错误代码。详见错误码列表。
参见
const char* src_text = “科大讯飞股份有限公司”;
unsigned int text_len = strlen(src_text); //textLen参数为评测文本所占字节数
int ret = QISETextPut( sessionID, src_text, text_len, NULL );
if( MSP_SUCCESS != ret )
{
printf( QISETextPut failed, error code is: %d”, ret );
}
.
int MSPAPI QISEAudioWrite(const char * sessionID,
const void * waveData,
unsigned int waveLen,
int audioStatus,
int * epStatus,
int * Status
)
写入本次评测的音频。
参数
sessionID[in]
由QISESessionBegin返回的句柄。
waveData[in]
音频数据缓冲区起始地址。
waveLen[in]
音频数据长度,单位字节。
audioStatus[in]
用来告知MSC音频发送是否完成,典型值如下:
枚举常量 | 描述 |
---|---|
MSP_AUDIO_SAMPLE_FIRST = 1 | 第一块音频 |
MSP_AUDIO_SAMPLE_CONTINUE = 2 | 还有后继音频 |
MSP_AUDIO_SAMPLE_LAST = 4 | 最后一块音频 |
epStatus[out]
端点检测(End-point detected)器所处的状态,可能的值如下:
枚举常量 | 描述 |
---|---|
MSP_EP_LOOKING_FOR_SPEECH = 0 | 还没有检测到音频的前端点 |
MSP_EP_IN_SPEECH = 1 | 已经检测到了音频前端点,正在进行正常的音频处理 |
MSP_EP_AFTER_SPEECH = 3 | 检测到音频的后端点,后继的音频会被MSC忽略 |
MSP_EP_TIMEOUT = 4 | 超时 |
MSP_EP_ERROR = 5 | 出现错误 |
MSP_EP_MAX_SPEECH = 6 | 音频过大 |
注意:当epStatus大于等于3时,用户应当停止写入音频的操作,否则写入MSC的音频会被忽略。
recogStatus[out]
评测器返回的状态,提醒用户及时开始\停止获取评测结果。典型值如下:
枚举常量 | 描述 |
---|---|
MSP_REC_STATUS_SUCCESS = 0 | 评测成功,有评测结果返回 |
MSP_REC_STATUS_NO_MATCH = 1 | 评测结束,没有评测结果 |
MSP_REC_STATUS_INCOMPLETE = 2 | 正在评测 |
MSP_REC_STATUS_COMPLETE = 5 | 评测结束,有评测结果返回 |
返回
函数调用成功返回MSP_SUCCESS,否则返回错误代码,详见错误码列表。
备注
本接口需不断调用,直到音频全部写入为止。上传音频时,需更新audioStatus的值。具体来说:
当写入首块音频时,将audioStatus置为MSP_AUDIO_SAMPLE_FIRST
当写入最后一块音频时,将audioStatus置为MSP_AUDIO_SAMPLE_LAST
其余情况下,将audioStatus置为MSP_AUDIO_SAMPLE_CONTINUE
同时,需定时检查两个变量:epStatus和rsltStatus。具体来说:
当epStatus显示已检测到后端点时,MSC已不再接收音频,应及时停止音频写入
当rsltStatus显示有评测结果返回时,即可从MSC缓存中获取结果
参见
char audio_data[5120] ={'\0'};
unsigned int audio_len = 0;
int audio_status = 2;
int ep_status = 0;
int rec_status = 0;
int ret = 0;
while(MSP_AUDIO_SAMPLE_LAST != audio_status )
{
// 读取音频到缓冲区audio_data中,设置音频长度audio_len,音频状态audio_status。
ret = QISEAudioWrite( sessionID, audio_data, audio_len, audio_status, &ep_status, &rec_status );
if( MSP_SUCCESS != ret )
{
printf( "QISEAudioWrite failed, error code is: %d", ret );
break;
}
else if(MSP_EP_AFTER_SPEECH == ep_status )//检测到音频后端点,停止写入音频
{
printf( "end point of speech has been detected!" );
break;
}
//如果是实时采集音频,可以省略此操作。5KB大小的16KPCM持续的时间是160毫秒
Sleep( 160 );
}
.
const char* MSPAPI QISEGetResult(const char * sessionID,
unsigned int * rsltLen,
int * rsltStatus,
int * errorCode
)
获取评测结果。
参数
sessionID[in]
由QISESessionBegin返回的句柄。
rsltLen[out]
评测结果长度,单位字节。
rsltStatus[out]
评测结果的状态,其取值范围和含义请参考QISEAudioWrite的参数recogStatus。
errorCode[out]
函数调用成功返回MSP_SUCCESS,否则返回错误代码,详见错误码列表。
返回
函数执行成功且有评测结果时,返回结果字符串指针;其他情况(失败或无结果)返回NULL。
备注
当写入音频过程中已经有部分评测结果返回时,可以获取结果。在音频写入完毕后,用户需反复调用此接口,直到评测结果获取完毕(rlstStatus值为5)或返回错误码。
注意:如果某次成功调用后暂未获得评测结果,请将当前线程sleep一段时间,以防频繁调用浪费CPU资源。
参见
char rslt_str[2048] ={'\0'};
const char* rec_result = NULL;
int rslt_status = 0;
int rsltLen = 0;
int ret = 0;
while(MSP_REC_STATUS_COMPLETE != rslt_status )
{
rec_result = QISEGetResult ( sessionID, &rsltLen, &rslt_status, &ret );
if( MSP_SUCCESS != ret )
{
printf( "QISEGetResult failed, error code is: %d", ret );
break;
}
if( NULL != rec_result )
{
strcat( rslt_str, rec_result );//用户可以用其他的方式保存评测结果
continue;
}
//sleep一下很有必要,防止MSC端无缓存的评测结果时浪费CPU资源
Sleep( 200 );
}
.
int MSPAPI QISESessionEnd(const char * sessionID,
const char * hints
)
结束本次语音评测。
参数
sessionID[in]
由QISESessionBegin返回的句柄。
hints[in]
结束本次语音评测的原因描述,为用户自定义内容。
返回
函数调用成功返回MSP_SUCCESS,否则返回错误代码,详见错误码列表。
备注
本接口和QISESessionBegin对应,调用此接口后,该句柄对应的相关资源都会被释放,用户不应再使用该句柄。
参见
int ret = QISESessionEnd ( sessionID, "normal end" );
if( MSP_SUCCESS != ret )
{
printf( "QISESessionEnd failed, error code is: %d", ret );
}
sessionID = NULL;
语音唤醒(iFLY Speech Voice Wakeup Header File)
类型 | 说明 |
---|---|
const char *MSPAPI | QIVWSessionbegin(const char *grammarList, const char *params, int *errorCode)开始唤醒功能,并在参数中指定唤醒(唤醒+识别时)用到的语法列表,本次唤醒所用的参数等。 |
int MSPAPI | QIVWSessionEnd(const char *sessionID, const char *hints)结束本次语音唤醒。 |
int MSPAPI | QIVWAudioWrite(const char *sessionID, const void *audioData, unsigned int audioLen, int audioStatus)写入本次唤醒的音频,本接口需要反复调用直到音频写完为止。 |
int MSPAPI | QIVWRegisterNotify(const char *sessionID, ivw_ntf_handler msgProcCb, void *userData)注册回调。 |
语音唤醒(iFLY Speech Voice Wakeup Header File)
This file contains the quick application programming interface (API) declarations of IVW. Developer can include this file in your project to build applications. For more information, please read the developer guide.
Use of this software is subject to certain restrictions and limitations set forth in a license agreement entered into between iFLYTEK, Co,LTD. and the licensee of this software. Please refer to the license agreement for license use rights and restrictions.
Copyright (C) by iFLYTEK, Co,LTD. All rights reserved.
const char* MSPAPI QIVWSessionBegin(const char * grammarList,
const char * params,
int * errorCode
)
开始唤醒功能,本次唤醒所用的参数等。
参数:
grammarList[in]
保留参数,设置为NULL即可。
params[in]
参见下表:
格式说明:每个参数和参数值通过key=value的形式组成参数对;如果有多个参数对,再用逗号进行拼接,如:key_1=value_1,key_2=value_2
注意:每个参数(key)和参数值(value)均不得含有逗号(,)和等号(=),否则会被截断
参数 | 参数说明 | 是否必要 |
---|---|---|
sst | 业务类型。唤醒业务类型,可以设置如下参数: wakeup:语音唤醒(默认) oneshot:唤醒加识别 | 是 |
ivw_threshold | 唤醒词门限。 设置格式如下: id0:xx;id1:xx;….。 示例:0:1450;1:1450表示设置第一个唤醒词的门限值为1450,第二个唤醒的门限值是1450,门限值越低越容易唤醒成功。 注意:建议唤醒引擎门限值设为1450,且取值范围为非负数,一般可在0-3000之间调节。 | 否 |
ivw_shot_word | 音频是否包含唤醒词。 用于唤醒加识别时场景,将音频送入识别引擎时是否包含唤醒词音频: 0:不包含,1:包含(默认) | 否 |
errorCode[out]
函数调用成功则其值为MSP_SUCCESS,否则返回错误代码,详见错误码列表。
返回
函数调用成功返回字符串格式的sessionID,失败返回NULL。sessionID是本次唤醒的句柄。
备注
参数只在当次唤醒中生效。
参见:
const char* params = "ivw_threshold=0:1450, ivw_res_path =fo|res/ivw/wakeupresource.jet";
int ret = 0;
const char* sessionID = QIVWSessionBegin( NULL, params, &ret );
if( MSP_SUCCESS != ret )
{
printf( "QIVWSessionBegin failed, error code is: %d", ret );
}
.
int MSPAPI QIVWSessionEnd(const char * sessionID,
const char * hints
)
结束本次语音唤醒。
参数:
sessionID[in]
由QIVWSessionBegin返回的句柄。
hints[in]
结束本次语音唤醒的原因描述,为用户自定义内容。
返回
函数调用成功则其值为MSP_SUCCESS,否则返回错误代码,详见错误码列表。
备注
本接口和QIVWSessionBegin 对应,用来本次语音唤醒。调用此接口后,该句柄对应的相关资源(参数、语法、音频、实例等)都会被释放,用户不应再使用该句柄。
参见:
int ret = QIVWSessionEnd ( sessionID, "normal end" );
if( MSP_SUCCESS != ret )
{
printf( "QIVWSessionEnd failed, error code is: %d", ret );
}
.
int MSPAPI QIVWAudioWrite(const char * sessionID,
const void * audioData,
unsigned int audioLen,
int audioStatus
)
写入本次唤醒的音频,本接口需要反复调用直到音频写完为止。
参数:
sessionID[in]
由QIVWSessionBegin返回的句柄。
audioData[in]
音频数据缓冲区起始地址。
audioLen[in]
音频数据长度,单位字节。
audioStatus[in]
用来告知MSC音频发送是否完成,典型值如下:
枚举常量 | 简介 |
---|---|
MSP_AUDIO_SAMPLE_FIRST = 1 | 第一块音频 |
MSP_AUDIO_SAMPLE_CONTINUE = 2 | 还有后继音频 |
MSP_AUDIO_SAMPLE_LAST = 4 | 最后一块音频 |
paramValue[in]
参数值。
返回
函数调用成功则其值为MSP_SUCCESS,否则返回错误代码,详见错误码列表。
备注
调用本接口时,推荐用户在写入音频时采取"边录边写"的方式,即每隔一小段时间将采集到的音频通过本接口写入MSC。
参见:
char audio_data[ 5120 ] ={'\0'};
unsigned int audio_len = 0;
int audio_status = 2;
int ret = 0;
while(MSP_AUDIO_SAMPLE_LAST != audio_status )
{
// 读取音频到缓冲区audio_data 中,设置音频长度audio_len,音频状态audio_status。
ret = QIVWAudioWrite( sessionID, audio_data, audio_len, audio_status);
if( MSP_SUCCESS ! = ret )
{
printf( "QIVWAudioWrite failed, error code is: %d", ret );
break;
}
}
.
int MSPAPI QIVWRegisterNotify(const char * sessionID,
ivw_ntf_handler msgProcCb,
void * userData
)
注册回调。
参数:
sessionID[in]
由QIVWSessionBegin返回的句柄。
msgProcCb[in]
注册通知的回调函数,唤醒结果将在此注册回调中返回。格式为:typedef int( *ivw_ntf_handler)( const char *sessionID, int msg,int param1, int param2, const void *info, void *userData );参数说明:
参数 | 说明 |
---|---|
sessionID | 由QIVWSessionBegin返回的句柄。 |
msg | MSP_IVW_MSG_WAKEUP=1 唤醒消息,在info中给出唤醒结果缓存首地址,param2 给出唤醒结果的长度。 MSP_IVW_MSG_ERROR=2 出错通知消息,在param1 中给出错误码。 MSP_IVW_MSG_ISR_RESULT=3 唤醒+识别结果消息,在info 中给出识别结果缓存首地址,param2 给出识别结果的长度。param1 中给出给出结果状态,结果状态值参见QISRAudioWrite接口中结果状态说明。 MSP_IVW_MSG_ISR_EPS=4 唤醒+识别结果中vad 端点检测消息,param1 给出端点检测状态,状态值参见QISRAudioWrite接口中端点检测状态说明。 |
param1 | 参见msg 消息说明 |
param2 | 参见msg 消息说明 |
info | 参见msg 消息说明,主要内容包括sst,id,score,bos,eos等 |
sst | 本次业务标识:wakeup 表示语音唤醒;enroll 表示唤醒词训练(当前版本不支持) |
id | 当前唤醒词的id |
keyword | 当前唤醒词。注:中文唤醒词返回的是拼音,例:ding1dong1ding1dong1 |
score | 当前唤醒得分 |
bos | 当前唤醒音频的前端点 |
eos | 当前唤醒音频的尾端点 |
userData | 用户数据 |
userData[in]
用户数据。
返回
函数调用成功则其值为MSP_SUCCESS,否则返回错误代码,详见错误码列表。
备注
通过此函数注册回调函数到msc。如果唤醒成功,msc 调用回调函数通知唤醒成功息同时给出相应唤醒数据。如果出错,msc 调用回调函数给出错误信息。
参见:
int cb_ivw_msg_proc( const char *sessionID, int msg, int param1, int param2, const void *info,void *userData )
{
if (MSP_IVW_MSG_ERROR == msg) //唤醒出错消息
{
printf("\n\nMSP_IVW_MSG_ERROR errCode = %d\n\n", param1);
}
else if (MSP_IVW_MSG_WAKEUP == msg) //唤醒成功消息
{
printf("\n\nMSP_IVW_MSG_WAKEUP result = %s\n\n", info);
}
return 0;
}
err_code = QIVWRegisterNotify(sessionID, cb_ivw_msg_proc,NULL);
if (err_code != MSP_SUCCESS)
{
printf("QIVWRegisterNotify failed! error code:%d\n",err_code);
}
.