产品优势
-
业界先进地位印刷文字识别准确率业界先进,提供稳定可靠的服务
-
复杂场景支持支持扫描体以及复杂自然场景下的文字识别
-
接入简单便捷提供restful API接口,可供开发者进行跨平台调用
应用场景
-
资料存档/处理将图片资料中的文字进行提取,为后续的数据后处理提供(如检索,翻译等)基础
-
辅助教学将纸质教程中的内容转化为可编辑并快速传播的文字,实现智能化高效率的教学
-
卡证信息提取将卡证,如身份证、行驶证、驾驶证、银行卡、营业执照等证件中的关键信息提取出来
客户案例
-
咪咕灵犀,是一款中文人工智能助手。在翻译功能模块,接入了讯飞开放平台的ocr与翻译能力,提供图片中文字的识别与翻译能力。
左图中,咪咕灵犀正确识别出图片中指定区域内的印刷字体内容,即“Let the World Enjoy the Fun of AI"。
产品价格
开发者资源
-
Web API
疑问解答
-
支持的语言?
-
支持英文、中文或中英混合
-
是否支持方向有旋转的文字?
-
支持文字与水平轴小于±15°夹角偏转
-
输入图片要求?
-
(1)像素要求:最短边至少15px,最长边最大4096px
(2)大小要求:<4MB
(3)格式要求:JPEG,PNG,BMP
-
结果给出的位置信息形式为?
-
支持给出精确到行的位置信息,形式为:左上角和右下角顶点的像素坐标
-
图片中只有一两个汉字的情况,识别困难,为什么?
-
对于单个汉字,尤其是单个汉字面积占比大的情况下,识别效果偏弱。持续优化效果中,敬请期待