新乡科技服务中心

首页　/　全部分类　/　　/　

高效学习的语音识别与理解

项目详情

项目概况
成果名称：高效学习的语音识别与理解本成果包括智能语音识别与理解的全栈——语音识别，自然语言理解，自然语言生成，语音合成，远场语音增强，声纹识别，语音情感识别。曾多次赢得技术评测，与 Intel、IBM、Panasonic、Toshiba 等合作研发，并多次获得学术会议优秀论文。本成果包括使用训练好的模型完成语音识别和理解的任务，包括音频片段切分、话者分离和标识、语音识别与理解、问答对话、语速判断、关键词定位、情绪判断。本成果还包括声学模型和语言模型的训练，这样能针对特定任务和场景来训练和优化新模型；通过数据增强，语音特征归一化等技术，提升在噪声环境下的识别效果；通过半监督学习模型与算法提高机器的学习效率。目前成果已经封装成软件开发包（SDK）支持私有化部署，也可通过 webAPI 方式进行云端调用。语音是人类交流的重要载体，智能语音识别与理解技术辐射面非常广阔，蕴含巨大市场价值。随着技术的逐步成熟，语音市场需求在不断膨胀，应用场景在不断扩大。相关行业应用大致分为 2B/2G 和 2C 两个方向。2B/2G 的代表领域包括呼叫中心、广电、安防、医疗、金融、教育等。2C 的代表领域包括智能家居、智能车载、可穿戴设备、无人驾驶、虚拟助理、家庭机器人等。
团队介绍
服务成果

咨询

建议

咨询电话

0373-3537026
在线聊天，为您解惑

项目概况

团队介绍

服务成果