高效学习的语音识别与理解
项目概况
- 成果名称:高效学习的语音识别与理解 本成果包括智能语音识别 与理解的全栈——语音识别,自然语言理解,自然语言生成,语音 合成,远场语音增强,声纹识别,语音情感识别。曾多次赢得技术 评测,与 Intel、IBM、Panasonic、Toshiba 等合作研发,并多次 获得学术会议优秀论文。 本成果包括使用训练好的模型完成语音 识别和理解的任务,包括音频片段切分、话者分离和标识、语音识 别与理解、问答对话、语速判断、关键词定位、情绪判断。本成果 还包括声学模型和语言模型的训练,这样能针对特定任务和场景来 训练和优化新模型;通过数据增强,语音特征归一化等技术,提升 在噪声环境下的识别效果;通过半监督学习模型与算法提高机器的 学习效率。目前成果已经封装成软件开发包(SDK)支持私有化部 署,也可通过 webAPI 方式进行云端调用。 语音是人类交流的重 要载体,智能语音识别与理解技术辐射面非常广阔,蕴含巨大市场 价值。随着技术的逐步成熟,语音市场需求在不断膨胀,应用场景 在不断扩大。相关行业应用大致分为 2B/2G 和 2C 两个方向。2B/2G 的代表领域包括呼叫中心、广电、安防、医疗、金融、教育等。2C 的代表领域包括智能家居、智能车载、可穿戴设备、无人驾驶、虚 拟助理、家庭机器人等。
团队介绍
Copyright @ 2019 新乡科技服务中心 豫ICP备19023816号