智能语音技术的研究是以语音识别技术为开端,可以追溯到20世纪50年代,其发展历程可分为四个阶段:技术萌芽阶段、技术突破阶段、产业化阶段、快速应用阶段。
智能语音产业结构分为三层,上游基础层包括芯片、模组、传感器以及云计算服务和大数据平台等;中游技术层主要提供语音识别、语音合成、深度/机器学习、人机交互等技术研究和服务;下游应用场景广阔,覆盖智能家居、金融、教育、安防、客服等场景,涉及B端和C端用户主体。
在智能语音关键技术层中,语音识别、自然语义理解和语音合成居于重要地位,是人机交互技术的基础。
技术 |
释义 |
语音识别(ASR) |
语音识别是以语音为研究对象,通过语音信号处理和模式识别让机器自动识别和理解人类口述的语言,语音识别技术就是让机器通过识别和理解过程,把语音信号转变为相应的文本或命令的高技术。语音识别系统构建过程整体上包括两大部分:训练和识别。 |
自然语义处理(NLP) |
语义识别主要基于大数据和算法模型之上搭建,是自然语言处理 (NLP)技术的重要组成部分。NLP技术主要包括词法分析技术、句法分析技术、语义分析技术、语用分析技术以及语句分析技术等。NLP在实际应用中最大的困难还是语义的复杂性,随着大数据、芯片和算法模型等的发展进程加速,将为NLP带来长足的进步。 |
语音合成(TTS) |
语音合成,又称文语转换(Text to Speech)技术,能将任意文字信息实时转化为标准流畅的语音并朗读出来,相当于给机器装上了一个嘴巴,它涉及到声学、语言学、数字信号处理、计算机科学等多个学科技术,是人工智能信息处理领域的一项前沿技术,解决的主要问题就是如何将文字信息转化为可听的声音信息。语音合成和语音识别技术是实现人机语音通话所必需的两项关键技术,使机器具有类似于人一样的说话能力。 |
作为人工智能技术中成熟度较高的应用,我国智能语音行业市场规模维持较为稳定的中高速增长,2019年我国智能语音市场规模达121.7亿元,同比增长15.14%。预计未来两年我国智能语音市场规仍将保持25%以上的增速,2021年市场规模有望逼近200亿元。
从产品细分结构来看,随着交互类产品的市场逐渐饱和,我国语音识别市场规模增速将放缓。而随着教育、金融等行业的的交互需求释放,语义理解市场规模将快速增长,预计2021年语义理解市场规模达94.5亿元。
预计未来两年,我国智能语音区域结构的总体格局基本保持不变,仍以华东、华北和中南地区为主,2021年预计三地市场规模分别达46.7亿元、40.8亿元、64.7亿元。
从市场应用结构来看,未来两年我国智能语音市场应用仍集中在消费电子领域,预计到2021年,智能语音在消费电子行业的市场规模将达到56.5亿元。
以上数据资料参考《2020年中国智能语音产业分析报告-行业竞争格局与未来趋势研究》。
【版权提示】观研报告网倡导尊重与保护知识产权。未经许可,任何人不得复制、转载、或以其他方式使用本网站的内容。如发现本站文章存在版权问题,烦请提供版权疑问、身份证明、版权证明、联系方式等发邮件至kf@chinabaogao.com,我们将及时沟通与处理。