人工智能 考研(人工智能考研考哪些科目)




人工智能 考研,人工智能考研考哪些科目

(1)人工智能语音语言行业基本概述

1)定义 人工智能语音语言技术即实现人与机器以语

言为纽带的信息处理技术,人机对话通过对声音信号的音频采集与信号处理将语音转化为文字供机器处理,在机器进行语音识别与语义理解后、再进行对话管理、自然语言生成并通过语音合成技术将文本语言转化为声音进行输出,最终形成完整的人机语音语言交互。

2)发展历程

1952 年,AT&T 贝尔实验室成功研究出世界上第一个语音识别系统 Audry,标志着智能语音语言技术发展的开始。至今智能语音语言技术已经历经了近 70年的发展,经历了技术萌芽期、起步期、变革式发展期、落地可用期共四个发展阶段。

技术萌芽期(1950s-1970s):Audry 作为第一个语音识别系统,可以识别10个英文数字发音,该系统基于简单的模板匹配方法识别个体说出的孤立数字,在此之后,连续语音识别系统开始出现。语音合成的参数合成法能生成比较自然的语音。同一时代,以有限自动机和正则匹配理论为基础的文字处理技术出现。以乔姆斯基的文法和句法结构为代表的理性主义方法,和以香农信息论为代表的经验主义方法都发展起来。出现了一些极为简单的翻译、问答和聊天系统,但都无法实用。

起步期(1980s-2011):在此阶段初期,随着算法模型以及微电子技术的发展,语音识别领域取得了突破性进展。隐马尔科夫模型(HMM)逐渐成熟和不断完善,开始成为语音识别的主流方法,语音识别转向基于概率统计建模的方法,同时神经网络在语音识别中的应用研究兴起。此后语音识别技术逐渐走向实用化,许多具有代表性的产品问世,例如 IBM 研发的 ViaVoice 系统,Dragon 公司研发的 DragonDictate 系统,都具有更好的自适应性,能够在使用过程中不断提高识别准确率。

2009 年,Hinton 将深度神经网络(DNN)应用于语音的声学建模,取得了在语音识别方面的重大突破,使语音识别的准确性得到显著改善。与语音技术基本同步,这一时期的自然语言处理技术的发展,也出现了数据驱动的统计模型逐渐占据主流地位的趋势。从概率模型到支持向量机,从线性分类器到神经网络,大量数据驱动的技术被应用到自然语言处理领域,产生了一系列重大成果。这一阶段中,理解、翻译、问答、对话系统等都在限定的范围内逐步实用化。

变革式发展期(2011-2016):2011 年,微软研究院又将 DNN 技术应用在大词汇量连续语音识别任务上,极大地降低了语音识别错误率。2016 年,微软AI 团队在产业标准 Switchboard 语音识别任务上,取得了当时产业中最低的 5.9%的词错率(WER),5.9%的词错率等同于专业速录员速记同样一段对话的水平,这代表着机器的语音识别准确率第一次达到人类水平,智能语音语言技术开始逐步落地。这一时期中,以连续词向量、循环神经网络语言模型为代表的一系列深度学习技术,进一步大幅推动了自然语言处理技术的发展,复杂场景下的自然语言处理的性能显著改善。

落地可用期(2016-至今):端到端的语音识别开始广泛应用,准确率进一步提升,且针对远场的语音识别和唤醒得到进一步发展,全双工语音交互开始出现。此阶段语音识别的准确率可达 98%以上,且能根据实际应用痛点针对性优化。大数据驱动的预训练语言模型的出现,使得自然语言处理技术在这一阶段又上了

一个台阶,众多小数据、跨领域的迁移学习技术也应运而生,自然语言处理的技术覆盖范围进一步加强,在产业中得到广泛深入使用。

数据来源:《2020 年中国智能语音行业研究报告》(艾瑞咨询)

(2)人工智能语音语言市场的产业链情况

人工智能语音语言市场的产业链可依据关键技术拆分为六大环节,各个环节又可以进一步归集为声学、语音感知、语言认知三大模块。音频采集与信号处理环节是智能语音语言交互的起点,当前的核心在于回声消除、噪声消除、声源分离、提升远场和复杂声学环境下语音唤醒和识别的准确率等关键技术;语音识别是把语音信号转变为相应的文本或音频类别的过程,当前的核心在于声纹技术、口音适应能力、情绪识别能力、端到端识别、低功耗识别等;

语义理解是通过自然语言处理等方式使机器理解语言的过程,当前的核心在于口语语义理解问题、对话关键信息抽取、知识提取及结构化等;而对话管理是以多轮交互为核心的一系列自然语言认知技术的综合,是人机对话系统中的理解、决策和知识中枢,当前的核心在于实现多模态、全双工交互,增强机器在多任务、全场景、全领域的灵活对话能力;知识图谱是现实世界知识的一种表达方式,当前的核心在于知识图谱构建、问答推理等;语音合成即从文本到语音,让机器具备“说话”的能力,当前的核心在于使机器能够实现自然声音、高表现力、小数据复刻转换,以及方言及多语种的语音表达。

人工智能语音语言行业内的大部分公司只专注于产业链的单个或部分环节,少有公司能拥有覆盖产业链各环节的技术、产品与服务,当前国内人工智能语音语言行业的公司大约有 400 余家,仅有极少数可以实现全产业链覆盖。

(3)人工智能语音语言行业行业结构与市场规模

1)行业结构

图:中国智能语音市场细分应用领域(2030)

数据来源:《2021 年中国智能语音市场分析》(iResearch&德勤)

据德勤 2021 年的研究,在大环境需求的催化下,各行业智能化应用迎来需求拐点,进入需求爆发期。预计 2030 年消费级应用场景总的发展空间将超过 700亿元。智能家居、智慧驾驶、智能办公等企业级场景加速发展,市场需求不断扩大,发展空间预计即将达到千亿规模。

2)市场规模

智能语音语言技术使得人类的生产及生活方式逐步改变,基于智能语音语言技术的人机交互产品在接收用户的声音等信息后,能将用户意图转换为机器可以理解和进一步处理的内容,从而帮助用户解决问题或完成特定任务。其中,对话式机器人可以降低人力成本,减轻人工工作量,提高工作效率,解决用户客服、营销、质检、呼入、呼出等需求;搭载人机对话交互功能的消费级智能硬件,例如智能家电、智能车载、智能可穿戴设备等,能够通过语音语言交互的方式,提供更丰富的设备交互功能,提升设备操控便捷性。根据德勤 2021 年末发布的《中国智能语音市场分析》,2021 年中国智能语音市场规模将达到 285 亿元,较 2020年的 217 亿元增长 31.34%,预计在 2030 年市场规模将达到 1,452 亿元。

智能家居是智能语音应用的主要领域之一,随着物联网、人工智能等技术的快速发展,智能语音在家居领域的应用将进一步提速。根据前瞻经济学人《2022年中国智能语音行业市场规模与发展前景分析-智能语音进入加速应用阶段》,2017-2021 年中国智能家居市场规模不断增长,2021 年预估突破 5,800 亿元,2022年将超过 6,500 亿元,将带动智能语音市场的持续提升。

根据前瞻产业研究院《2020 年中国智能语音行业市场竞争格局及发展前景分析-未来将市场规模保持稳步增长》,2020 年我国智能语音在消费电子领域的应用市场规模达到 43.6 亿元,占比近 1/3。未来消费电子仍然是智能语音占比最高的行业领域,2021 年智能语音在消费电子行业的市场规模达到约 56.5 亿元,增长率约为 30%。

根据艾瑞咨询研究院的《2021 年人工智能产业报告》,2021 年我国智能硬件的 AI 语音助手算法的产值已达到 34 亿元,预计 2026 年相关产值规模将达到155 亿元,2021 年至 2026 年的 CAGR 为 35.4%。

2020年中国智能网联车市场渗透率已经达到49%,根据IHS Markit的预测,2025 年中国智能网联车渗透率将超过 75%,进一步推动智能语音在汽车领域的应用。

根据沙利文的报告,2020 年中国智能客服行业市场规模约为 30.1 亿元,伴随智能化价值深化,2025 年中国智能客服市场规模预计将突破 100 亿元,5 年CAGR 达 35.8%,行业呈现快速增长态势。

编制:诸葛御 责任编辑:赵皋

来源: 思瀚产业研究院 思必驰

人工智能 考研(人工智能考研考哪些科目)

赞 (0)