(报告出品方/作者:浙商证券,程兵)
1 ChatGPT 火爆出圈,生成式 AI 商业化应用走向爆发前夕
1.1 AIGC 成本大幅下降,人工智能商业化进程拐点已现
我们认为以 ChatGPT 为代表的 AIGC 兴起,在内容创作成本、创作效率、模型计算 消耗、用户流量基础等维度实现了重大突破,有望推动 AI 商业化进程的大幅加速。
(1)AI 内容创作成本大幅降低且耗时更短,相较传统方式优势显著
目前 OpenAI 定价最高的文字模型达芬奇(基于 GPT-3)为每 750 词约 0.02 美元 (折合约 0.14 元人民币);而主打“AI 生成文案”的独角兽 Jasper 以类 SaaS 服务形式 收费,根据官网显示,每月生成 10 万字的价格约 82 美元,折合每 1000 字约 5.57 元人 民币,而阅文集团 2021 年内容成本为 17.74 亿元(每 750 字 37 元); 在图像生成领域,Open AI 透露其 DALL-E2 模型的图片智能编辑及生成服务的价 格,超过免费额度数量的图片收费为每 460 张图片 15 美元,折合每张图片约 0.22 元人 民币。目前国内外 AIGC 绘画创作平均耗时已达到分秒级,创作效率较人工优势明 显。
(2)AIGC 模型算力消耗快速下降,落地门槛降低有望驱动消费级应用出现
根据量子位报告显示,借助最新的 Colossal-AI 通用深度学习系统,AIGC 领域的 Stable Diffusion 模型训练过程中可最高节省约 5.6 倍的显存需求(从 64.5GB 大幅降低 到 11.6GB),未来有望采用消费级 GTX 3060 显卡实现模型运算功能,大幅降低 AI 商 业化应用的落地门槛。
(3)爆款应用快速积累用户流量,商业化条件已基本具备
ChatGPT 发布后日活用户数量快速突破千万。根据 ARK Invest 的测算,自 2022 年 11 月底至 2023 年 1 月下旬,不足两个月的时间内 ChatGPT 的日活数量已突破 1200 万。 使用者数量的爆炸式成长即反应出用户的尝试使用意愿强烈,未来嵌入到微软的业务生态 中也有望提升用户的工作效率,优化使用体验,创造更大的商业价值。
(4)国内外公司持续探索商业化路径,AIGC 生态有望加速形成
近日,OpenAI 推出 ChatGPT 付费订阅版 ChatGPT Plus,每月收费 20 美元,而包含 Synthesia、Jasper、runway 等 AIGC 初创公司相继推出细分领域的收费服务,未来 AIGC 产 业生态有望加速构建,并形成更加清晰的 AI 商业化应用路径。
1.2 应用场景丰富,AI 商业化空间前景广阔,建议关注三条投资主线
AIGC 推动人工智能商业化进程加速,有望打开千亿市场。德勤数据显示,2021 年中 国人工智能市场规模达 2058 亿元,预计到 2025 年将达到 5460 亿元,2021-2025 年复合增 长率约 27.63%。根据德勤预测,全球人工智能产业规模预计从 2017 年的 6900 亿美元增长 至 2025 年的 6.4 万亿美元,复合增长率达 32.10%。移动互联网时代带来的海量数据、模 型和算力的不断迭代,以及各类应用场景中的商业化尝试,为 AI 的商业化奠定了坚实基 础,未来有望加速释放人工智能产业动能。
人工智能商业化进程有望加速,建议重点关注三类公司选择投资标的。《20220-2023 中国人工智能计算力发展评估报告》中指出,未来随着自然语言处理、计算机视觉、AIGC 等细分技术的持续迭代,AI 应用将呈现场景应用深度和广度并行发展态势,以 AIGC 为代 表的生成式 AI 将在创作型工作(文本、图像视频创作)和预测、决策型工作中扮演更加重 要角色。我们建议围绕人工智能商业化的三大主线选择投资标的:(1)具备 AI 模型、算 法技术优势的科技公司;(2)具备对 AI 商业化实际应用场景理解和业务优势的厂商; (3)具备 AI 硬件优势的厂商;
(1)具备 AI 模型、算法研究实力优势的科技公司
我们梳理了人工智能发展史上出现的三次高潮(具体内容见本文第二章内容),总结出 人工智能发展遵循了“计算—知识—学习”三个阶段,在 AIGC 的推动下有望进入第四次 高潮,即“创造”阶段。人工智能从最早的科研主导(第一次、第二次 AI 浪潮),发展到 科技大厂参与研究(第三次 AI 浪潮),再到各细分场景公司深度参与 AI 商业化(未来), 模型和算法的迭代始终是核心主线,因此我们认为具备 AI 模型和算法的科研实力的科技 大厂未来有望在 AI 商业化浪潮中保持核心竞争优势。
(2)具备对 AI 商业化实际应用场景理解和业务优势的厂商
AIGC 推动人工智能在各类细分场景中的商业化尝试,《AIGC 人工智能生产内容行业 研究报告》指出,未来 AIGC 有望与传媒、电商、影视、金融等各行业深度融合,创造更 多的应用场景,大幅提高各行业的内容创作效率。
在未来 AI 商业化进程中,众多 AIGC 开源模型和算法平台的存在,导致在场景应用 中,单纯的技术和算法很难成为玩家的竞争壁垒。在细分场景中,AIGC 企业需要在业务 场景的深度理解、AI 赋能的一体化解决方案、行业深度绑定、业务闭环等领域持续提升竞 争力。因此我们建议关注各细分赛道中,现有业务具备竞争优势,且具备 AI 转型实力(场 景数据储备+AI 算法技术实力)的公司。
(3)具备 AI 硬件优势的厂商
AI 商业化对硬件要求仍然很高,算力作为数据加速处理的动力源泉,其重要性不言而 喻。AI 处理器芯片可以支持深度神经网络的学习和加速计算,相比于 GPU 和 CPU 拥有成 倍的性能提升,和极低的耗电水平。因此,我们认为围绕人工智能的硬件厂商也将有望受 益 AI 商业化的发展。
1.3 AIGC 应用有望从 B 端延伸至 C 端市场,空间广阔规模超两千亿
对标海外 AIGC 厂商商业模式进行测算,国内 2030 年 AIGC 市场空间超两千亿。根 据 Gartner《2021 年预测:人工智能对人类和社会的影响》,到 2025 年 AIGC 产生的数据将 占所有数据的 10%。我们对标海外 AIGC 厂商,如 Jasper.AI、Stability.AI 等公司的商业模 式,测算国内 2023 年、2025 年和 2030 年 AIGC 市场空间。 文字、图片渗透率有望快速提升,视频、直播等受限于技术迭代渗透率较慢。目前 AI 在文本和图像生成领域技术已且相对成熟,同时微软、百度等科技大厂有望将 AI 技术应用 到业务生态中,有望推动在线办公、搜索引擎等应用场景的渗透率提升。而在直播、影视 以及音视频等领域,由于 AI 生成技术处于初级阶段,且下游用户对内容要求较高,我们认 为短期内渗透率提升幅度较低。经测算,我们预计到 2025 年国内 AIGC 市场空间可达 403.52 亿元,到 2030 年市场空间可达 2175.58 亿元,未来几年市场有望迎来爆发式成长。
1.4 ChatGPT 面世即成顶流,性能持续提升商业化价值不断放大
ChatGPT 火爆出圈,可与真人流畅交流,标志生成式 AI 的突破性进展。2022 年 11 月 30 日,OpenAI 发布了对话式 AI 新模型 ChatGPT,该模型的功能包含了基于人机交互的 问题回答、文本写作以及代码编写等。ChatGPT 模型使用 Transformer 神经网络架构,通过 维基百科以及海量真实语料库的数据训练,实现了接近人类的交流水平。
ChatGPT 具备自我学习能力,面世以来性能仍在不断进步。2023 年 1 月 30 日, OpenAI 官方宣布 ChatGPT 通过新一轮的更新,在准确性和真实性上实现显著提升,并且 已经具备了比较基础的数学计算能力。经过使用者的测试,目前 ChatGPT 的数学计算能力 接近小学生水平,虽然相较其代码和文本写作相比差距甚远,但进步非常明显,ChatGPT 在数学领域的计算能力逐渐形成反映出模型的自我学习能力以及模型迁移能力出色。
微软计划推出一系列 AI 应用服务,ChatGPT 有望在实际应用中持续成长。2023 年 2 月 2 日,OpenAI 公司宣布推出付费试点订阅计划 ChatGPT Plus,定价每月 20 美元。付费 版功能包括高峰时段免排队、快速响应以及优先获得新功能和改进等。同时,OpenAI 方面 仍将提供对 ChatGPT 的免费访问权限。 新版搜索引擎发布,融合 OpenAI 核心技术。新版 Bing 带有 一个扩展的聊天框,它现在可以做的不仅仅是回答事实问题和为你提供各种链接,在 ChatGPT 的帮助下,它还能够为你即时生成各种个性化的规划、建议、分析等,解决更复 杂的搜索问题。
1.5 ChatGPT 以 GPT+RLHF 模型为核心支撑,为 AIGC 发展指明方向
ChatGPT 将海量训练数据与 Transformer 框架结合,在 GPT 模型的基础上通过 RLHF 模型提升交互聊天能力,实现了对自然语言的深度建模,Transformer 有望在未来 较长时间内成为 AIGC 语言领域的核心技术框架。 Transformer 架构为自然语言理解领域带来颠覆性变革,应用到 NLP、CV、生物、化 学等多领域。2017 年,谷歌跳出 RNN 和 CNN 的结构,提出了完全基于 Self-Attention 机 制的 Transformer 架构,当时在机器翻译任务上取得了颠覆性的进步。Transformer 由一个 编码器和一个解码器组成,且各自由若干个编码/解码模块堆叠而成,每个模块包含 MultiHead Attention 层、全连接层等功能不同的工作层。 Transformer 架构优势突出,计算效率、并行度、解释性均实现突破。相比于之前的 框架 Transformer 架构除了在计算的时间复杂度更优外,还有 3 大优势: (1)可直接计算点乘结果,并行度高:对于数据序列 x1,x2……xn ,self-attention 可 以直接计算任意两节点的点乘结果,而 RNN 必须按照顺序从 x1 计算到 xn。(2)一步计算,解决长时依赖问题:处理序列信息使,通常用要经过的路径长度衡量 性能,CNN 需要增加卷积层数来扩大视野,RNN 只能逐个进行计算,而 self-attention 只需 要一步矩阵计算就可以,更好地解决长时依赖问题。 (3)模型更可解释:self-attention 模型更可解释,attention 结果的分布可反映该模型 学习到了一些语法和语义信息。
RHFL 模型将预训练语言模型按照人类反馈进一步微调以符合人类偏好,利用人类反 馈信息直接优化模型。Open AI 采用了人类反馈强化学习(Reinforcement Learning from Human Feedback,RHFL)作为 ChatGPT 和核心训练方式,并称其是“能有效提升通用人工 智能系统与人类意图对齐的技术”。RLHF 的训练包括三个核心步骤: (1)预训练语言模型(也可以使用额外文本进行微调,监督微调新模型可以让模型更 加遵循指令提示,但不一定符合人类偏好)。 (2)对模型根据提示(prompt)生成的文本进行质量标注,由人工标注者按偏好从最 佳到最差进行排名,利用标注文本训练奖励模型,从而学习到了人类对于模型根据给定提 示生成的文本序列的偏好性。 (3)使用强化学习进行微调,确保模型输出合理连贯的文本片段,并且基于奖励模型 对模型输出的评估分数提升文本的生成质量。
2 推理-知识-学习-创造,AIGC 有望引领第四次人工智能浪潮
2.1 复盘三次人工智能浪潮,AI 从科研向细分产业生态加速渗透
复盘历史上的三次人工智能浪潮,AIGC 有望引领第四次浪潮。我们从数据、模型迭 代和参与者等维度梳理了过往三次人工智能浪潮。我们认为,历次浪潮可以总结为 AI 从 推理能力形成,向知识储备,再向自我学习能力的方向持续进步,未来有望进入到自我创 造的阶段。
2.1.1 第一次 AI 浪潮,对人类神经元机制的模拟实现机器推理能力
计算机的诞生催生学术界对人工智能的大规模探索,第一次 AI 浪潮来袭。1946 年第 一代电子计算机诞生,在这一阶段,冯·诺依曼结构为现代计算机的体系架构奠定基础, 而图灵机的思想论证了现代计算机的计算模式和计算能力,开启了人类在现代人工智能领 域不断探索的旅程。 冯·诺依曼模拟人类好大脑记忆存储与提取的工作机制,为计算机和人工智能奠定坚 实基础。上世纪 40 年代,冯·诺依曼提出了计算机的逻辑结构,其主要特点包含了程序以 二进制代码存放在存储器中、所有指令由操作码和地址码组成、指令在存储过程中按照执 行顺序进行存储等。冯·诺依曼结构将人类的神经系统与计算机结合在一起,大幅提升了 计算机的运算效率,为人工智能的发展提供了保障。
Rosenblatts 受生物神经网络启发,提出人工神经网络结构,成为现代神经网络和深度 学习的重要基础。感知机的工作原理可理解为生物神经网络中的信号作用,信号经过树突 传递到细胞核的过程中信号会发生变化。感知机在模型的“输入”位置添加神经元节点, 构成“输入单元”,向每一个属性指定一个权重 w,对属性值和权重的乘积求和,将结果 值与阈值比较,从而判定正负样本结果。但由于感知机模型只能解决线性问题,面对异或 问题时无能为力,也导致了第一次人工智能研究在上世纪 70 年代进入低潮期。
2.1.2 第二次 AI 浪潮,人工智能拥有知识储备,专家系统为代表性产物
20 世纪 80 年代,第二次人工智能浪潮到来,核心发展为让计算机学习大量专业知 识,研究人员将专家的知识、言论以及经验等数据输入到计算机,使其成为专家系统。专 家系统可以预测在一定条件下某种解的概率,由于当时计算机已有巨大容量,专家系统有 可能从数据中得出规律。在这一阶段,多层感知机、反向传播算法、神经网络的出现极大 程度地提升了计算机的计算及逻辑推理能力,为深度学习和强化学习模型奠定了重要基 础,同时专家系统的出现赋予了人工智能知识属性,并进行了一系列的商用尝试。
多层感知机强调模拟人类脑神经的复杂连接,使人工智能实现解决非线性问题的处理 能力。多层感知机可至少分成输入层、隐藏层和输出层这三层,隐藏层可根据需要建多层 且每层都可以有多个节点,相邻层的各个节点都互相连接。隐藏层和输出层具备计算加权 和激活函数处理的功能,实现数据信息的向前传递和分析。多层感知机的突破在于激活函 数的使用,在隐藏层中使用不同的激活函数可实现对数据的非线性化处理,使得 AI 具备 拟合任何连续函数的能力,大幅提升了计算机的计算能力。 1986 年,Geoffrey Hinton 等人先后提出了多层感知机(MLP)与反向传播(BP)训练 相结合的理念,将人类基于结果误差反馈反哺逻辑推理的思想融入 AI。BP 算法的基本思 想是用误差的导数(梯度)调整,并通过误差的梯度做反向传播,更新模型权重, 以下降 学习的误差,拟合学习目标。
第二次 AI 浪潮中,专家系统模拟人类专家的知识和经验解决特定领域的问题,实现 了人工智能从理论研究走向实际应用、从一般推理策略探讨转向运用专门知识的重大突 破。并且机器学习(特别是神经网络)探索不同的学习策略和各种学习方法,在大量的实 际应用中也开始慢慢复苏。 专家系统作为人工智能的重要分支,在这一时期逐步渗透到细分行业的实际场景解决 特定任务。第二次 AI 浪潮期间,专家系统应用到数学、物理、化学、医学、地质等细分 行业,能够辅助科研人员解决化学分子结构、疾病诊断、地质分析等特定任务。这一时期 专家系统的特点包含:(1)单学科的专业性;(2)系统结构完整,移植性好;(3)具有一 定的推理解释功能,透明性好;(4)采用启发式推理和不精确推理;(5)用产生式规则、 框架和语义网络表达知识;
专家系统商业价值显现,在企业生产决策过程中发挥重大作用。1980 年,美国卡耐基 梅隆大学与 DEC 公司合作研发的 XCON 专家系统,运用计算机系统配置的知识,依据用 户的定货,选出最合适的系统部件(如 CPU 型号、操作系统种类及相应型号,存储器和外 部设备等),并且能够给出优化意见以构成一个完整的系统。XCON 可以给出一个系统配 置的清单和这些部件装配关系的图,以便技术人员进行装配。在这一时期,除 DEC 公司 外,美国杜邦、通用汽车和波音等公司在也在生产决策中借助专家系统的辅助,1986 年美 国 AI 相关软硬件销售额达到 4.25 亿美元,人工智能技术逐渐走出科研院所,进入到企业 的实际业务场景中。
AI 模型算法研究领域,对人类脑神经的信号处理和思考机制的模拟进一步加深,代表 性产物包含 CNN、RNN 等神经网络模型。1982 年,John Hopfield 提出了一种结合存储系 统和二元系统的神经网络,即 Hopfield 网络。这种模型保证了向局部极小的收敛,由于每 个神经元的输出均连接到其它神经元的输入,模型能够通过训练从某一残缺的信息联想到 所属的完整信息,即,Hopfield 模型在模拟人类记忆储存和联想方面做出重大贡献,这一 模型也勾勒了未来 RNN 模型的雏形。 Yann LeCun 提出 CNN 模型,并成功验证其商用的可行性。1989 年,LeCun 结合反 向传播算法与权值共享的卷积神经层发明了卷积神经网络(Convolutional Neural Network, CNN),CNN 通常由输入层、卷积层、池化(Pooling)层和全连接层组成。卷积层负责提 取图像中的局部特征,池化层用来大幅降低参数量级,全连接层则类似传统神经网络部分 输出想要的结果。卷积神经网络(CNN)成功应用到美国邮局的手写字符识别系统中,在 此基础上于 1998 年诞生了稳定可商业应用的 CNN 模型 LeNet-5。
2.1.3 第三次 AI 浪潮,数据爆炸背景下,AI 进入学习时代
人类进入互联网时代,数据量爆炸以及大数据技术的成熟,为人工智能的发展注入新 动能。PC 互联网以及移动互联网时代的到来驱动了人类活动数据量的爆炸式成长,为 AI 模型的训练提供有价值的原料,同时围绕大数据、云计算等领域的技术迭代使得人工智能 模型的计算效率、成本等均有大幅优化,为商业化应用打开了空间。 根据海外学者论文《Modeling and Simulation Strategies for Performance Evaluation of Cloud Computing Systems》,进入互联网时代后,全球产生的数据量呈现爆炸式成长,于 2000 年突破 50EB,到 2007 年已接近 300EB。在针对大规模的数据计算领域,2003 年, Google 公布了 3 篇大数据奠基性论文,为大数据存储及分布式处理的核心问题提供了思 路:非结构化文件分布式存储(GFS)、分布式计算(MapReduce)及结构化数据存储 (BigTable),并奠定了现代大数据技术的理论基础。
Geoffrey Hinton 等人提出深度学习(Deep Learning)概念,掀起第三次人工智能热 潮。深度学习的本质是使用多个隐藏层网络结构,通过大量的向量计算,学习数据内在信 息的高阶表示。相较于传统的神经网络,深度学习模型具有更优异的特征学习能力,学习 得到的特征对数据有更本质的刻画,有利于可视化或分类;其次,深度神经网络在训练上 的难度,可以通过“逐层初始化”(layer-wise pre-training)来有效克服,因此模型精调的 效率得以大大提升。深度学习的出现标志着计算机实现了基于数据的学习和挖掘分析能 力,AI 能够挖掘复杂信息中包含的关联关系。 2012 年 AlexNet 神经网络获得 ImageNet 大赛冠军,标志着 AI 在图像识别领域的突 破性成就。2012 年,在计算机视觉领域的竞赛 Image Net 中,AlexNet 以提升 10%的错误 率的进步力压第二名以 SIFT+FV、LBP+FV、GIST+FV、CSIFT+FV 等组合特征的算法。 AlexNet 基于卷积神经网络 CNN 模型,在数据、算法及算力层面均有较大改进,创新地应 用了 Data Augmentation、ReLU、Dropout 和 LRN 等方法,并使用 GPU 加速网络训练。之 后图像识别领域 AI 模型均在此基础上进行优化,并且识别准确度超越了人类水平。
AlphaGo 具备深度学习能力,可结合人类专家比赛中学到的棋谱,以及在和自己下棋 (Self-Play)中进行强化学习。2016 年,人工智能 AlphaGo 在围棋竞技中击败李世石,标 志着 AI 具备了自我迭代和学习强化的能力。AlphaGo 的深度学习模型可分为策略网络和 价值网络,分别解决了围棋中的“下一手最佳策略”和“下一手后的胜率”两个问题,并 以此为核心通过学习人类棋谱和自我对弈,不断调整策略提升棋力。AlphaGo 较好地模拟 了人类棋手对于围棋落子的直觉判断,即,由于围棋存在的广度(每一步的可能性)和深 度(棋局从开始到结束的步数)导致计算机无法模拟计算所有的可能性,AlphaGo 通过策 略网络减少搜索广度,即每一步搜索少量节点,而通过价值网络减少搜索深度,无需将棋 局下到底即可得出当前局势的判断。 在 AlphaGo 基础上,谷歌公司后续推出了迭代版本 AlphaGo Zero,增强了 AI 在面对 人类棋谱中未出现过的局势时的自我推理和学习能力,标志着 AI 的自我学习具备了一定的 迁移能力。
Transformer 架构横空出世,Open AI 发布的 GPT 模型,AI 进入“大模型”时代。 GPT(Generative Pre-Training,GPT)模型利用更大规模的文本数据以及更深层的神经网络模型学习更丰富的文本语义表示,打破了自然语言处理各个任务之间的壁垒,使得搭建一 个面向特定任务的自然语言模型不再需要非常多的任务北京,只需要根据任务的输入和输 出形式应用预训练模型便可达到满意效果。NLP 模型的搭建只需要“无监督预训练+有监 督的精调”两阶段: (1)生成式预训练:在大规模文本数据上训练一个高容量的语言模型,以学习更丰富 的上下文信息; (2)判别式任务精调:将预训练好的模型适配到下游任务中,并使用有标注数据学习 判别式任务; 从 GPT 到 GPT-2 和 GPT-3,参数提升和训练数据积累提升模型工作性能。到了 GPT2 阶段,Open AI 将自然语言模型定义为要完成零样本无监督多任务学习的目标,即预训 练好的模型可以直接用于下游任务。GPT-2 模型在学习更广泛的数据信息,增加了模型的 维度参数后,不需要针对特定的任务修改模型,将任务也作为提示词,和文本一起输入预 训练好的模型。 承接 GPT-2 的核心思想,到了 GPT-3,模型参数量达到了 1750 亿,在不进行微调的情 况下可以在多个 NLP 基准上达到最先进的性能。GPT 模型的演进为国内外 AI 大厂提供了 重要的借鉴意义,即通过优质训练数据输入和模型复杂度的增加来提升模型性能,而未来 AI 以少样本乃至无样本学习为核心目标。
AI 大模型在任务准确度和场景泛化性方面提升显著,在此基础上针对不同实际场景提 炼出针对性的 AI 小模型以完成特定任务,可大大降低 AI 商业化部署的成本,提高训练速 度。其中,Transformer 架构和 GAN 模型为现在的语言文本生成和图像生成奠定了基础。 GAN 模型参考博弈学习理论,通过内部两个模型的互相博弈,实现图像视频的 AI 自 动生成。生成式对抗网络(GAN,Generative Adversarial Networks)是近年来复杂分布上无 监督学习最具前景的方法之一。模型通过框架中两个模块:生成模型(Generative Model) 和判别模型(Discriminative Model)的互相博弈学习产生输出。判别模型负责判断一个实 例是真实的还是模型生成;而生成模型负责生成实例来骗过判别模型。两个模型对抗中最 达到平衡,即生成模型生成的实例与真实的没有区别,判别模型无法区分输入数据是生成 的还是原始真实的数据。
GAN 模型应用广泛,成为 AIGC 重要底层框架但早期存在问题。GAN 模型应用包含 逼真图片生成、图片翻译、3D 建模等,但由于基础的 GAN 模型存在收敛不稳定、容易受 到部分图片样本欺骗等问题,初期生成的图像可能存在失真问题,适用范围相对局限。
2.1.4 第四次 AI 浪潮,AIGC 从文本拓展至图像及音视频领域,商业化空间打开
AIGC 在图片、音视频领域的模型在大模型基础上持续优化,性能趋向商用化需求, 空间有望打开。我们认为以 ChatGPT 为代表,AI 将进入创造(创作)时代,引领第四次 人工智能浪潮。AIGC 以自动化生产和高效为两大特点,目前已经可以自动生成文字、图 片、音频、视频,甚至 3D 模型和代码。未来大量数字原生内容有望由 AI 协助完成创作。 底层技术的突破使 AIGC 商业落地成为可能,模型迭代推动 AI 生成文字和图片质量 实现质的提升。在图像生成领域。
Diffusion 模型参考热力学原理,大幅提高生成图像的稳定性、准确性以及计算效率。 扩散模型(Diffusion Model)的灵感来自非平衡热力学,模型训练过程中缓慢地将随机噪 声添加到数据中,然后通过反转这个噪声过程,来学习恢复数据。不同于 GAN 模型,扩 散模型不依赖于生成与对抗两个模型的博弈,因此学习结果更加稳定,并且模型的并行性 和扩展性更好,之后推出的 Stable Diffusion 模型在计算效率上显著提升,满足企业级和消 费级的使用需求。 CLIP 模型打破了传统分类器界限,可以在不需要额外训练集的情况下,以良好的性 能完成各种计算机视觉任务。CLIP 模型对问题进行了重新定义并不再预测文本标签,取而 代之的是预测图像与文本相匹配的可能性大小,在大规模数据集上完成的训练后能够学习 到了图像的各方面信息。
Make-A-Video 模型实现 AI 基于文本、图像智能生成视频。在视频生成领域,Meta 公 司继承了图像生成模型的核心技术,在文本语义和图像对应关系的基础上,通过对视频帧 序列的学习训练,实现连贯运动且高分辨率的高质量视频生成。由于模型训练量要求过 大,目前该模型只能实现几秒钟的短视频生成,未来有望随着模型的迭代实现中视频和长 视频的生成。
2.2 未来 AI 发展的两大路线,工程方法+科学方法将交替占据行业主流
人工智能的发展进程中形成符号主义和连接主义两大阵营,从工程维度和科学维度优 化迭代 AI 模型。在 AI 发展早期,由于数据量较少,AI 模型容易用符号模型表征,因此符 号主义发展较快,而后来数据量提升,问题和任务的复杂度增加,导致基于复杂模型结构 的连接主义兴起,并形成了目前一系列 AI 范式。 我们认为在 AIGC 主导的人工智能商业化进程中,符号主义和连接主义仍将作为 AI 迭 代的两个重要方向。其中,AI 在细分场景中的应用将推动大量时序性的复杂信息输入到模 型当中,因此对场景数据(尤其是非标准化的数据)的处理有望迎来重大发展;其次,目 前 AI 在长视频、虚拟人、高清图像等领域的智能生成仍存在局限性,我们看好通过模型的 迭代和对人类神经网络的研究和模拟,提升 AI 的准确度、计算效率等指标。
计算机算力以及 AI 在细分场景下的渗透率提升推动 AI 模型训练数据量爆炸式成长, 通过增加模型参数及数据量提高 AI 的计算速度和准确度。大模型通过超大规模的参数设 置和数据输入,具有基础、通用和综合的特点,而小模型基于实际任务场景的需求,通过 高质量场景数据的输入和训练,使 AI 能够出色完成特定任务。在 NLP 领域,以 Google 发 布的 BERT 模型和 Open AI 提出的 GPT 模型为典型代表。AI 通过大模型的预训练,能够 在处理语言、推理、人机交互等领域任务上的表现实现极大提升,打开了 AI 渗透到各行业 进行商业应用路径。
以 Transformer 为代表性成就,AI 模型在模拟人脑思维模式中不断进步。Transformer 架构的核心在于注意力机制的使用,这使得 AI 模型在计算过程中可大幅节约消耗在无关信 息上的算力,除此之外,残差网络、多巴胺机制的强化学习等模型均参考了脑科学领域的 研究成果,通过嵌入响应的信号处理模块,节约算力消耗的同时提升计算效率。
2.3 未来发展方向预计,数据+模型+算力供应仍为三大发展方向
2.3.1 趋势一:AI 发展带动基础数据市场成长,高质量标注数据决定模型训练效果
AI 模型发展带动训练数据需求升高,标注和结构化处理真正实现将数据转为为 AI 商 业价值。随着 AI 与各个产业结合得愈加紧密,AI 商业化程度进入新阶段,企业对 AI 在商 业化落地中的表现要求越来越高。为了保证 AI 算法的识别精度,数据标注的质量也就变得 至关重要。 AIGC 向图像、语音、文字多维数据延伸,AI 基础数据服务与治理赛道有望受益加速 成长。数据服务是利用数据采集与标注工具处理图片、语音、文本等非结构化数据,数据治理则使用数据治理的各模块管理多源异构数据,提高数据质量并形成数据资产。高质量 的数据可供各行业 AI 厂商训练模型,并支撑各场景商业化产品的落地。 数据标注目前仍以人工为主,行业向智能化和去人工化趋势演进,标注数据生产效率 与 AI 模型进步协同共振。不同于计算机视觉领域 AI 模型训练所用的图像数据,NLP 模型 训练的数据往往来自于半结构化或非结构化的信息,目前无法实现 AI 算法模型的自动化标 注,目前主流的实现路径是人工标注与智能标注协同方案,即人工完成一小部分的数据标 注,再借助算法模型对剩余数据进行标注,通过人工对部分难例数据样本的二次标注后, 最终形成高质量的标注数据。
2.3.2 趋势二:场景模型持续简化以提升训练速度,控制成本满足商业化应用需求
大模型微调成本和维护成本过高。目前大模型厂商在用户需求较大时,微调成本和模 型维护成本会相当高,若仅提供推理服务,成本可以大幅降低但是模型精度会受到较大牺 牲,从而降低大模型的竞争力。并且 AI 项目实施通常会把模型部署到终端,对算力的要求 非常高,因此国内外大厂及研究院所均致力于对预训练模型进行“瘦身”。 模型蒸馏与迁移学习成为 AI 领域研究新方向,可大幅优化终端模型计算的时效性并 节约算力成本。“知识蒸馏”概念可类比于学校中的教学行为,可有效地压缩预训练模型的 大小。知识蒸馏包含已训练的 Teacher Model 和待训练的 Student Model,通过知识蒸馏和 迁移学习,学生网络可以拥有与教师网络相似和相近的计算性能。 知识蒸馏可以在基于高度复杂的大模型训练基础上,提升细分任务小模型的计算精 度,同时也可以有效降低模型延迟,并且压缩网络参数。基于知识蒸馏思想改进 BERT 预 训练模型,实现模型的简化和速度的提升。Distilled BERT 模型直接将 BERT 的部分参数作 为初始化,模型参数只有 BERT 的约 40%,但速度快提升 60%,同时保留了 97%的语言理 解能力。我们认为在人工智能通往商业化应用的道路上,早期专注于增加数据量、计算能 力或者训练过程的优化方式可能不再适用,未来各大厂商需要计算与预测性能之间做出权 衡,探索如何利用更少的数据与计算资源,帮助模型实现性能提升。
2.3.3 趋势三:AI 应用落地拉动算力需求,AI 基础设施市场规模有望加速成长
高算力支持是训练 AI 大规模商业化的基础,AI 基础设施市场有望迎来爆发。微软入 资 OpenAI 后双方达成多年的合作协议,OpenAI 接入微软的 Azure 云平台开发 AI 技术。 高算力的底层基础设施是完成对海量数据处理、训练的基础。我们认为 AI 技术发展逐渐成 熟,数字化基础设施不断建设完善,将拉升 AI 芯片、AI 服务器的市场需求。AI 商业化应 用的加速落地,将推动我国 AI 基础设施市场规模的加速成长 市场规模加速成长,国内细分赛道龙头厂商有望受益。《2022-2023 中国人工智能计算 力发展评估报告》指出,预计到 2026 年全球 AI 服务器市场规模将达到 347.1 亿美元,五 年复合增长率为 17.3%。中商产业研究院数据预计,2023 年我国 AI 芯片以及云计算市场 规模将分别达到 1206 亿元和 6975 亿元,同比分别增长 41.9%和 47.0%,AI 基础设施市场 规模快速成长。
3 对标海外生态,AIGC 有望推动 AI 商业化下沉各细分场景
3.1 海外科技大厂主导,各细分场景玩家涌现,商业模式雏形已现
3.1.1 微软、谷歌等大厂科研实力雄厚,推动 AIGC 核心技术不断进步
海外科技巨头发力布局,自有业务生态及强大科研实力成为核心竞争力。在经历了移 动互联网浪潮下科技巨头竞争后,谷歌、Meta、微软等国外科技大厂近年来在 AIGC 领域 均有所布局,并在聊天交互、图像生成特定领域取得了一系列突破性进展,同时部分成果 已投入商业化应用。
DALL-E2 模型可实现文本到图像的智能生成。2022 年 4 月 OpenAI 发布 DALL-E2 模 型,只需输入简短的文字 prompt 就可以生成全新的图像,甚至可以修改现有图像,创建保 有其显著特征的图像变体。DALL-E2 的训练数据来自互联网上大规模匹配的自然语言-图 像数据,因此消除了手动标注数据集的成本瓶颈。 DALL-E2 工作过程中,首先将文本 prompt 输入到经过训练的文本编码器中,接着将 文本编码映射到相应的图像编码,该图像编码捕获文本编码中包含的语义信息,最后,图 像解码模型生成图像,该图像是该语义信息的视觉表现。 Meta 在已有 AI 图像生成技术上更进一步,实现基于文本、图片生成短视频的 AIGC 模型。Meta AI 将 Make-A-Video 分割成三个组成部分并分开训练,分别是基础的文字生成 图像 AI 模型、学习视频中图像在时间维度上的动态变化的 AI 模块,以及超分辨率模型和 插帧模型以提高视频画质(分辨率和帧率)。
科技大厂主导 AIGC 在前沿领域的科学研究,为人工智能的商业化持续拓展想象空 间。谷歌母公司 Alphabet 旗下子公司 Deepmind 开发了 Alphafold 2 模型,通过预测蛋白质 中每对氨基酸之间的距离分布以及化学键之间的角度,实现对蛋白质结构三维模型的准确 预测。Alphafold2 模仿人类注意力的网络架构采用 Attention 机制,可以同时聚焦多个细节 部分,使得框架预测的结果更加全面和准确。 Meta Cicero 可在人机交互中表现出谈判技巧、同理心等,未来有望应用到各类社交 场景。2022 年 11 月,Meta 发布了具有谈判、说服和合作能力的人工智能 Cicero,在策略 游戏《外交》的测试中,Cicero 可以与其它人类玩家以自然语言沟通,甚至使用各类谈判 技巧以实现游戏目标,创建伙伴关系和联盟,最终进入游戏参与者排名的前 10%。Meta 认 为 Cicero 的核心技术未来有望创造更加智能的 NPC,以及在多会话对话中缓解人类与 AI 之间的沟通障碍,将 AI 应用到更加广泛的社交场景。
3.1.2 细分赛道涌现大量初创公司,不断探索 AI 商业化应用的产品形态及服务模式
大模型 API 公布和模型开源催生 AIGC 创业浪潮,细分赛道内大量玩家在产品及商业 模式等方面持续探索,AI 商业化生态有望加速形成。AIGC 有望赋能内容生成领域的成本 下降和效率提升,目前海外公司在文案写作、图像生成、音视频创作等领域持续布局。细 分赛道内玩家在相对统一的底层模型基础上,探索与实际应用场景深度融合的落地产品。
文本创作领域,基于 GPT 语言模型,AI 在邮件、营销文案写作领域已有深度应用。 Jasper AI 成立于 2020 年,公司定位是营销领域类的素材撰写,基于 AI 模型可为用户提供 50 多种模板并生成对应的文案,可覆盖大部分的营销场景。公司产品优势包含了更符合 Google SEO 规则、草稿创作效率更好、支持 26 种语言等六大优势。 Jasper AI 面向个人及企业用户,采用 SaaS 订阅制收费模式。Jasper AI 提供 Boss Mode 和 Business 两种计费模式,其中 Boss 模式针对个人及小组织(不超过 5 人)用户, 基础收费为 49 美元/月,可使用不超过 5 万字,最高收费为 500 美元/月,可使用 70 万字。 Notion AI 实现文本写作、语法纠错、机器翻译等功能,提高笔记类产品功能价值。 Notion 笔记工具融合了文档、任务、知识库以及数据库功能,作为生产力工具服务于互联 网群体。Notion AI 模块出色地解决了用户在使用笔记场景下遇到的大部分问题,如翻译、 写作、内容发布等。Notion 产品通过免费+低价策略积累了超 3000 万用户,未来随着 Notion AI 模块的投入商用,有望提高客单价,提升产品营收能力。
图像生成领域,扩散模型的快速迭代大幅提升 AI 生成图像的性能,Stability AI 公司 基于开源框架构建庞大内容生态。Stability AI 自成立以来,一直致力于开发面向全球消费 者和企业用例的图像、语言、音频、视频、3D 等开放 AI 模型,公司开源的底层代码使得 开发者可以绕开数据方面的限制,可为用户自己的商业产品提供动力。 2022 年 8 月,公司发布了面向消费者的 Dream Studio 应用程序,用户可在平台上通过 自然语言描述创建逼真的图像、艺术和动画,目前平台注册用户已超过 100 万,用户来自 全球 50 多个国家,创建了超过 1.7 亿张图像。用户可免费使用开源的 Diffusion 模型,但需 要为 Dream Studio 平台生成的图像付费,平台采用点数充值的模式,用户可按照每 100 点 数 1 英镑(合)的比例兑换积分,并根据生成图像的分辨率和渲染次数兑付不同数量的点 数。以渲染 150 次、分辨率为 1024*1024 的图像为例,单张图片的价格约为 0.282 英镑。
Midjourney 利用 AI 智能生成图像,使用门槛低且图片可用性高。用户通过 Discord 平台,输入希望实现画面的文字,平台即可在一分钟的时间内完成四张缩略图的生成并就 行逐步渲染,用户选择相对满意的一张图片可继续细化,如变形、放大尺寸和细节优化等 操作。 Discord 平台根据 GPU 使用时长、图片是否公开、图片生成数量的不同提供多种付费 模式,免费版本可生成 25 张图片,而企业级版本(600 美元/年)每年可使用至少 120h 的 GPU 时间用于生成图片。
Play.ht 基于 AI 驱动实现文本到语音的智能生成。Play.ht 依靠 AI 从 IBM、微软、亚 马逊和谷歌生成音频和语音,该工具对于将文本转换为自然声音尤为有用并且允许下载 MP3 和 WAV 文件格式的语音。Play.ht 拥有将播客文章转换为音频、实时语音合成、拥有 超 570 种口音和声音、可提供逼真的配音的特点及优势。 Play.ht 根据转换成音频的文本大小提供多种收费方案,专业版提供每年 60 万字(词) 的语音生成权限,且生成的音频文件可用于商业用途,该方案定价为 29.25 美元/月, Premium 版本则可以根据用户的个性化需求,调整 AI 声音的发音特点。
3.2 国内科技大厂相继入局,基于内容生态市场空间广阔
3.2.1 科技大厂持续开拓中文 AIGC,借助业务生态有望推出爆款应用产品
国内科技大厂布局生成式 AI,未来有望借助业务生态推出爆款应用产品。百度、阿里 巴巴、腾讯、字节跳动等国内科技大厂相继布局 AIGC 领域,在图片生成、视频生成、3D 建模等细分场景下推出相关应用,未来有望在业务生态中打造爆款产品。
百度深度布局 AIGC 多年,围绕自有业务生态形成核心竞争力,在中文 AI 领域优势 显著。2022 年 12 月,百度智能云发布国内首个全栈自研的 AI 基础设施“AI 大底座”,具 备标准化输出 AI 的底层能力。百度围绕各场景,在 NLP、CV、跨模态、生物计算等领域形成大模型。百度过去十年累积投入研发资金超 1000 亿元,并且连续四年在 AI 专利申请 量和授权量上保持国内第一,技术优势明显。
对标 ChatGPT,百度计划近期完成产品内测,有望加速 AI 产品商用化进程。近日, 百度官方宣布,将在 3 月份完成其 ChatGPT 产品的内测并面向公众开放,该项目名字确定 为文心一言,英文名 ERNIE Bot。公司产业级知识增强文心大模型 ERNIE 具备跨模态、跨 语言的深度语义理解与生成能力,对标微软对 OpenAI 核心技术的布局,我们认为百度有 望将对标产品应用到业务矩阵下的消费级和企业级应用中,加速 AI 商业化进程。
中文 AI 大模型持续迭代,国内人工智能底层技术能力已相对成熟。除百度之外,国 内浪潮、华为等公司均持续布局,在中文 AI 巨量模型领域的创新和应用上持续突破,为 AI 在各场景的深度应用奠定坚实基础。 浪潮“源 1.0”AI 大模型超越 GPT-3,在语言智能领域表现优异。2021 年 9 月,浪潮 信息发布 AI 大模型“源 1.0”,参数量超越 GPT-3 达 2457 亿,成为全球最大规模的 AI 巨 量模型。“源 1.0”模型训练采用超 5000GB 的中文数据集,在语言智能方面表现优异,在 文献分类、新闻分类,商品分类、原生中文推理、成语阅读理解填空、名词代词关系等任 务上位居行业内领先地位,并且在成语阅读理解填空项目中的表现已超越人类得分。 华为基于“盘古”AI 大模型发展行业应用模型,赋能行业效率提升。2022 年 11 月, 华为发布气象大模型,提供秒级天气预报,如重力势、湿度、风速、温度,气压等变量的 1 小时-7 天预测。盘古气象大模型在气象预报的关键要素和常用时间范围上精度均超过当 前最先进的预报方法,同时速度相比传统方法提升 1000 倍以上。盘古气象大模型支持广泛 的下游预报方案,如在台风路径预测任务上,相比传统数值气象预报方法,盘古气象大模 型可以降低 20%以上的位置误差。
3.2.2 国内细分赛道涌现大量垂类公司,关注实际业务场景下的 AI 应用渗透
依托国内丰富内容生态,垂类公司探索 AI 应用产品,AIGC 将有望成为内容生态发 展的新引擎。我们认为 AIGC 发展根据内容分类,主要可以分为 3 个阶段:一是 AIGC 内 容生产技术完善阶段,实现文本、视频、图片生成以及三者的跨模态转换;二是多模态生 成技术的聚合应用,以虚拟人为代表;三是虚拟内容生态,即元宇宙。目前国内外仍然处 于第一阶段,AIGC 内容以文本、图片和视频为主。 目前国内各细分赛道垂类公司布局有望推动 AI 商业化在实际场景中的深度应用。近几 年来,在法律、营销、医疗、人机交互等领域不断涌现垂类公司,基于 AI 在文本、图像和 音视频等方面赋能业务的效率及产品竞争力的提升。
对标海外公司发展,内容型公司有多种商业模式可选择,业务结合场景深度将决定玩 家核心竞争力。目前海外 AIGC 公司的商业模式大体可分为底层平台对外开放按照实际数 据量收费、按产出内容收费、类 SaaS 的软件服务收费、有偿模型使用等,其核心是在于赋 能下游 B 端及 C 端用户的实际业务效率和质量提升,因此企业需要对一体化解决方案、行 业深度绑定、业务闭环等领域不断耕耘。
3.3 国内内容生态市场空间广阔,政策支持下看好 AI 应用加速渗透
国内成熟内容生态为 AI 应用提供沃土,虚拟人有望催生新内容需求。以短视频生态 为例,根据前瞻产业研究院预计,到 2027 年我国短视频市场规模将达到 9624 亿元,市场 空间广阔,视频、游戏、网络文学等内容生态也将不断丰富,市场规模持续增长有望带动 内容创作需求不断升高,以 AIGC 为核心的内容创作工具及相关服务有望加速市场渗透。 同时,随着 AR/VR、云计算、区块链等核心技术持续迭代,我国元宇宙内容生态有望加速 形成,根据速途元宇宙研究院预测,到 2030 年我国虚拟人整体市场规模有望达 3095.3 亿 元,市场前景广阔。
国家将人工智能上升至国家战略层面,政策支持有望推进行业发展。政府随着人工智 能行业的不断发展,对政策内容也持续进行细化,从顶层设计至创新成果转化路径,再到 芯片、开源平台等技术层面都有相应政策指导,为行业提供了清晰的路径指引。
4 围绕 AI 商业化三大主线挖掘核心公司分析
4.1 关注具备底层算法模型核心技术优势的厂商
4.1.1 拓尔思,国内 NLP 龙头厂商
深耕 NLP 领域 30 年,公司发展成为国内政务领域 NLP 龙头厂商。公司以“语义智能 +”为发展战略深耕多年,主要业务覆盖内容安全和互联网空间治理、数字政府和数据智能 三大板块,向以党政机关及企事业单位为主的下游客户提供大数据检索、智能风控营销、 舆情监控等服务。公司以深耕多年的大数据积累与行业领先的 NLP 技术成为国内政府政 务领域 NLP 龙头,多年以来一直保持行业领先的市场地位。 公司以 NLP 技术为核心,金融、政府、公安领域竞争优势显著。目前公司以公共安 全市场为最主要业务,产品和场景包括公安情报研判指挥、公安知识图谱、公安舆情监 控、开源情报智能分析、开源情报数据采集监测以及各类领域知识库构建;在信息安全领 域,全资子公司天行网安提供各类网安产品服务。
公司积极开辟新赛道,机器人+虚拟人有望为公司业务提供新增量。公司将以“虚拟人 +”场景为突破口,开发支撑虚拟人的 AI 技术平台,推动虚拟人在各行业场景中的率先落 地。公司基于中文 NLP 核心技术、海量数据积累及具备行业专业能力的知识图谱等元宇宙 技术基因的优势,致力构建数字虚拟人的智能引擎,提供虚拟人智能对话、知识积累、语 义理解和智能决策等技术支撑。 在机器人领域,公司与头部 AI 厂商共同合作研究人形机器人软件技术。合作双方将 在人形机器人的智能化方面,研发云端协同的 AI 算法框架以及面向特定领域的知识图谱 技术,公司在 NLP、知识图谱领域的积淀将赋能机器人软件大脑及开放软件生态的构建。 我们认为在信创浪潮下,公司有望受益政府客户在相关领域的投入增加,同时机器 人、元宇宙等行业的加速发展可为公司提供多重增长空间,看好公司以 NLP 和知识图谱为 核心技术构建业务生态,实现业务规模加速成长。
4.1.2 科大讯飞,AI+行业应用领域领跑者
公司深耕智能语音领域,战略转型人工智能赛道,发展成为行业领军企业。公司在智 能语音行业布局多年,核心技术优势明显,2010 年以来向人工智能产业发展,推动 AI 与 各行业的应用结合,在智慧教育、智能办公、智慧公安、医学影像、智能汽车、智慧服 务、智慧城市等领域不断取得成果。 坚持“平台+赛道”发展战略,公司构建自有业务闭环生态体系。公司坚持“平台+赛 道”的人工智能战略,依托国内首家上线的 AI 开放平台——讯飞开放平台,为开发者提供 一站式人工智能解决方案,构建 AI 产业生态,并在教育、医疗、办公、智慧城市等领域实 现 AI 的深度应用,在多语种语音合成和识别、自然语言处理、图文识别、人机交互等领域 提供丰富的 AI 能力,赋能下游客户的效率提升。
推动 AI 走向强人工智能,“讯飞超脑 2030 计划”为公司明确未来成长空间规划。 2022 年,公司发布“讯飞超脑 2030 计划”,旨在构建基于认知智能的复杂智能系统,深度 融合垂直行业的细分场景任务,实现各业务场景赋能。公司计划分为三个阶段,第一阶段 着眼于机器人和数字虚拟人领域;第二阶段着眼于自适应行走的外骨骼机器人和陪伴数字 虚拟人家族,以及面向青少年的抑郁症筛查平台;第三阶段计划全面进入家庭场景。
4.2 关注各细分赛道下兼具场景理解与 AI 布局优势的垂类厂商
4.2.1 海康威视:起步安防行业的智能物联龙头
公司致力于安防视频监控领域,融合 AI 技术发展成为智能物联龙头。公司起步于安 防前端领域,随后转型行业一体化解决方案提供商,满足客户定制化需求。2012 年起,公 司深度布局 AI 技术,并于 2015 年正式发布深度智能产品,进入智能化时代,并陆续推出 AI 智能产品,成为安防领域数字化领军企业。公司着力定位于“智能物联 AIoT”,将物 联感知、人工智能、大数据服务于各业务场景。 公司实现业务生态闭环,产品矩阵覆盖软硬件。公司自成立以来,始终致力于安防行 业的发展,目前已形成软硬融合、云边融合的产品体系。公司利用 HEOP 嵌入式开放平 台,实现所有类型的智能物联网设备具有相同软件基础,大幅提升开发效率。硬件方面, 公司形成“节点全面感知+域端场景智能+中心智能存算”的产品架构,边缘节点产品涵盖 前端摄像机产品、智能交通与移动产品、门禁与对讲产品等多个领域;边缘域产品深入行 业,包括智能应用一体化设备、会议平板产品、智能视频传输产品等三大产品。
公司深耕各大业务场景,具备 AI 商业化应用的良好条件。公司以安防为核心,业务 覆盖公安、交通、金融、文教卫等各场景,同时积极布局包含智能家居、机器人等创新业 务,对 AI 赋能安防领域具备业务优势,我们认为公司有望受益于 AI 商业化进程加速,持 续探索 AI 在安防领域的产品服务,为公司贡献驱动力。
4.3 围绕 AI 数据、算力等基础设施选择优质投资标的
4.3.1 海天瑞声:AI 训练数据标注优质提供商
公司是国内领先的训练数据专业提供商,致力于为 AI 产业链各类机构提供专业数据 集。公司致力于为各类 AI 厂商和机构提供算法模型开发训练需要的专业数据集,覆盖智能 语音(语音识别、语音合成等)、计算机视觉、自然语言等多个核心领域,应用场景多元, 包含人机交互、智能驾驶、智能家居、智慧城市等。 公司智能语音业务发展成熟,竞争壁垒高且小语种领域优势显著。公司在语音语言学 基础研究方面积累深厚,基于发音词典构建技术和流程技术的持续迭代,构建高质量的自 然语言处理模型训练所需的标注数据,截至 2022H1 公司已具备 190 个语种/方言的覆盖能 力,并且公司致力于开拓海外市场,未来业务规模有望加速扩张。
公司成立智能驾驶事业部,积极布局自动驾驶业务。公司于 2022 年 6 月上线了第三 代智能驾驶标注平台,目前自动驾驶数据标注方面业务已覆盖全景语义分割、2D 图像标 注、2D/3D 融合标注、3D 点云标注等。公司基于多年以来在数据标注领域的算法积淀,在 标注效率、准确度等指标上具备显著竞争优势,未来有望构建行业领先的综合性、规模化 和自动化的数据处理能力体系。 公司客户资源粘性高优势显著,未来有望受益行业加速发展和人工智能商业化进程加 速。公司在智能语音业务方面与字节跳动、阿里巴巴、腾讯、百度、科大讯飞及海外大型 客户保持良好合作关系,考虑人工智能未来有望加速商业化应用,叠加国家信创浪潮政策 支持,公司有望迎来加速成长期。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
精选报告来源:【未来智库】。「链接」
今天的文章人工智能行业专题研究:IGC有望引领人工智能商业化浪潮分享到此就结束了,感谢您的阅读。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/7944.html