2023年1月17日,海天瑞声(688787.SH)发布投资者关系活动记录表。
投资者关系活动主要内容如下:
1、决定智能驾驶数据业务市场需求空间的因素有哪些?未来智能驾驶的数据需求如何?
智能驾驶数据业务的市场需求主要与三个要素相关:1)车厂的车型及传感器丰富度。通常来说,不同车型、不同传感器会有不同的硬件配置方案,继而需要不同的数据解决方案,因此车型/传感器等硬件配置的多样性程度将会直接影响所需数据解决方案的数量;2)量产车数量。量产车的数量决定了整个的训练数据需求基数的大小;3)智能驾驶级别的逐渐提升。智能驾驶级别和渗透率的提升决定了数据处理场景的种类和体量。
这三个要素对训练数据需求的影响是相互叠加的。公司预测,随着智能驾驶相关政策的推出以及单车成本的不断下降,智能驾驶的商业化进程将加速,在上述三个因素的共同作用下,数据处理需求将呈现指数级增长趋势。
2、智能驾驶行业的核心竞争力是什么?
智能驾驶数据领域的核心竞争力主要体现在三个方面,分别是平台能力、算法能力以及数据安全能力。
平台能力是数据标注能力的基石。平台功能点覆盖的丰富度是评价平台水平的核心要素,目前同时具备2D标注、3D点云标注、2D-3D联合标注以及3D语义分割标注的供应商比较有限,能以最快速度覆盖更多功能需求的数据服务商将能更好掌握智能驾驶数据市场的主动权以及议价能力。
第二个核心要素是算法能力。平台的智能化程度越高,对人的依赖程度越低,在提高平台的生产效率的同时可以大幅降低生产成本。
第三个要素是数据安全能力。智能驾驶数据不同于传统的语音类数据,由于其采集图像涉及大量的地理及个人隐私信息,为更好防范数据安全风险,国家相关法律法规要求数据流转链条上各类企业必须做好充分的数据安全保障。因此,未来不具备相关数据安全能力的供应商将逐渐被市场淘汰。
3、公司智能驾驶的数据类型有哪些?
在智能驾驶领域,公司同时覆盖了舱内、舱外多类数据业务,舱内主要为智能语音、计算机视觉业务(DMS、OMS);舱外主要为计算机视觉类业务,数据应用场景包括行车、泊车、高速、城区、停车场、乘用车、robotaxi、干线物流、智能港口、智慧矿区、物流小车等各类型应用场景。
4、智能驾驶的数据交付能力的决定因素有哪些?数据交付能力主要由以下因素共同决定:(1)平台、算法能力。基于底层算法支撑的智能驾驶数据处理平台,需要能够承载不同类型的处理需求(单帧、连续帧标注、2D、3D及多种融合、BEV标注、点云叠加标注等)以及同时承载大规模并发的处理任务。长期来看,训练数据行业的发展将由资源主导转变为技术主导,单纯依靠人力增长来应对指数级增长的数据需求是不现实的,因此持续提升数据处理的自动化程度将成为提升交付能力的核心驱动因素。(2)资源能力。在现有人机协作模式下,智能驾驶数据需求快速增长,充足且高质量的数据处理团队成为数据持续稳定交付的重要保障。为应对持续增长的数据处理需求,公司已在进行供应链扩张和自控数据基地的布局。截止目前,公司已在安徽省建立并投入运营一体化基础数据创新服务基地,可为智能驾驶数据生产提供充分的产能支撑。
5、目前智能驾驶领域的数据需求集中在什么级别?
从公司自身的观察来看,目前智能驾驶市场的数据需求仍主要集中在L2或 L2+级别,这与其对应的装车量规模成正相关关系,即:量产规模越大、传感器类型越多、对应的驾驶场景越丰富,则产生的数据需求的类型和规模也就越多、越大。L3级别的智能驾驶受相关政策推动,也已经开始在加速落地进程中,但目前L3级别的大部分车型仍处于研发和试验阶段,量产规模较小,相对来讲仅需一定量的数据进行模型初训即可,市场整体释放出的L3级需求较小,但随着其量产规模逐渐增大,相信会成为新的数据需求释放源、将市场规模继续向上抬升。
6、智能驾驶业务领域内,客户对数据服务商的依赖性如何?
客户对数据服务商的粘性主要取决于服务商的以下三点能力:
(1)需求理解能力
需求沟通是数据服务过程中最重要的环节之一,也是客户产生粘性的首要原因。理解客户需求并非易事,部分车企对智能驾驶数据的需求繁杂且不一,形成标注规则就可长达上百页,若是没有经验的数据服务公司或初次与之合作的数据公司,仅沟通和消化客户需求就要耗费大量的时间,且之后的数据生产也往往是一知半解,推进缓慢,大大增加了数据处理周期。因此,客户会更加青睐于有经验且长期合作更懂需求的供应商,因此会产生较大粘性。
(2)技术能力
技术壁垒越高的领域,客户的依赖会越加明显。例如智能驾驶领域,由于其平台开发成本/壁垒较高,因此市场上同时具备快速工具开发、以及算法辅助能力的供应商非常有限,客户往往会对平台能力强的供应商产生较强依赖。此外,平台的私有化部署也会对让客户对数据服务商产生一定程度的依赖。私有化部署需要将平台与客户的采集以及训练系统进行打通,确保数据流通环节的畅通,这通常需要一定的时间周期进行沟通与调试,所以变换数据服务商往往意味着重新开发,不仅耗时费力,也将导致其错过最佳的研发窗口期。
(3)数据安全能力
近两年,随着数安法、个保法以及相关法律法规的快速落地,我们感受到国家在全力支持数据行业快速发展的同时,也在同步加强对于数据安全的监管,数据安全及合规能力逐渐成为行业从业企业的核心能力之一。尤其是智能驾驶业务,由于其数据往往涉及国家定义的重要数据以及个人信息,属于国家强监管领域,因此智能驾驶领域客户会更加注重供应商的数据安全能力,不仅要求其供应商具有相关资质,还要求其对整个数据生产流程做好安全保障。综上,在相关法规带动下,以智能驾驶为代表的客户将对数安能力更强的企业产生更多的依赖。
海天瑞声基于近20年的发展,在上述3个维度均有较为深厚的积累,已经将自身在传统基础数据领域所累积的行业经验、know how逐渐转变为在智能驾驶领域的新能力,并将之不断转化为向智能驾驶客户提供的高质量专业服务,促进与客户保持长期、稳定的合作关系。
7、智能驾驶的客户有哪些?
受益于智能驾驶业务蓬勃发展以及公司在该领域的强力布局,截至目前,公司已服务超过40家智能驾驶领域客户,覆盖传统车企、新势力车企、智能驾驶技术公司等。目前公司也在该领域进行持续的客户拓展,进一步加固客户储备,迎接行业爆发。8、智能驾驶单个客户的订单规模有多少?
单个智能驾驶客户的订单规模与客户自身的需求相关,也跟客户定义数据批次相关,通常来讲从十几万元到上千万元不等。不过未来,随着整个智能驾驶行业的需求快速增长,以及公司在数据服务领域产业链的进一步拓展和服务能力的不断增强,单客户数据需求量会呈现一定幅度增长。
9、智能驾驶的毛利水平如何?
目前,公司智能驾驶数据业务以舱外的视觉需求为主,主要向客户提供定制类标注服务,整体业务毛利水平维持在20%-30%左右。下一步,公司一方面会基于获得的乙级测绘资质进一步拓展采标一体的综合数据解决方案,通过设计、采集、加工等环节的综合服务,进一步提高智能驾驶业务的溢价能力和毛利水平;另一方面,公司持续强力布局算法中台,2022年年底上线的第四代智能驾驶标注平台已在多种算法框架上进行模型拓展,大幅提升了2D视觉及3D点云连续帧标注中的插值、预测、自动贴合、地面检测等算法效果,并在公开测试集上达到了较高的准确率水平。未来公司将持续通过算法能力搭建,大幅降低标注成本,预计可为智能驾驶业务带来更为可观的毛利提升。
10、海天瑞声以什么身份和大数据交易所进行合作?
目前海天瑞声在大数据交易所的主要角色是数商,即数据交易标的的供应方,通过在交易所挂牌自有知识产权的数据产品完成数据交易。
11、各地方部门是如何推进数据要素工作的?
目前许多地方部门均已将促进数字经济发展作为城市发展的重要战略,陆续出台发布数字经济发展促进条例等相关政策文件,从顶层制度指导本省/市的数据要素发展,加速落实相关促进措施,从推进和加强数字基础设施建设,培育数据要素市场,推进数字产业化和产业数字化,完善数字经济治理等几大方面,促进数字经济发展。
12、各地方部门的政务大数据一体化建设已发展到了什么程度?政务大数据的建设,哪些公司最为受益?随着2022年10月,相关部门印发《全国一体化政务大数据体系建设指南》(以下简称“建设指南”)的颁布以及相关政策的推进,全国一体化政务大数据平台的建设已经进入到加速阶段。根据建设指南的数据显示,截至目前,全国已建设26个省级政务数据平台、257个市级政务数据平台、355个县级政务数据平台,政务数据资源体系基本形成。但建设指南也同时指出我国当前的政务平台建设仍存在政务数据统筹管理机制有待完善、政务数据共享供需对接不够充分、政务数据支撑应用水平亟待提升、政务数据标准规范体系尚不健全、政务数据安全保障能力亟需强化等问题;从公司的观察来看,行业参与者后续将围绕数据目录管理、数据归集、数据治理、安全防护等方面进行能力构建,具备上述能力的公司,例如数据处理及治理、云计算、数据安全等产业链上的公司将优先受益。
13、未来境外的数据需求释放会不会紧缩?
随着AI在越来越多的垂直场景应用落地,全球AI进入高速发展期,海外已呈现出快速增长的数据需求,尤其是将全球化扩张作为其收入增长核心动力的海外科技互联网企业、将AI及元宇宙作为重点发展方向的大型科技企业等,为更好实施其发展战略,已释放出快速增长的多语种数据需求,包括多语种语音需求以及多语种OCR需求等。海天已加快布局,通过规模化的多语种产品研发投入,精准对接海外客户需求。此外,为进一步撬动更大的境外市场需求,公司将增设海外本土销售团队,并通过多维营销方式增强海外客户触达,提升客户服务体验,力争实现海外市场收入在未来保持良好增长态势。
14、公司境外收入的驱动因素是什么?
随着AI在越来越多的垂直场景应用落地,全球AI进入高速发展期,海外已呈现出快速增长的数据需求,尤其是将全球化扩张作为其收入增长核心动力的海外科技互联网企业、将AI及元宇宙作为重点发展方向的大型科技企业等,为更好实施其发展战略,已释放出快速增长的多语种数据需求,包括多语种语音需求以及多语种OCR需求等。海天已加快布局,通过规模化的多语种产品研发投入,精准对接海外客户需求。此外,为进一步撬动更大的境外市场需求,公司已启动增设海外本土销售团队,并将通过多维营销方式增强海外客户触达,提升客户服务体验,力争实现海外市场收入在未来保持良好增长态势。
15、境外收入增长的主要驱动因素有哪些?
境外收入的主要驱动因素来自于多语种相关的智能语音以及计算机视觉类业务。
随着AI在全球的快速发展,海外越来越多的科技企业以及互联网企业正在加速进行全球化扩张,为更好实施其发展战略,已释放出快速增长的多语种数据需求,例如将全球化扩张作为其收入增长核心动力的海外科技互联网企业、将AI及元宇宙作为其重点发展方向的大型科技企业等,都已释放出大量的多语种语音需求以及多语种OCR需求。海天也已在多语种方面加快布局,通过规模化的多语种产品研发投入,精准对接海外客户需求。此外,为进一步撬动更大的境外市场需求,公司将增设海外本土销售团队,并通过多维营销方式增强海外客户触达,提升客户服务体验,力争实现海外市场收入在未来保持良好增长态势。
16、公司语音业务未来的增长点在哪儿?
公司语音业务领域的训练数据业务类型包括语音识别采集、语音识别转写、语音合成、发音词典等方向。客户在语音数据业务领域的需求是多种多样的,伴随语音技术进一步发展落地、并向各行各业和更多垂直场景不断渗透,以及中国企业出海、国际化战略的实施,客户对语音类数据的需求将拓展至更多语种、更多垂直应用场景、更多设备、更多音色类型等,这些都将成为公司语音数据业务新的增长点。
具体来说,境内语音业务将通过提供更多外语种训练数据产品及服务,主要服务于境内各大客户的出海拓展需求。此外,伴随境外相关事项常态化、各大客户复工复产,公司也将重点关注境外客户在多语种拓展、虚拟人/多模态、新型硬件研发领域的新型语音业务需求;相比于境内语音业务,得益于境外主要客户更认同数据服务商的综合能力及品牌价值、价格敏感度相对较低,境外语音业务毛利率更高,对公司整体毛利水平的稳定将起到积极作用;同时,公司还将通过扩建全球化销售团队,进一步扩展境外语音业务市场,尽力提升语音业务对公司整体收入的贡献。
17、与客户自建数据团队相比,海天的优势是什么?相较于客户自建团队,海天瑞声历来都是对接众多大型科技公司、头部人工智能企业、科研院所等,获得的信息是广泛的,项目经验丰富,同时积累了大量的know-how,对数据的理解更广、更深刻,同时我们搭建了成熟的数据处理算法平台,通过更高效的人机交互实现降本增效,保证数据质量的同时能有效降低成本,为客户提供更高性价比的训练数据产品/服务。
18、公司获得境外客户认可的核心竞争力是什么?除了长期合作的良好口碑,公司在语音方面积累深厚,尤其是多语种方面的积累和能力,可以更好服务境外公司全球化布局。截至2022年6月30日,公司已覆盖超过190种语种/方言,不仅包括含英、法、德、意、西、日、韩等常见语种,还包括东南亚、一带一路等国家地区的罕见多语种,尤其在亚洲多语种的服务上具备竞争优势。除核心业务能力外,公司也从去年开始制定了更为全面的全球化发展战略,从品牌升级、体系搭建、团队建设、营销推广等多维度升级海外市场布局,大大提升海外客户触达和服务能力,达历史同期最佳水平。
19、我们标准数据集是如何积累的?
公司标准数据集产品的积累方式主要为基于公司对市场需求趋势的判断和共性需求的提炼能力,先于客户需求开发数据集。数据集产品的这种商业模式在行业内往往具有较高壁垒,一方面需要公司对未来需求趋势有精准把握,另一方面由于产品开发属于先投入后产出,因此需要公司具备充足的资金保障,只有具有大量行业经验+know-how积累以及资金充足的企业,才能具备产品开发能力。因此,产品模式也成为公司区别于其他竞争对手的一大特色,目前公司产品数据集储备已处于行业头部水平,产品的积累对公司未来的收入扩张和毛利提升都将起到重要作用。
20、产品数据集的生命周期多长?
就目前训练数据产品的销售情况看,平均生命周期大概在5年左右,有部分产品生命周期可达8-10年之久,比如公司早年建成的一个中文语音识别数据集,目前仍在销售,而且售卖范围很广,基本覆盖了目前市场上绝大多数主流的语音识别引擎。
21、训练数据产品和服务的定价模式、收费模式是什么样的?
定制服务定价模式:一般采用成本加成定价法。公司根据客户的具体服务需求预估项目成本,在预估成本的基础上,参考公司制定的指导毛利率水平,结合项目技术难度、复杂程度、时限要求等进行报价,并根据市场环境与客户协商,最终确定价格。
产品定价模式:一般采用需求导向定价法。公司综合考虑训练数据集的开发支出、市场需求程度、预计未来重复销售的频率等因素,制定产品标准价格及价格区间,在销售过程中,根据客户的实际需求情况,以价格区间为基础向客户报价,经双方协商确定最终销售价格。训练数据产品通常以单个数据集为单位进行定价,定价比较灵活。
22、未来几年,公司营收增长点主要有哪些?
未来1-2年,境外业务和智能驾驶业务将成为公司营收的核心增长点:
(1)境外业务:随着AI在越来越多的垂直场景应用落地,全球AI进入高速发展期,海外已呈现出快速增长的数据需求,尤其是将全球化扩张作为其收入增长核心动力的海外科技互联网企业、以及将AI及元宇宙作为重点发展方向的大型科技企业等,为更好实施其发展战略,已释放出快速增长的多语种数据需求,包括多语种语音需求以及多语种OCR需求等。海天已加快布局,通过规模化的多语种产品研发投入,精准对接海外客户需求。此外,为进一步撬动更大的境外市场需求,公司将增设海外本土销售团队,并通过多维营销方式增强海外客户触达,提升客户服务体验,力争实现海外市场收入在未来保持良好增长态势。
(2)智能驾驶业务:受智能驾驶技术级别的提升以及车企的规模化量产等因素驱动,智能驾驶领域的数据需求正在急速增长。为更好承接快速增长的数据需求,公司正在通过专业的销售团队建设以及领先的平台算法能力,加紧构建行业一流业务能力,快速拓展智能驾驶市场,2022年1-9月智能驾驶新增客户数量14个,前三季度验收订单额及截至三季度末在手订单额总计约5,000万元,同比增长超过200%。我们认为,随着年底公司第四代智能驾驶标注平台的落地,公司平台能力将达到行业头部水平,将进一步助力公司智能驾驶业务的快速拓展。
更为长远的看,公司的业务增速将与AI结合各行业的渗透率呈一致关系,当AI深入到更多垂直行业场景中去时,高质量训练数据都将成为不可或缺的驱动要素,并为公司持续带来业务扩展及增量机会。
(来源:界面AI)
声明:本条内容由界面AI生成并授权使用,内容仅供参考,不构成投资建议。AI技术战略支持为有连云。