海天瑞声11月15日发布投资者关系活动记录表,公司于2022年11月10日接受125家机构单位调研,机构类型为保险公司、其他、基金公司、证券公司、阳光私募机构。
一、三季度业绩情况说明2022年前三季度,公司围绕“全球化、行业化、智能化”发展的策略,以技术驱动为主轴,通过对全球市场以及新兴垂直领域的多维布局,抢抓AI训练数据市场发展机遇,不断抬升公司创收能力。
2022年前三季度,收入增幅显著加速,营收增长率达到27.8%,单季度收入增幅超过110%。境内、境外业务均较同期大幅度增长超过100%。其中,境内业务主要受基础训练数据业务订单交付释放和智能驾驶数据业务带动;境外业务受益于境外主要国家地区疫情防控趋于常态化,和公司全球化战略的逐步实施,叠加境外客户多语种、多模态/虚拟人需求的不断涌现,预计全年境外收入整体将保持前三季度的增长势头。
公司不断的提高自研平台及工具体系能力和智能化生产水平、加强数据集产品储备研发,前三季度研发费用共计6,413.50万元,占当期营业收入的比例达到38.37%,同比增长64.26%,在研发投入金额和研发投入占收入比两个维度均创公司历史新高。
基础研发方面,公司启动了第四代智能驾驶标注平台建设,通过快速平台能力迭代,旨在支撑公司智能驾驶业务核心技术能力尽快进入行业头部梯队,预期第四代平台可支撑智能驾驶全应用场景下的数据处理、支持各类型传感器及多传感器融合的数据处理、可服务行业前瞻性标注需求,并通过算法中台的介入,大幅度的提高智能驾驶数据处理的智能化水平,为未来智能驾驶业务毛利率的提升奠定基础。在产品研究开发方面,公司沿着募投项目实施计划,接着来进行智能语音和计算机视觉领域多语种多模态训练数据集产品建设,不断增厚自有知识产权数据集竞争壁垒。
国家对于数安合规的格外的重视以及有关政策的快速落地也在影响着行业的竞争格局。国家近期颁布的《信息安全技术汽车数据处理安全要求》,对汽车数据处理者的数据采集、处理及流转过程提出了严格的安全要求。自然资源部也于8月发布《关于促进智能网联汽车发展维护测绘地理信息安全的通知》,明确规定了拥有相对应资质的企业才能从事测绘相关工作(外商投资企业不能申请相关资质),客观上建立了新的行业准入门槛。公司已于今年6月获批乙级测绘资质,预期将可助力智能驾驶业务范畴的拓展,实现采标一体化服务,进一步提升智能驾驶数据业务的发展水平。
问:从自然资源部发布的这些文件,可以看出国家已经将数据安全提到了一个前所未有的高度,请问这些政策的发布会对公司智能驾驶业务的商业模式带来什么影响?
答:不同于传统的语音类数据需求,智能驾驶数据(尤以舱外为主)通常涉及大量的道路类图像数据采集,其中有可能涉及到国家定义的重要数据以及个人信息,因此对整个数据流转过程的保密性、安全性要求极高。
公司的商业模式也在不断适应相关政策以及行业需求的变化,比如为了最大限度保障客户数据安全,我们会将标注平台定制化部署到客户的数据流转系统上,确保数据不出客户系统,极大保障了客户的数据安全需求。此外,我们在为客户提供数据处理服务时,会建立严格的安全屋体系,对整个的数据处理过程进行严格的管理和监控,确保客户的数据安全。
行业的新变化会构筑更高的行业壁垒,更早建立数据安全能力且在此方面持续投入的企业将能更快抢占数据服务市场,获取更多新机会。
答:近两年,随着数安法、个保法以及相关法律法规的快速落地,我们感受到国家在全力支持数据行业快速发展的同时,也在同步加强对于数据安全的监管,我们认为这个趋势正在改变行业的竞争格局,数据安全及合规能力逐渐成为行业从业企业的核心能力之一。
今年8月底,自然资源部发布《关于促进智能网联汽车发展维护测绘地理信息安全的通知》,9月配套发布《自然资源违法行为立案查处工作规程(试行)》,表明了监管的决心,预计将对目前国内自动驾驶数据采集与处理行业将产生深远影响。《通知》本次扩展到全产业链进行监管,包括采集、标注处理等在内的全链条业务形态均被纳入监管范畴,且明确规定内资企业需获得测绘资质才能从事测绘相关活动(外商投资企业则不能申请测绘资质)。同时,辅以《规程(试行)》,明确规定“测绘项目的招标单位让不具有相关资质等级的测绘单位中标,或者让测绘单位低于测绘成本中标”属于违法行为。此外,国家在10月份发布了《信息安全技术汽车数据处理安全要求》,对汽车数据处理者的数据采集、处理及流转过程提出了严格的安全要求。
由此可以看出,这些规定将对外商投资企业产生实质性影响,内资企业也必须获得资质后才能准入,并且从业企业须按照国家标准开展业务活动,这些因素综合作用,将进一步提高行业准入门槛,并对在这方面先行获得资质的企业构成了政策红利。海天瑞声在数据安全合规方面,一直坚持强投入,将安全合规作为公司发展的基本方针。截至目前,公司在各项资质储备以及安全体系搭建上,均处于行业领先地位。未来,我们也将紧跟国家政策,进化数据安全能力,帮助客户合法合规开展相关活动,成为客户可靠伙伴。
答:今年8月末,自然资源部发布《关于促进智能网联汽车发展维护测绘地理信息安全的通知》,9月配套发布《自然资源违法行为立案查处工作规程(试行)》,表明了监管的决心,预计将对目前国内自动驾驶数据采集与处理行业将产生深远影响。《通知》本次扩展到全产业链进行监管,包括采集、标注处理等在内的全链条业务形态均被纳入监管范畴,且明确规定内资企业需获得测绘资质才能从事测绘相关活动(外商投资企业则不能申请测绘资质)。同时,辅以《规程(试行)》,明确规定“测绘项目的招标单位让不具有相应资质等级的测绘单位中标,或者让测绘单位低于测绘成本中标”属于违法行为。
我们认为,《通知》及《规程(试行)》的发布进一步提高了行业准入门槛,未来拥有测绘资质的企业将能够更快抢占自动驾驶数据市场。公司已于今年6月获批乙级测绘资质,同时受中国移动600941)、中国互联网投资基金战略股东加持,相信将为公司自动驾驶领域业务的拓展奠定更好的基础。
答:智能驾驶数据业务的市场需求主要与三个要素相关:1)车厂的车型及传感器丰富度。通常来说,不同车型、不同传感器会有不同的硬件配置方案,继而需要不同的数据解决方案,因此车型/传感器等硬件配置的多样性程度将会直接影响所需数据解决方案的数量;2)量产车数量。量产车的数量决定了整个的训练数据需求基数的大小;3)智能驾驶级别的逐渐提升。智能驾驶级别和渗透率的提升决定了数据处理场景的种类和体量。
这三个要素对训练数据需求的影响是相互叠加的。公司预测,随着智能驾驶相关政策的推出以及单车成本的不断下降,智能驾驶的商业化进程将加速,在上述三个因素的共同作用下,数据处理需求将呈现指数级增长趋势。
问:在智能驾驶行业层面来看,激光雷达量产后,会不会带来大量的数据处理需求?
答:激光雷达成本的降低直接带来装车量的增加,也助力智能驾驶级别的不断提升,这些因素综合起来将进一步带来更多的3D及2D-3D融合类数据需求。为更好承接3D相关数据处理需求,公司已提前布局建设第四代智能驾驶标注平台,主攻3D标注工具及3D预识别算法,并预期该平台的上线将帮助公司更好抓住增量市场需求,增强公司在智能驾驶数据领域的竞争能力。
问:L2、L3等不同级别的智能网联汽车市场变化对数据的需求会产生什么样的影响?
答:从公司自身的观察来看,目前智能驾驶市场的数据需求仍主要集中在L2或L2+级别,这与其对应的装车量规模成正相关关系,即:量产规模越大、传感器类型越多、对应的驾驶场景越丰富,则产生的数据需求的类型和规模也就越多、越大。L3级别的智能驾驶受相关政策推动,也已经开始在加速落地进程中,但目前L3级别的大部分车型仍处于研发和试验阶段,量产规模较小,相对来讲仅需一定量的数据进行模型初训即可,市场整体释放出的L3级需求较小,但随着其量产规模逐渐增大,相信会成为新的数据需求释放源、将市场规模继续向上抬升。
答:首先是平台能力。智能驾驶正处于快速发展期,伴随智能驾驶技术的快速演进,市场正不断涌现出新兴的数据需求,能覆盖更多场景、支持各类型传感器及多传感器融合、具有前瞻性标注工具的智能驾驶数据业务平台将能获得更多的市场机会。公司年底即将上线的第四代智能驾驶标注平台,将可支持智能驾驶全应用场景、各类型传感器及多传感器融合的数据处理;此外,公司基于对智能驾驶感知算法趋势研判,进行了标注工具升级,平台将可支持行业各类前沿标注需求,包括连续帧融合标注中3D点云polyline、freespace的标注及2D映射和编辑,BEV(鸟瞰图)标注、点云叠加标注等热点功能,具有竞争力的平台将成为公司业务拓充的核心动力。
第二个是算法能力。算法将一定程度降低标注过程对人工的依赖,在提高平台生产效率的同时降低生产成本,在市场竞争中取得价格优势。公司的第四代智能驾驶标注平台将继续发力算法建设,通过提升2D视觉及3D点云连续帧标注中的插值、预测、自动贴合、地面检测等算法效果,提高数据标注效率,降低标注成本。
除了上述技术能力外,数据安全能力也将成为智能驾驶数据服务竞争力的重要构成因素之一。智能驾驶数据不同于传统的语音类数据,由于其采集图像涉及大量的道路数据、地理信息等,为更好防范数据安全风险,自然资源部《关于促进智能网联汽车发展维护测绘地理信息安全的通知》以及国家相关法律法规已陆续落地,监管已开始明确要求数据流转链条上各类企业必须做好充分的数据安全保障。
目前,市场上同时具备平台、算法、数据安全能力的数据服务商非常有限,公司将紧抓行业发展机遇,快速铺开市场,抢占行业发展先机。
答:今年上半年,公司完成了第三代智能驾驶标注平台上线,平台工具链基本实现了业内主流需求全覆盖(包括50多种2D标注及重点3D标注功能),同时在停车位检测、车道线预识别、车前障碍物检测等多个算法能力上新增多个模型,显著提高智能驾驶相关数据服务的标注效率。第三代平台的上线,给公司三季度智能驾驶订单带来显著增长。
下半年,公司将继续秉承技术驱动逻辑,持续加大智能驾驶研发投入,力争尽早实现第四代智能驾驶标注平台的上线,达到行业较为领先水平。该平台预期可支撑智能驾驶全应用场景下的数据处理、支持各类型传感器及多传感器融合的数据处理、支持BEV(鸟瞰图)标注和点云叠加标注等新晋需求,并通过完善算法中台,整体上提升智能驾驶数据业务的数据处理智能化水平,更好服务于智能驾驶业务拓展,提高智能驾驶业务的毛利空间。
答:从短期看,《关于促进智能网联汽车发展维护测绘地理信息安全的通知》规定了从事测绘相关工作的内资企业需获得相应资质方能准入(外商投资企业不能申请相应资质)。也就是说,未取得测绘资质的公司不能从事智能驾驶舱外数据的处理工作,客观上提高了行业准入门槛,未来拥有测绘资质的企业将获得更快速的发展机会。公司已于今年6月获批乙级测绘资质,这将助力自身拓展智能驾驶业务范畴,实现采标一体化服务,逐步提升智能驾驶数据业务的发展水平。
从长期看,结合国家陆续推出的各类数据安全相关的法律、法规、指南、标准、规范,道路数据的安全性级别达到了重要数据的水平,我们认为该类数据的采集、处理将更加集中到国内本土优势企业之上,对公司长期业务增量将带来深远的助益。
答:2D和3D标注的技术难度会有较大差别。3D点云图不同于2D图片,2D可根据实例图片进行判断,3D以点为实际操作图,作业人员需要依据2D参考图以及点的空间位置关系进行判断,且需要判断该点是否属于该目标物;在没有2D参考图的情况下,作业人员只能通过点云的形状来进行判断以及脑补,根据该目标物的形状和大小对类型进行判定,3D标注不仅需要标注员对3D空间位置关系有一定判断能力,也非常考验人员在长时间作业过程中细心程度,因此3D整体标注难度较大。
3D平台工具链搭建的技术难度也远高于2D平台。首先在渲染环节,3D数据由于其数据量大的特性,需要更强的数据计算处理能力,因此渲染难度远大于2D。此外,由于3D比2D多出一个空间维度的数据,因此其标注功能复杂程度也将大幅增加,例如3D平台需要做到三个维度的旋转、缩放和平移,以及视点在三维空间里的灵活移动等,因此对界面排布和交互逻辑提出了更高的要求。同时,3D平台不仅要能完成单独的3D点云标注,还需具备2D-3D联合标注能力,这就需要平台具有强大的跨传感器参数匹配能力,例如3D映射2D功能,这需要具备从3D相机参考框架投影到2D相机传感器平面的能力。综上,3D平台具有更高的技术壁垒。
答:算法主要应用于智能驾驶数据的标注环节,标注环节是整个数据处理过程中对人依赖最强的环节。算法的介入,可以显著降低人工标注时长,提升人工标注效率。例如在车道线标注任务中,可在人工标注前,先利用算法对车道线进行预先识别和标注,这样标注人员操作时,仅需检查和校正部分未被算法识别或准确标注的图片,大大提升了标注效率。因此,算法的介入可以大幅缩减人工标注时长,降低标注成本,整体提升标注环节毛利水平。
问:智能驾驶数据业务中,算法的作用是什么?公司的算法团队所做的事情与算法类客户所做的事情有什么差异?
答:公司自建算法团队所开展的工作主要应用于智能驾驶数据的标注环节,标注环节是整个数据处理过程中对人依赖较强的环节,算法的介入可以显著降低人工标注时长,提升整体标注效率和智能化数据处理水平。例如在车道线标注任务中,在人工介入标注前,算法可以对车道线进行预先识别和标注,这样一来,标注人员操作时,仅需检查和校正部分未被算法识别或准确标注的图片,大大提升了标注效率。因此,算法的介入可以降低标注成本,整体提升标注环节毛利水平。
公司研发的算法和客户的算法不存在重叠或冲突,两者的差异主要体现在用途的不同。公司研发算法是为了提升数据处理智能化水平,而客户的算法更多侧重于智能驾驶技术的迭代(例如,用于智能驾驶技术当中的感知环节),客户通常利用数据服务商提供的已标注好的结构化数据对其算法进行训练,继而达到优化迭代算法的目的。
问:公司在智能驾驶数据领域的研发投入主要分布在哪些方面?预期会产生什么样的价值?
答:平台能力是公司智能驾驶数据业务的核心竞争力之一,从去年公司将智能驾驶业务拓展确立为公司重要战略以来,公司持续进行智能驾驶的研发投入,主要投入在平台的工具链开发以及相应算法能力的搭建,希望通过短期内的强力投入,快速完成行业领先平台的搭建,构建智能驾驶业务核心竞争能力。公司已于上半年上线了第三代智能驾驶标注平台,可服务于大部分2D以及主流3D标注需求,年底将上线的第四代智能驾驶标注平台,将进一步完善3D标注功能并通过算法中台大幅降低标注成本,预计该平台上线后将可支撑智能驾驶全应用场景、各类型传感器及多传感器融合的数据处理任务,将为公司带来可观的收入增幅。
答:基于目前智能驾驶的技术发展态势,各个客户的技术方案多有不同,例如技术路线、车型、传感器选型、部署位置、数据处理的需求等等都有各自的要求,因此现阶段智能驾驶训练数据需求仍以定制化需求为主。
随着今年6月测绘资质的获得,公司拥有了上路采集数据的准入资格,也使得生产自有产权舱外数据集产品成为可能,具备了产品化开发的基础条件。未来,公司将持续洞察市场共性需求,择机进行智能驾驶相关产品的开发。
问:在向智能驾驶客户提供数据服务时,是否也存在模拟数据的形态?模拟数据对客户们来说有什么用?
答:目前,智能驾驶的模拟数据集主要集中在智能座舱领域。模拟数据集指的是在客户的智能座舱算法上线之前及初期,因为其自身尚未产生实网数据,通常需要采购由海天搭建模拟座舱环境所采集、处理完成的模拟型数据集进行算法模型的训练,在客户侧的产品上线并运行一段时间、产生大量实网数据之后,客户则可以提供实网数据给到我们进行数据加工,加工的数据反哺到客户的产品上从而促进其产品的迭代、升级。之后,当客户进行产品功能或语种的拓展时,再次需要购买模拟数据集来支撑,后续再采购数据加工服务进行迭代,周而复始。公司积累了一定规模的智能座舱领域的产品化模拟数据集资源,并已经提供给不同类型的智能驾驶客户、支持其智能座舱内人机交互应用的快速落地。
答:通常来说,提高整体生产效率主要体现在两个环节,一个是任务分发环节,一个是数据处理/标注环节。
在任务分发环节,算法平台的介入可以通过智能化管理模块显著提升数据分发效率,相比于纯人工的任务匹配,智能分发可通过对数据标注员的人物画像分析,使对应任务可以快速准确地匹配给更加适合的标注员,使其更及时高效开展后续的数据处理工作。
在数据处理/标注环节引入算法,通过预标注、自动跳过等功能的实现,可以显著降低人工标注时长,提升数据生产效率。例如在智能驾驶领域的车道线标注任务中,可在人工标注前,先利用算法对车道线进行预先识别和标注,这样标注人员操作时仅需检查和校正部分未被算法识别或准确标注的图片,大大提升了标注效率,大幅缩减了人工标注时长。
问:目前公司接触到的智能驾驶的客户需求,主要集中在什么级别?L2还是更高级别?
答:目前,公司接触到的智能驾驶数据需求主要集中在L2和L2+,例如服务于自动泊车辅助的停车位检测、可行驶区域检测,服务于高速驾驶辅助的车道线检测、障碍物检测等数据需求。
随着L3及L4级别智能驾驶的加速落地,下游客户将逐步释放更多的高级别智能驾驶数据需求,比如服务于交通拥堵领航的激光雷达-相机联合追踪、多目相机联合等数据需求,服务于自主代客泊车的点云BEV(鸟瞰图)联合标注、点云伪3D联合标注等数据需求。公司将基于前瞻性的平台和算法能力,进一步打通L3及以上级别的数据服务能力。预计从明年开始,公司将承接更多的L3及以上级别的数据需求。
问:目前,公司智能驾驶的客户结构是什么样的?不同类型的智能驾驶客户在数据方面的投入是什么样的情况?
答:目前公司主要客户有传统车企、造车新势力、以及一些头部自动驾驶技术公司。
目前来看,受智能驾驶级别的提升以及车企的规模化量产等因素驱动,智能驾驶产业链上各类客户对于数据的需求都在急速增长,例如原来一些头部智能驾驶的技术公司,受下游主机厂的需求驱动,开始大幅增加其在数据方面的投入。同时,多家传统主机厂也在逐步增加数据预算,以求快速迭代优化车辆感知算法,获得精准感知及更多长尾场景的覆盖能力,助力其车型在终端市场具备更强竞争力、更好抢占市场先机。我们认为,随着未来智能驾驶商业化进程加速,更高级别智能驾驶逐步将进入量产阶段,形成新的支撑点、促进数据需求继续高速释放。
问:智能驾驶客户的需求如何?头部客户会释放多少需求?公司是否有新的智能驾驶客户?
答:目前来看,受智能驾驶技术级别的提升以及车企的规模化量产等因素驱动,智能驾驶产业链上各类客户对于数据的需求都在急速增长,包括一些头部智能驾驶算法公司受下游主机厂的需求驱动,亦开始大幅增加其在数据方面的投入。同时,多家传统主机厂也在逐步增加数据预算,以求快速迭代优化车辆感知算法,获得精准感知及更多长尾场景的覆盖能力。此外,随着智能驾驶市场的繁荣,行业不断快速涌入新玩家,包括新的智能汽车品牌,以及新的智能驾驶算法技术公司,这些新企业的加入都将带来大量的数据需求。目前公司的智能驾驶业务已在加速拓展当中,除了继续深挖头部客户需求,公司也通过专业的销售团队建设以及领先的平台算法能力,快速拓展智能驾驶市场,2022年1-9月智能驾驶新增客户数量14个,前三季度验收订单额及截至三季度末在手订单额总计约5,000万元,同比增长超过200%。我们认为,随着年底公司第四代智能驾驶标注平台的落地,公司平台能力将达到行业头部水平,将进一步助力公司智能驾驶业务的快速拓展。
目前来看,受智能驾驶技术级别的提升以及车企的规模化量产等因素驱动,智能驾驶产业链上各类客户对于数据的需求都在急速增长,包括一些头部智能驾驶算法公司受下游主机厂的需求驱动,亦开始大幅增加其在数据方面的投入。同时,多家传统主机厂也在逐步增加数据预算,以求快速迭代优化车辆感知算法,获得精准感知及更多长尾场景的覆盖能力。从目前公司摸排到的市场需求情况来看,单家智能驾驶客户(主机厂或头部智能驾驶算法公司)每年的数据预算从百万-上亿元不等,数据需求整体呈现加速上升的趋势。
(1)需求理解能力需求沟通是数据服务过程中最重要的环节之一,也是客户产生粘性的首要原因。理解客户需求并非易事,部分车企对智能驾驶数据的需求繁杂且不一,形成标注规则就可长达上百页,若是没有经验的数据服务公司或初次与之合作的数据公司,仅沟通和消化客户需求就要耗费大量的时间,且之后的数据生产也往往是一知半解,推进缓慢,大大增加了数据处理周期。因此,客户会更加青睐于有经验且长期合作更懂需求的供应商,因此会产生较大粘性。
(2)技术能力技术壁垒越高的领域,客户的依赖会越加明显。例如智能驾驶领域,由于其平台开发成本/壁垒较高,因此市场上同时具备快速工具开发、以及算法辅助能力的供应商非常有限,客户往往会对平台能力强的供应商产生较强依赖。此外,平台的私有化部署也会对让客户对数据服务商产生一定程度的依赖。私有化部署需要将平台与客户的采集以及训练系统进行打通,确保数据流通环节的畅通,这通常需要一定的时间周期进行沟通与调试,所以变换数据服务商往往意味着重新开发,不仅耗时费力,也将导致其错过最佳的研发窗口期。
(3)数据安全能力近两年,随着数安法、个保法以及相关法律法规的快速落地,我们感受到国家在全力支持数据行业快速发展的同时,也在同步加强对于数据安全的监管,数据安全及合规能力逐渐成为行业从业企业的核心能力之一。尤其是智能驾驶业务,由于其数据往往涉及国家定义的重要数据及个人隐私信息,属于国家强监管领域,因此智能驾驶领域客户会更加注重供应商的数据安全能力,不仅要求其供应商具有相关资质,还要求其对整个数据生产流程做好安全保障。综上,在相关法规带动下,以智能驾驶为代表的客户将对数安能力更强的企业产生更多的依赖。
海天瑞声基于近20年的发展,在上述3个维度均有较为深厚的积累,已经将自身在传统基础数据领域所累积的行业经验、know how逐渐转变为在智能驾驶领域的新能力,并将之不断转化为向智能驾驶客户提供的高质量专业服务,促进与客户保持长期、稳定的合作关系。
答:智能驾驶数据业务的市场需求主要与三个要素相关:1)车厂的车型及传感器丰富度。通常来说,不同车型、不同传感器会有不同的硬件配置方案,继而需要不同的数据解决方案,因此车型/传感器等硬件配置的多样性程度将会直接影响所需数据解决方案的数量;2)量产车数量。量产车的数量决定了整个的训练数据需求基数的大小;3)智能驾驶级别的逐渐提升。智能驾驶级别和渗透率的提升决定了数据处理场景的种类和体量。
这三个要素对训练数据需求的影响是相互叠加的。公司预测,随着全国各地促进智能驾驶发展有关政策的相继推出,智能驾驶的商业化进程将加速,在上述三个因素的共同作用下,数据需求将呈现指数级增长趋势,公司的订单也会进入高速增长期。
(1)产品类数据库的周期:因为其在销售时已经是成品状态,通常1-2个月能实现收入确认;
(2)定制类服务的项目周期:根据项目实际,生产过程可能涵盖设计、采集、处理、质检等环节,平均周期在6个月左右。如果仅为数据加工服务,则根据客户提供的数据量和难度,周期在3-9个月不等。
答:公司智能驾驶数据业务的舱外部分以视觉需求为主,主要向客户提供定制类标注服务,整体业务毛利水平维持在20%-30%左右。未来,公司一方面会基于新获得的乙级测绘资质进一步拓展采标一体的综合数据解决方案,通过设计、采集、加工等环节的综合服务,进一步提高智能驾驶业务的溢价能力和毛利水平;另一方面,公司正在强力布局算法中台,目前研发中的的第四代智能驾驶标注平台已在十种算法框架上进行模型拓展,可服务于车道线、车前障碍物、视频跟踪目标等各场景标注需求,在公开测试集上的准确率也达到了较高水平。未来公司将通过算法能力搭建,大幅降低标注成本,预计可为智能驾驶业务带来更为可观的毛利提升。
答:目前公司已在进行供应链扩张和数据基地的布局以支撑智能驾驶快速增长的产能需求。今年上半年,公司已在安徽省建立并投入运营一体化基础数据创新服务基地,可为智能驾驶数据生产提供充分的产能支撑。长期来看,训练数据行业的发展将由资源主导转变为技术主导,单纯依靠人力增长来应对指数级增长的数据需求是不现实的,因此持续提升数据处理的自动化程度将成为解决产能问题的核心要素。目前,公司正在强力布局算法中台,使标注过程向更加智能化的方向演进,同时辅以自主建设的数据基地及不断优化的供应链在资源、数安合规等方面助力公司产能不断提升,以满足不同客户群体的需求。
答:随着AI在越来越多的垂直场景应用落地,全球AI进入高速发展期,海外已呈现出快速增长的数据需求,尤其是将全球化扩张作为其收入增长核心动力的海外科技互联网企业、将AI及元宇宙作为重点发展方向的大型科技企业等,为更好实施其发展战略,已释放出快速增长的多语种数据需求,包括多语种语音需求以及多语种OCR需求等。海天已加快布局,通过规模化的多语种产品研发投入,精准对接海外客户需求。此外,为进一步撬动更大的境外市场需求,公司将增设海外本土销售团队,并通过多维营销方式增强海外客户触达,提升客户服务体验,力争实现海外市场收入在未来保持良好增长态势。
答:相比于境内数据业务,境外业务综合毛利较高。一方面由于境外以标准数据集销售为主,另一方面,境外客户更加看重数据服务商品牌和综合服务能力,因此在语音定制类服务购买上,愿意给出更高溢价,以上两个原因综合导致境外毛利较高。
答:首先,境外市场空间更为广阔。随着全球AI进入高速发展期,海外已呈现出快速增长的数据需求,尤其是将全球化扩张作为其收入增长核心动力的海外科技互联网企业、以及将AI及元宇宙作为重点发展方向的大型科技企业等,为更好实施其发展战略,已释放出快速增长的多语种数据需求。此外,境外毛利受标准化数据集产品占比较高且定制服务毛利也较高等因素驱动,其综合毛利水平高于境内,因此发展境外业务还可一定程度带动公司整体毛利提升。
答:境外收入的主要驱动因素来自于多语种相关的智能语音以及计算机视觉类业务。
随着AI在全球的快速发展,海外越来越多的科技企业以及互联网企业正在加速进行全球化扩张,为更好实施其发展战略,已释放出快速增长的多语种数据需求,例如将全球化扩张作为其收入增长核心动力的海外科技互联网企业、将AI及元宇宙作为其重点发展方向的大型科技企业等,都已释放出大量的多语种语音需求以及多语种OCR需求。
海天也已在多语种方面加快布局,通过规模化的多语种产品研发投入,精准对接海外客户需求。此外,为进一步撬动更大的境外市场需求,公司将增设海外本土销售团队,并通过多维营销方式增强海外客户触达,提升客户服务体验,力争实现海外市场收入在未来保持良好增长态势。
随着智能驾驶车型和量产车数量的增加,以及智能驾驶级别的进一步提升,智能驾驶相关的业务需求会呈现出多元化以及指数级增长的态势。海天从去年开始发力该领域,建立并持续优化智能驾驶的平台和算法能力,实现更多功能点覆盖以及更强的算法预标注能力,全力支撑智能驾驶数据业务实现高速增长。
此外,伴随中国企业出海以及国际化战略的实施,客户对语音类数据需求将进一步拓展至更多语种,而公司在语音语言学研究方面积累深厚,截至今年6月底,公司已拥有190个语种/方言的覆盖能力,语种覆盖度处于行业领先水平,强大的多语种能力将更好助力公司智能语音订单获取,成为支撑公司收入的增长的重要动力。同时,一些前沿性的多模态、虚拟人需求也在快速增长,公司在该领域的布局也将进一步助力公司境内业务保持良好的增长态势。
此外,随着AI渗透入更多行业,在国家大力发展数据要素、数字化经济的趋势下,相信境内市场将呈现更多场景机会,高质量训练数据都将成为AI落地场景不可或缺的驱动要素,并为公司持续带来业务扩展及增量机会。
问:语音业务在境内、境外有毛利差异的原因是什么?对未来语音业务的毛利展望如何?
答:相比于境内语音业务,境外语音业务综合毛利较高。一方面由于境外以多语种的标准数据集销售为主,另一方面,境外客户更加看重数据服务商品牌和综合服务能力,因此在语音定制类服务购买上,愿意给出更高溢价,以上两个原因综合导致境外毛利较高。
未来,基于全球AI的高速发展,海外将具有更广阔的数据市场空间,我们希望进一步撬动更大的境外市场需求,因此也将不断开拓语音业务的服务边界,除了继续拓展多语种产品需求,也将发力在更多的前沿数据定制服务。短期看,由于定制服务比例的增加,综合毛利可能会呈现出一定的下降,但长期看,毛利的短暂下降会带来更优化的境外业务模式和更高的收入增速,同时也为公司包括语音业务在内的整体业务能力拓展增添新的动能。
答:公司语音业务领域的训练数据业务类型包括语音识别采集、语音识别转写、语音合成、发音词典等方向。客户在语音数据业务领域的需求是多种多样的,伴随语音技术进一步发展落地、并向各行各业和更多垂直场景不断渗透,以及中国企业出海、国际化战略的实施,客户对语音类数据的需求将拓展至更多语种、更多垂直应用场景、更多设备、更多音色类型等,这些都将成为公司语音数据业务新的增长点。
具体来说,境内语音业务将通过提供更多外语种训练数据产品及服务,主要服务于境内各大客户的出海拓展需求。此外,伴随境外疫情防控常态化、各大客户复工复产,公司也将重点关注境外客户在多语种拓展、虚拟人/多模态、新型硬件研发领域的新型语音业务需求;相比于境内语音业务,得益于境外主要客户更认同数据服务商的综合能力及品牌价值、价格敏感度相对较低,境外语音业务毛利率更高,对公司整体毛利水平的稳定将起到积极作用;同时,公司还将通过扩建全球化销售团队,进一步扩展境外语音业务市场,尽力提升语音业务对公司整体收入的贡献。
答:目前,公司的商业模式还是集中在向客户群体提供数据产品、服务。随着公司自研数据处理平台以及算法能力的日趋成熟、完善,公司不排除未来会进行包括SaaS服务模式在内的新型业务模式的推广,我们会根据市场的实际需求及行业变化动态优化、扩展商业模式,以保障公司业务持续向前发展。
答:近些年,AI训练数据市场发展迅速,在赚钱效应和资本的带动下很多中小型新玩家涌入,靠快速烧钱和低价策略抢占了一些市场份额。但客观来看,这种做法并没有将资金运用到企业自身中长期的实力构建上,以智能驾驶数据领域为例,相较于价格因素,自研平台的功能丰富度、处理效率、数据准确率以及全过程的数据安全合规更为重要,因此需要入局企业具备功能丰富的平台以及数据安全合规体系(例如行业准入资质、自建数据基地/安全屋等)。同时,数据服务商还应具备尽可能强大的算法能力,通过人机协作,持续降本增效,保证自身竞争力。因此,未来单纯通过低价策略的企业将由于缺乏技术、安全合规支撑而逐渐被淘汰出局,只有同时拥有平台、算法和安全合规能力的企业才会持续具备较强市场竞争力,市场集中度也将进一步提升。
答:经过多年发展与积累,公司逐步构建起了在行业内的竞争壁垒,核心竞争力主要体现在:
(1)公司的业务模式是服务产品双模式,且产品化贡献显著,是收入和毛利的主要来源,标准化数据集的研、产、销体系是公司从业多年探索出来的业务模式,其复用性为公司的规模化和高利润率提供了保障。而保持这样的能力需要具备对行业需求的强判断力和较强的资金实力。
(2)技术平台能力:公司历来重视技术的研发,近年来更是加大研发投入的力度,全面提升公司的算法能力、平台能力、工程化能力,加深算法辅助能力与人工工作的结合,达到更佳的人机协同效率,这样能够做大规模、提升效率、降低成本。
(3)供应链资源管理能力:公司拥有成熟的数据处理平台,解决了数据规模化过程中对产能、质量、成本几方面平衡的难题,同时通过长期建设的供应链体系,保障资源的获取,未来,公司会进一步加大供应链资源平台的建设,使人员管理、采标资源分配、质量检验、远程工作等各方面的能力得到显著提升,为垂直行业客户和政府客户的客群拓展提供支撑。
数据安全及合规能力已经成为了衡量品牌数据服务商综合能力的重要指标。公司在多年数据风险识别和管理实践中,已形成了较为成熟的安全、合规管理体系。公司全方位做好数据风险管控工作,通过了业内重要的ISO/IEC27001体系认证、ISO27701个人隐私信息安全管理体系认证,形成了具有自身特色的数据安全与隐私保护整体解决方案。目前,公司符合GDPR、《数据安全法》、《个人信息保护法》等一系列国际通用与国内法律法规的管理规范要求,获得了业务领域合作客户的高度认可。
答:公司标准数据集产品的积累方式主要为基于公司对市场需求趋势的判断和共性需求的提炼能力,先于客户需求开发数据集。数据集产品的这种商业模式在行业内往往具有较高壁垒,一方面需要公司对未来需求趋势有精准把握,另一方面由于产品开发属于先投入后产出,因此需要公司具备充足的资金保障,只有具有大量行业经验+know-how积累以及资金充足的企业,才能具备产品开发能力。因此,产品模式也成为公司区别于其他竞争对手的一大特色,目前公司产品数据集储备已处于行业头部水平,产品的积累对公司未来的收入扩张和毛利提升都将起到重要作用。
答:公司主要从事训练数据的研发设计、生产及销售业务,为人工智能产业链上的各类机构提供训练数据定制服务、训练数据产品和训练数据相关的应用服务。公司研发、生产的训练数据除覆盖了智能语音、计算机视觉及自然语言处理三大AI传统领域外,还可广泛服务于智能驾驶为代表的新兴垂直应用场景。
公司有着近20年AI训练数据行业经验,积累了有一定竞争力的算法能力,但公司并不将算法能力作为直接盈利模式,我们的算法主要服务于我们内部的数据生产,旨在提升数据生产的整体智能化水平、降本增效。
答:定制服务定价模式:一般采用成本加成定价法。公司根据客户的具体服务需求预估项目成本,在预估成本的基础上,参考公司制定的指导毛利率水平,结合项目技术难度、复杂程度、时限要求等进行报价,并根据市场环境与客户协商,最终确定价格。
产品定价模式:一般采用需求导向定价法。公司综合考虑训练数据集的开发支出、市场需求程度、预计未来重复销售的频率等因素,制定产品标准价格及价格区间,在销售过程中,根据客户的实际需求情况,以价格区间为基础向客户报价,经双方协商确定最终销售价格。训练数据产品通常以单个数据集为单位进行定价,定价比较灵活。
价格走势主要由市场的供需关系决定。如果某类数据为市场稀缺数据,例如具有较高进入壁垒的多模态、虚拟人等前沿类数据需求、或传统业务里的多语种数据,都可在一定时间内维持较高的溢价水平。但在较为成熟的细分方向,比如中文智能语音数据领域,确实存在进入者增多、价格竞争的情况。因此,未来公司将主攻有较高技术壁垒,存在较大毛利空间的细分场景,尽力避免价格竞争带来的过度消耗。
(1)产品与定制服务的收入占比产品的毛利为100%,因此产品收入占比较高的业务版块,将具有更高的毛利水平。
(2)定制服务本身的毛利差异客户所在区域(境内或境外)以及该区域内市场的整体供需关系将综合决定定制服务的毛利水平。通常来讲,由于境外客户更加看重数据服务商品牌和综合服务能力,因此愿意给出更高溢价;此外,若某类数据为市场稀缺产品,例如具有较高进入壁垒的多模态、虚拟人等前沿类数据需求、或传统业务里的多语种数据,都可在一定时间内维持较高的溢价水平。因此,更高的境外客户占比以及更高进入壁垒的数据需求,都将导致定制服务的综合毛利的增加。
答:智能化始终是公司坚持的重要发展战略,未来的数据行业一定将由资源主导向技术主导转型,单纯依靠人力增长来应对指数级增长的数据需求是不现实的,因此持续提升数据处理的自动化程度将成为提升数据生产能力的核心要素。公司目前已积累多种算法框架,上百种算法模型,全面覆盖智能语音、计算机视觉、自然语言等全AI技术领域,尤其在智能驾驶领域,公司更是积累了大量的优质算法,包括2D相关的车道线标注、视频跟踪目标标注、2D障碍物检测等以及3D相关的点云贴合、连续帧叠加、3D语义分割等算法等,大大提升了数据处理能力,使公司数据产出效率以及成本都得到了极大的优化。
答:产品数据集是先于客户需求形成的模拟数据,是公司区别于其他竞争对手的一大特色,基于公司对市场的判断和通用化需求的提取能力,其属于是一次性投入、未来重复授权销售,对于公司的营收、毛利有着重要作用;而定制业务的需求来源是客户的定向化需求,有些定制业务的原始数据来源是客户提供的实网数据,公司提供纯加工的服务,定制业务的开展有利于提升客户满意度和长期粘性。
客户的AI产品在上线之前及初期,因为其自身尚未产生实网数据,通常需要采购模拟型标准化数据集产品进行算法模型的训练,在产品上线并运行一段时间、产生大量实网数据之后,则会提供实网数据给到我们进行数据加工,加工的数据反哺到客户的算法模型上从而促进其终端产品/应用的迭代、升级。之后,客户需要进行产品功能或语种的拓展,再次需要购买模拟数据集来支撑,后续再采购数据加工服务进行迭代。
答:客户通常会从以下几个角度挑选供应商(1)技术能力即供应商是否具备该项目的标注能力,是否具有处理该类数据的标注工具。尤其在智能驾驶领域,技术能力显得尤为重要,是拉开供应商差距的首要原因。因为智能驾驶通常涉及大量的3D数据,而3D标注工具的开发难度远远大于传统语音和视觉类标注工具,对供应商的软件设计以及硬件能力都提出了更高的要求,建立了较高的技术门槛,因此也成为客户在筛选供应商时的首要考量因素。
(2)价格水平在具有同样标注能力的前提下,价格占优的供应商将具有更大优势。引入算法及提高操作平台的友好度将可显著提高标注效率,有效降低标注成本,具备更强的价格竞争优势。
(3)资源能力成熟的资源体系是保障公司产能的重要因素。资源覆盖度以及资源管理能力是供应商的重要竞争优势,尤其在智能驾驶领域,拥有更稳定的供应商资源以及更好的供应商管理模式,将可帮助企业更好的应对产能的波动以及进行成本管理。
(4)数据安全及合规能力近两年,随着数安法、个保法和相关法律法规的快速落地,我们感受到国家在全力支持数据行业加快速度进行发展的同时,也在同步加强对于数据安全的监管,这个趋势正在改变行业的规则,树立新的行业门槛。尤其是在智能驾驶领域,由于其数据涉及国家定义的重要数据以及个人信息,因此智能驾驶领域客户会更加注重供应商的数据安全能力,不仅要求其供应商具有相关资质,还要求其对整个数据生产流程做好安全保障。因此具备数安合规能力的企业将在竞标过程获取更大优势。
(1)境外业务:随着AI在越来越多的垂直场景应用落地,全球AI进入高速发展期,海外已呈现出快速增长的数据需求,尤其是将全球化扩张作为其收入增长核心动力的海外科技互联网企业、以及将AI及元宇宙作为重点发展方向的大型科技企业等,为更好实施其发展战略,已释放出快速增长的多语种数据需求,包括多语种语音需求以及多语种OCR需求等。海天已加快布局,通过规模化的多语种产品研发投入,精准对接海外客户需求。此外,为进一步撬动更大的境外市场需求,公司将增设海外本土销售团队,并通过多维营销方式增强海外客户触达,提升客户服务体验,力争实现海外市场收入在未来保持良好增长态势。
(2)智能驾驶业务:受智能驾驶技术级别的提升以及车企的规模化量产等因素驱动,智能驾驶领域的数据需求正在急速增长。为更好承接快速增长的数据需求,公司正在通过专业的销售团队建设以及领先的平台算法能力,加紧构建行业一流业务能力,快速拓展智能驾驶市场,2022年1-9月智能驾驶新增客户数量14个,前三季度验收订单额及截至三季度末在手订单额总计约5,000万元,同比增长超过200%。我们大家都认为,随着年底公司第四代智能驾驶标注平台的落地,公司平台能力将达到行业头部水平,将进一步助力公司智能驾驶业务的快速拓展。
更为长远的看,公司的业务增速将与AI结合各行业的渗透率呈一致关系,当AI深入到更多垂直行业场景中去时,高质量训练数据都将成为不可或缺的驱动要素,并为公司持续带来业务扩展及增量机会。
答:目前公司已在进行供应链扩张和数据基地的布局以支撑快速增长的产能需求。今年上半年,公司已在安徽省建立并投入运营一体化基础数据创新服务基地,可为包括智能驾驶、计算机视觉类业务生产提供全方位支撑。长期来看,训练数据行业的发展将由资源主导转变为技术主导,单纯依靠人力增长来应对指数级增长的数据需求是不现实的,因此持续提升数据处理的自动化程度将成为解决产能问题的核心要素。目前,公司正在强力布局算法中台,使标注过程向更加智能化的方向演进,同时辅以自主建设的数据基地及不断优化的供应链在资源、数安合规等方面助力公司产能不断的提高,已满足不同客户群体的需求。
答:为更好支撑境内、境外传统业务以及智能驾驶业务的快速扩张,公司正在加速进行供应链体系升级,包括加大全球小语种区域的资源储备,降低对单一供应商的依赖以及采购成本。此外,为更好支撑公司智能驾驶业务增长,公司通过政企合作、校企共建等方式开展自主可控数据基地的布局,并通过安全屋体系建设,确保数据处理及流转过程的安全合规。今年上半年,公司已在安徽省建立并投入运营一体化基础数据创新服务基地,可为包括智能驾驶、计算机视觉类业务生产提供全方位支撑;
北京海天瑞声科技股份有限公司的主营业务从事AI训练数据的研发设计、生产及销售业务。公司的主要产品有数据资源定制服务、数据库产品、数据资源相关的应用服务;公司自2007年至今连续荣获“国家高新技术企业”及“中关村高新技术企业”称号,2018年被评为国家规划布局内重点软件企业。公司是“中国人工智能产业发展联盟”、“中国语音产业联盟”的理事单位,参与了行业标准的起草工作,在人工智能数据库架构设计、开发标准、质检评测等领域,以专业性和创新性获得了行业的普遍认可。公司近年来获得了2017年中国信息协会、信息化观察网评选的“年度人工智能数据服务领域领军企业”;2018年中国语言产业联盟颁发的“智能语音创新大赛行业先锋奖”;2018年中国信息协会、信息化和软件服务网颁发的“2018年人工智能行业最佳产品”等多项国内外人工智能领域奖项。
上一篇:什么是强固型工控机?探索强固型工控机的必要特性 下一篇:黑龙江省新能源集团有限公司公开招聘公告