消息,2024年8月30日海天瑞声(688787)发布公告称公司于2024年8月28日召开业绩说明会,东吴证券黄诗涛、信达澳亚马绮雯、大和住银刘明、锦成盛资产王懿晨、庶达资产李淑花、长宜基金王勃、新华基金张帅、中邮计算机丁子惠、中信证券朱珏琦 韩林轩 许英博、华夏财富创投戴永毅、誉辉资本郝彪、国信证券闵晓平、建信养老高月、景泰利丰资产吕伟志、景泰利丰投资邹因素、锦绣中和投资方家逸参与。
具体内容如下:
问:公司上半年收入增长的主要驱动因素是什么?
答:2024 年上半年,受益于多模态大模型的发展、《促进和规范数据跨境流动规定》出台带来的政策环境改善以及公司在境外营销体系的持续投入,公司境外业务收入同比增长 50.00%,拉动公司整体营业收入快速增长。
问:公司上半年净利润增长的原因是什么?
答:公司在上半年收入增长的同时,由于标准化数据集产品收入占比大幅提升,同时公司整体数据交付能力在管理能力、平台技术提升、供应链进一步整合和扩展等因素的共同推动下,使训练数据定制服务的毛利率也同比显著增长,共同驱动公司整体毛利率增加至70.34%。同时,在研发投入方面,随着首发募投项目的结项,公司在传统深度学习数据集建设等方向已达到阶段性成熟状态,整体研发投入强度呈现自然落;同时,在销售及管理投入方面为进一步提升整体运营效率,公司进行了资源的合理配置和流程优化,使得销售费用以及管理费用有效降低,以上因素共同驱动公司上半年净利润大幅增长,实现扭亏为盈。
问:公司在全球化业务增长的原因是什么?
答:2024年上半年,受益于大模型技术的快速发展以及应用领域不断拓展,以智能终端厂商为代表的科技巨头纷纷加大多模态数据投入,全球数据服务市场持续增长。在此背景下,公司凭借多年来在语言研究以及自然语言方面的技术积累、以及全球领先的标准化数据集储备,进一步赢得了境外客户信赖。与此同时,《促进和规范数据跨境流动规定》等法规出台,为数据出境提供了更为高效简明的路径。以上行业发展以及政策环境的改善,使得公司境外业务收入较上年同期显著增长50.00%至 4,369.53万元。
问:公司在大模型业务上有何布局和进展?
答:2024年上半年,公司继续加大大模型数据方向的研发投入,增厚大模型领域的数据储备,已完成并持续建设包括“大语言模型中文对话预训练数据集”、“语音大模型(声音复刻、歌曲)微调数据集”、“语音大模型(多语种)预训练及微调数据集”、“视觉大模型(图像-文本)预训练及微调数据集”、“视觉大模型(视频-文本)预训练及微调数据集”等在内的多领域大模型数据集。同时,针对大模型在特定行业的应用需求,公司重点开发了医疗、金融、法律、艺术等垂直领域的标注资源,形成垂直领域专家库,为公司提供高质量行业数据服务奠定坚实基础。与此同时,为更好理解大模型技术方向,公司通过前瞻性研究,探索大模型数据的规模化生产方式。公司已和清华大学联合启动多语种语音大模型研发计划,该项目将基于最新的语音大模型框架技术,自研多语种数据清洗技术,训练多个不同规模的语音大模型,有效提升多语种语音数据处理的效率和准确性。
问:公司在智能驾驶领域有哪些最新进展?
答:为更好抢抓智能驾驶行业机遇,同时应对更为复杂的数据处理需求,2024年上半年,公司加大了对高级别数据标注工具的研发力度,截至6月底,DOTS-D平台新增 3D动静分离标注工具,BEV多图层 4D车道线标注工具,并升级点云分割工具支持连续帧叠加标注和4D分段加载等核心能力,有效支撑了自动驾驶 BEV和 OCC主流算法演进对数据标注工具的需求。此外,公司不断优化算法中台中枢能力,开发了 2D-3D 融合的动静分离检测追踪算法,在点云连续帧融合产线实现提效 30%以上,迭代优化点云分割算法和地面检测算法,在点云分割产线实现提效 20%以上。此外,为进一步支撑我国车企的国际化战略,公司在全球范围内扩展了道路采集业务,可提供包括采集方案设计、采集人员组织、车队管理、车辆改装及数据清洗与脱敏等在内的全链条服务。2024年上半年,公司采集业务已覆盖包括德国、西班牙、捷克等多个国家,为公司构建智能驾驶全球化数据服务能力奠定了基础。
问:强化学习阶段的数据服务,今年有何进展或者变化?
答:目前来看,随着各大模型的陆续上线,强化学习环节的整体数据需求在逐渐攀升,并在具体标注任务上呈现如下趋势(1)由单模态向多模态转变23年主要的标注需求集中在文本类标注,今年开始逐步向多模态拓展(例如,文本-视频、文本-图像等);(2)逐渐向更多垂类拓展(例如,法律、金融、医疗);(3)强化学习标注的评价/评分指标变得更为丰富,会要求标注人员从更多维度对模型的问进行评判和打分。
问:请大模型向多模态发展后,是否会对公司业务产生正向影响?
答:大模型向多模态发展后,将会产生更多的新型数据需求。例如文生图的多模态大模型,通过文字输入生成对应图片,这就需要机器理解文字语义的同时将理解的关键词与图片的关键标签进行映射,通过对齐两种独立模态关键特征的方式,实现按指令的创作,以此完成学习训练过程。因此,当大模型向多模态能力维度拓展时,高质量多模态训练数据集的持续学习训练的重要性将更加凸显,多模态的发展将推动数据服务行业进入更大的增量空间。
海天瑞声(688787)主营业务:AI训练数据的研发设计、生产及销售业务。
海天瑞声2024年中报显示,公司主营收入9242.64万元,同比上升24.13%;归母净利润41.64万元,同比上升102.42%;扣非净利润-367.58万元,同比上升84.09%;其中2024年第二季度,公司单季度主营收入5178.11万元,同比上升13.45%;单季度归母净利润105.06万元,同比上升128.98%;单季度扣非净利润-102.95万元,同比上升83.0%;负债率4.37%,投资收益291.14万元,财务费用84.64万元,毛利率70.34%。
该股最近90天内无机构评级。
以上内容为据公开信息整理,由智能算法生成,不构成投资建议。