百度众包数据标注怎么赚钱(百度众包数据标注怎么领任务)

研究框架:

A 核心逻辑点

B 行业空间及增速

C 公司商业模式与现金流

一、核心逻辑点

人工智能做为新兴产业,将逐渐成为重要组成部分。我们前期围绕中游制造设备公司做了开关研究,可以感知到未来智能化的趋势正在加强,但对于上游的算法类和数据类公司研究不多,而下游的产品类,相对较为集中,已经形成了较好的竞争格局。但专业化的上游公司,还在初期阶段,市占率不高,我们要寻找具备龙头潜质的企业,长期配置,享受成长价值。

海天瑞声在语音数据处理方面已经具备国内龙头潜质,现在向机器视觉拓展,对标国际企业APPEN。作为专业化的“数据工厂”,随着下游的需求提升,业务量将逐渐释放。目前在处行业发展的前期,头部企业,跑马圈地,市场份额将逐渐集中,公司成长可期。

行业空间及增速

1. 全球市场增速

2019 年年末,全球共有 5,386 家活跃 AI 企业,27,400 名高级研究人员, 20 座重点发展城市。2019 年,全球人工智能行业共产生约 374 亿美元融资,其 中,自动驾驶、药物医疗、人脸识别、视频内容和金融反欺诈是获得融资最多的 北京海天瑞声科技股份有限公司 招股说明书 1-1-127 领域。根据国际数据公司(IDC)的数据,2020 年,全球人工智能产业规模达到 501 亿美元,预计 2024 年将达到 1,100 亿美元,年复合增长率为 21.73%。

百度众包数据标注怎么赚钱(百度众包数据标注怎么领任务)

2.中国市场增速

截至 2019 年年末,中国(不含港澳台)活跃 AI 企业达到 1,189 家,占全球 总数的 22.08%,位居全球第二;中国高级研究人员共有 533 名,AI 人才储备方 面综合排名全球第七,仍有较大的发展空间。2019 年期间,中国人工智能领域 论文的发布数量占该领域全球论文发布总量的 28%,位列全球第一;2008-2019 年人工智能领域的专利申请共发生 448,684 项,中国拥有 66,508 项,位列全球第 二,中国的 AI 技术水平处于全球前列。2019 年,中国人工智能行业的融资总额 约为 166 亿美元,占全球的 44.39%,位居全球首位。根据国际数据公司(IDC) 的数据,2020 年,中国人工智能产业规模将达到 62.70 亿美元,预计 2024 年将 达 172.16 亿美元,年复合增长率达到 30.40%。

百度众包数据标注怎么赚钱(百度众包数据标注怎么领任务)

从行业空间看,随着下游应用场景的不断丰富,市场空间被不断打开,从智能语音,到未来最大的增量市场——智能驾驶,这将是未来3年最增速和增量最大的板块,机器视觉将迎来爆发期,数据企业将大大受益,企业的成长速度将可能迎来加速期。

  1. 公司商业模式与现金流

1商业模式 : 产品+服务

百度众包数据标注怎么赚钱(百度众包数据标注怎么领任务)

公司的盈利模式主要包括以下三类: (1)训练数据定制服务:发行人根据客户需求提供训练数据定制服务并收取 服务费。在此种模式下,发行人仅享有服务费收入,不享有最终生成的训练数据 的知识产权,不可将此类业务生产的训练数据向其他客户重复销售。 (2)训练数据产品:发行人开发自有知识产权的训练数据产品,通过销售训 练数据产品的使用授权许可,获取让渡资产使用权收入。此类训练数据集一经开 发完成,可多次销售并获取授权许可收入。 (3)训练数据相关的应用服务:发行人基于生产的训练数据提供算法模型相 关的模型拓展及训练服务,通常以软件授权或软硬件一体化形式交付算法模型拓 展、开发成果,获取让渡资产使用权收入和技术服务收入,以及极少量硬件销售 收入。

公司的主要产品是以训练数据包为基础的软件,产品的生命周期为5年左右,具有一次研发多次授权出售的属性。

公司的服务是围绕定向客户的定制服务进行数据处理,收取加工服务费,按次收费的模式,具备连续性。

竞争壁垒及竞争格局

(1)竞争壁垒

第一、从目前观察看,行业的进入门槛并不高,主要的原因,行业还处在发展的初期,对于各家公司的要求并不高,具备采集能力的企业都可以参与进来,但随着数据量在逐渐放大,对于响应速度和处理工艺,及算法的要求会逐年提升,品牌与算法工艺将逐渐成为了行业发展的壁垒。

第二、与下游企业的绑定能力,目前下游的主要应用厂商是头部的互联网企业,也是市场的主要需求方,需求方对基础数据服务商的数据安全、采标能力、数据质量、管理能力、服务能力等核心能力有很高的要求,对数据企业来讲,能否长期绑定下游企业将决定企业的命运。

第三、随着应用场景的不断丰富,对数据企业的综合处理能力提出更高的要求,语言、视听等,结构单一,能力单一的企业将被淘汰出局,对于能够持续进行研发投入,适应市场的变化,将赢得更大的市场份额,也将形成竞争的壁垒。

(2) 竞争格局

目前世界范围内,最大的公司的APPEN,在澳大利亚,其客户涵盖世界主要的互联网企业。

国内的主要公司包括,百度众包,海天瑞声,慧听与标贝。

百度众包数据标注怎么赚钱(百度众包数据标注怎么领任务)

百度众包数据标注怎么赚钱(百度众包数据标注怎么领任务)

百度众包数据标注怎么赚钱(百度众包数据标注怎么领任务)

百度众包数据标注怎么赚钱(百度众包数据标注怎么领任务)

从竞争格局看,中国市场还处在早期阶段,头部企业并未形成足够的竞争壁垒,但目前的行业集中的趋势正在加强,根据《行业研究报告》,2019 年中小型数据服务商市场份额比预期值缩小 20.8%,相应市场份额按 7:3 的比例 北京海天瑞声科技股份有限公司 招股说明书 1-1-135 向品牌数据服务商和需求方自建基础数据团队转移,因此品牌数据服务商将获得 大部分“红利份额”,商业价值逐步凸显。

百度众包数据标注怎么赚钱(百度众包数据标注怎么领任务)

我们将持续关注市场份额集中度情况,来判断企业发展的竞争力。预期未来三年时间内,行业集中速度将随着智能化要求的水平得以大幅提升。

公司现金流分析

百度众包数据标注怎么赚钱(百度众包数据标注怎么领任务)

百度众包数据标注怎么赚钱(百度众包数据标注怎么领任务)

我们判断一家企业是否优秀,其中一个很重要的指标是公司能否持续产生稳定增长的现金流,这是商业的本质。

目前公司最大的现金流来源在于采集数据进行加工形成训练数据,进行销售,具备一次投资,多次销售形成现金流的特点,是类似软件游戏的模式,可以持续产生现金流,也是公司主要的收入来源。

类似企业APPEN,能够做成全球第一,主要的优势在于具备100万人较为全面的数据源,成本可控,覆盖面全,可持续性强,同时应用场景多,涵盖4大行业。

对比海天瑞声,由于数据收集主要是外包,还未形成对数据的控制权,数据的多样化与专业化,还有很大进步空间。同时,在下游的应用场景上,主要集中的语音领域,下游拓展力度还不够。2019年,中国移动和中国互联网投资基金的进入,为产业赋能做了准备,可能会向5G及政府方向发展,但还要看项目的落地。

未来另一块现金流来源是数据加工,定向加工及数据的反复处理。这块业务的比重在逐年增加,随着数据量的指数级爆发,公司的加工产生的现金流也将持续增加。

总结:

  1. 人工智能行业处在高速发展期,智能语音,智能驾驶等场景的不断拓展,提升市场的需求,国内行业增速未来三年有望保持30%以的复合增速。具备较高的行业空间与增速。
  2. 行业竞争上,还处在初期阶段,头部企业的潜质初现,但还会经历激烈竞争的过程才能真正形成良好的竞争格局,目前这个阶段还未到来。
  3. 从商业模式看,版权式现金流是优秀的模式,但需要对持续提升自己的竞争壁垒,通过专利形式或持续研发投入来巩固地位。海天瑞声,具备经验与客户优势,但还需要持续开发下游客户,适应市场的变化,才能保持现金流的持续增长。对于成长期的海天,还是要多点耐心,等待公司慢慢培育自己新的增长引擎。可以做小量长期配置,等待新的增长动力显现。
本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 sumchina520@foxmail.com 举报,一经查实,本站将立刻删除。
如若转载,请注明出处:https://www.sumedu.com/faq/240148.html