努力加载中
  • 推荐
  • 要闻
  • 财经
  • 娱乐
  • 时尚
  • 情感

热点推荐

热门图文

30岁华裔美女,躺赢成全球最年轻女富豪
科技每日推送

一场千亿投资,造就2位全球最年轻白手起家亿万富豪。

95后华裔天才少年获投千亿

女联合创始人躺赢

6月13日,Meta出资143亿美元(约1027亿元人民币),收购人工智能数据标注公司Scale AI 49%的股权,这家公司的估值随之超过290亿美元(约2081亿元人民币)。

Scale AI联合创始人兼CEO汪滔(Alexandr Wang)为美籍华裔,1997年出生于美国,父母都是物理学家。19岁时,他从麻省理工学院辍学,与当时21岁的郭露西(Lucy Guo)联合创办了Scale AI。

2021年,仅24岁的汪滔当选为《福布斯》全球最年轻白手起家亿万富翁。今年4月,福布斯发布的“2025全球最年轻亿万富豪榜”显示,汪滔以20亿美元(约143亿元人民币)的财富位列第7位。

汪滔将加盟Meta,有望领导其“超级智能”部门。

这次受Meta投资影响,早以离职但保有股权的郭露西,凭借5%的股份,身价暴涨达到12.5亿美元(约89亿元人民币),超越知名歌手泰勒·斯威夫特,30岁直接躺赢,成为全球最年轻的白手起家女性亿万富豪。

这是Meta历史上仅次于WhatsApp的第二大投资案。

数据标注是指对原始数据进行采集、清洗、分类、标记等活动,是人工智能发展的重要环节。

不过,在很多人的眼中,它就是人工智能时代的新流水线工厂,单价低、门槛低、上线不高,在谈论人工智能时,人们也多在讨论大模型、算力,对数据标注有些看不上。

那为什么Meta要斥巨资拿下数据标注公司?国内的数据标注公司有可能复制Scale AI的投资神话吗?

数据是人工智能生命线

在这笔投资公布前,汪滔在一档播客节目中谈到,过去几年,大家都在疯狂砸钱砸人,建模型、堆参数,但现在可以看到,光靠模型,很容易卡死在数据这一步。

他将数据称为人工智能的“原材料”和“生命线”。

人工智能大佬吴恩达也曾提到,在深度学习时代,拥有数据的人将胜过拥有算法的人。

数据直接决定了人工智能模型性能水平,这在行业内几乎是共识,高质量数据集才能练就出高性能基础大模型。

如Meta这样的巨头公司,它们有钱,模型所需的算法、算力都不缺,旗下还有Facebook、Instagram等大型社交媒体平台,数据也不缺,唯一缺的是,将海量数据加工成AI模型训练所需要的高质量数据。

Meta的Llama系列大模型就曾因训练数据质量问题饱受诟病,一部分训练数据来自低质量社交媒体内容,导致模型在复杂推理任务中表现不佳。

另一方面,Scale AI作为全球数据标注行业头部企业,服务全球70%主流AI模型,客户包括OpenAI、谷歌、微软、特斯拉、英伟达等,掌握了模型训练核心数据流。

对于Meta来说,投资入股后,可以打破竞争对手的数据封锁。

当然,其他公司可能会转而寻求其他竞品,比如谷歌已经宣布与Scale AI停止合作。

国内对标企业

市值仅不到10亿美元

Scale AI的火爆也带动了国内数据标注企业的股价上涨,海天瑞声涨超7%。

但从市值上看,不到10亿美元的海天瑞声还远算不上Scale AI的对手。

今年第一季度,海天瑞声归母近利润37.16万元,扣非净利润亏损68.48万元,仍在盈亏线上挣扎。

Scale AI深度绑定自动驾驶和大语言模型等高增长、高利润领域,自动驾驶每公里路测数据需数千美元的标注费用,OpenAI训练GPT-4的数据集成本超1亿美元,并且还承接了美国国防部的稳定订单。

海天瑞声则是以行业垂直类场景为主,比如智能客服、安防监控,需求分散且单价较低。即使客户中包括阿里、腾讯等巨头,但其收入仍依赖传统的语音数据服务,自然语言处理和计算机视觉业务尚未形成规模效应。

并且,国内企业倾向于自建数据标注团队,比如百度、字节,数据标注公司面临着与客户竞争的压力。

在技术上,Scale AI搭建起了覆盖全球的数据标注网络,其自主研发的平台可支持不同国家或地区的几十万人同时在线工作,并且还能进行人机协同标注。

海天瑞声的技术升级则相对落后,核心业务还是依赖传统的人工标注,一季度研发投入占比仅18.84%,同比下降13.49个百分点。

同时,Scale AI的商业模式相对标准化,主要采用按需付费+订阅制,客户可以根据训练需求动态调用其标注资源。

海天瑞声以定制化服务为主,项目周期长,收入波动大,难以形成规模效应。

不过从资料上看,今年中国数据标注市场规模预计将达到200-300亿,政府已经出台了相关政策,还搭建了国家级数据标注基地,虽然暂时处于初期阶段,但数据标注已然进入发展快车道。

相关推荐
x