怎么在中国登陆whatsapp
2025年06月13日,143 亿美元,49% 股权——Meta 甩出自 WhatsApp 以来最大一张支票,只为收编全球最“懂”数据的独角兽 Scale AI。
这不是一场 VC 式下注,而是一场战略级并入:交易一落槌,年仅 28 岁创始人 Alex Wang 直接跳进 Meta 总部,出任“超智部门”掌门人。
去年,它靠“喂数据”就创收 8.7 亿美元,累计完成 130 亿次数据标注、8700 万条生成式清洗,堪称 AI 世界的“炼油厂”。
但就在交易官宣前 72 小时,Alex Wang 在播客《Shawn Ryan Show》聊了3个多小时,其中抛出了一个核心洞察:
本篇文章,将以这场少有人完整解读的访谈为主线,结合 Bloomberg、TechCrunch 等最新消息,
这一两年,几乎所有大模型玩家都掉进一个陷阱:以为只要把模型调得更大,AI 就会自己变得聪明。但现实是,模型能力再强,如果没有高质量的数据“喂养”,它就像一辆超跑没有汽油——再强的引擎也跑不起来。
而且这个卡点,不是有没有数据,而是:这些数据是不是适合你要做的任务,是不是能持续更新,能不能快速反馈。
这正是 Scale AI 能值 143 亿美元的原因——它不是造模型的,它是给所有模型“喂饭”的那个角色,而且是能按需配餐、持续上菜的厨房。
Alex Wang 说:“我们和 Meta 的对话其实很早就开始了,他们不是来看模型 demo 的,他们关心的,是能不能建一套更快、更安全、更可控的流程,把任务级数据、用户级数据,接到 AI 输出上。”
不是再去买别人做好的菜,而是自己建厨房、备原料、控火候,把“做饭”这件事变成标准化的流程、随时可复用的模块。
整个过程不是接单做外包,而是一次次打磨出适合不同模型、不同任务、不同平台的数据“喂养流程”。
因为外界一提起 Scale AI,最容易想到的就是“数据打工人”:帮大模型贴标签、补数据、做苦力。
但 Scale AI 做的是反过来的: 他们先定义一个任务,比如“自动识别卡车驾驶中的异常动作”,再去造出一批真实场景的数据来喂模型。
在访谈中,Alex Wang 说:我们最强的能力是,从0到1构造出特定任务的数据集,比如你要模型做保险理赔、识别化学泄漏、或者国防级任务。
他们有一个全球最大的“人类反馈团队”之一,由熟悉领域的专家,对 AI 输出的结果进行打分、修改、反馈。
你可以把他们理解成 AI 世界的“炼油厂”: 原始数据就是原油,模型就是发动机怎么在中国登陆whatsapp,而 Scale AI 提供的是一整套把原油提炼成适合每台发动机使用的高标号燃料的装置。
表面原因是 Meta 收购 Scale AI 引发的竞争担忧,但这背后反映了一个更深层的趋势:在 AI 竞争的关键时刻,没有任何一家科技巨头愿意把数据这个核心生产资料交给别人控制。
过去,大公司用外包团队清洗数据,现在,越来越多开始自己建数据流水线,只因为他们意识到:谁掌握数据的采集、筛选和微调,谁就能决定 AI 的能力上限。
如果还在堆参数、抢算力,但数据只靠“公域爬虫 + 少量人力标注”,很快就会被美国厂商拉开差距。
如果你做医疗、金融、政务 AI 应用,手里有细分行业的真实数据却没能力做“精加工”,你就只是在“搬砖”。而 Scale AI 做的,就是把“搬砖”变成“挖矿”——数据可以被提炼、提价、重卖。
他说 Scale AI 会越来越多支持“定制型数据工厂”的需求。你提供需求,他们给你“造数据”,这等于给中小型团队开了一条通道——只要你知道你想训练什么,他们就能帮你配一套数据+反馈流程,让小公司也能训练出类 ChatGPT 的效果。
Alex 说,他们内部现在重点服务的对象,正是非 OpenAI 等头部模型客户,而是有明确定义任务的企业、机构和新创团队。
这家公司真正要做的,是成为AI时代的数据代工厂——为最关键的客户和最重要的应用场景,提供从数据到AI能力的端到端解决方案。
Alex Wang 在访谈最后透露了一句话,有人听完觉得“太远”,但懂的人知道,这是个信号:
Alex Wang 表达的意思是:数据并非 AI 的一部分,而是让 AI 运转起来所必需的基础原料,这套“工厂”流程其实就是 AI 的底层运行框架
我们今天讨论的 AI,不应该只是一个模型能生成多少字、回答多精准——而是它有没有能力长期、稳定、按需完成任务。而这些任务背后,全靠一个稳定喂数据、改数据、再训练的后台机制。
数据工厂,正被推向一个更高的位置——它不再是模型训练的配套环节,而是 AI 工作方式的定义平台。
这不是一次判断,而是一整套理解任务的过程。而背后,必须反复训练模型对这类任务的“学习路径”——每次训练,都伴随着新一轮的数据生成、清洗、打标签、回流。
“最终,我们希望每个任务背后都有一条‘数据链路’,这条链路就像一个接口,让 AI 知道它该干什么、怎么学会。”
说白了,Scale 想做的不是数据搬运工,而是打造一套“任务级的数据接口”平台——你有一个任务,它就能搭出一条专属的数据管线,让模型吃进去、消化掉、理解透。
但比起我们熟悉的 Windows,Scale 更像是AI 工业世界的“数据总包商”:既负责设计训练标准,又操盘数据执行,还能把这套“管道”作为服务给其他 AI 模型调用。
未来的每个 AI 应用场景,都会有一个“数据喂养接口”。谁控制这个接口,谁就控制了整个生态的起点。
正如操作系统之于PC,App Store之于手机,数据工厂也在成为AGI时代的重要基础设施之一。
Alex Wang 的 Scale AI,也许并不掌握模型,但他掌握如何让 AI 学得更像人类的方法论——
如果说,AI 是一场军备竞赛,模型是“坦克”,算力是“油箱”,那数据工厂,就是那座隐藏在后方、源源不断产出弹药的“军工厂”。
他是在收编一套 AI 能力的底层流程,把数据从“外包资源”变成“内部资产”,再反手嵌入到 Meta 每一个 AI 工具里。
而 Alex Wang,则把这套流程打磨成了工厂模板: 从原料收集、精细加工,到微调反馈、迭代出厂——一套能喂 AI、改 AI、放大 AI 的工业方式。
未来三年,大模型能力很可能趋同,但决定胜负的,不是谁参数多,而是谁能掌控一条“数据-反馈-迭代”的闭环通路。