25岁的Ali Ansari拿着5亿美元估值,正在改写创业纪录。他的公司micro1不做模型,不碰算力,只做一件事:帮OpenAI们找医生、律师、程序员来"教"AI怎么说话。这大概是AI淘金热中最赤裸裸的"卖铲子"生意——而且铲子比金子还贵。
从外包到基础设施的估值跃迁
micro1的5亿估值(约36亿人民币)背后,是资本市场对AI数据层的重新定价。过去,数据标注被视为劳动密集型外包,按人头计费;现在,它成了"AI基础设施关键组件",享受SaaS级估值倍数。这种转变源于一个残酷现实:大模型厂商卷到头发现,算力可以买,算法可以抄,但高质量的人类反馈数据(RLHF)却越来越稀缺。
更关键的是差异化定位。与Scale AI的"众包模式"不同,micro1走的是"专家网络"路线——招募的是领域专家而非廉价标注员。在法律、医疗、代码这些专业门槛极高的领域,AI需要的是拥有隐性知识的真人判断,而非机械标注。这种"高端人力密集型"模式,短期内确实构建了护城河。
但别被"25岁亿万富翁"的标题骗了。按常规持股15-20%计算,Ansari实际身家约7500万到1亿美元,离真正的billionaire还差一个量级。更重要的是,这个行业天生带有一个自我消亡的悖论:AI越是通过人类数据变强,未来对人类标注的依赖就越少。一旦模型实现自举训练(Bootstrapping),或者用合成数据解决崩溃问题,micro1的商业模式就会面临断崖。
数据即石油,但油井会枯竭
短期内,micro1们还有1-2年的蜜月期。模型对齐(Alignment)需求正在爆发,监管也可能强制要求人类可解释性标注。但中期来看,AI辅助标注工具正在快速替代人工,行业将从"人力密集型"转向"专家密集型"——这意味着规模效应减弱,边际成本难以下降。
5亿美元估值本质上不是投给micro1的,而是投给AI军备竞赛中"数据稀缺性"的恐慌溢价。当资本从大模型层外溢到数据层,任何能提供高质量RLHF数据的公司都会获得离谱的估值。但这笔钱能烧多久,取决于AI进步的速度——讽刺的是,客户(AI公司)越成功,供应商(数据标注商)的末日就越近。
对于从业者而言,micro1的崛起标志着一个明确信号:AI赛道的机会正在从"造模型"转向"养数据"。但别忘了,在自动化终极胜利之前,这仍然是一场与时间赛跑的生意。要么在AI还"笨"的时候赚够钱转型,要么最终被自己养大的AI取代。
本文由 AI 辅助生成,仅供参考。