最近看完一场关于罗福莉的播客访谈,我一开始关注的是一些比较“人物化”的信息:她喜欢招大二、大三的本科生,觉得他们还没有被旧范式污染;她睡眠很少,精力很强;雷军对她足够信任,愿意放手让她去做。

但再往深处想,我发现这些都不是孤立的八卦。它们背后其实指向同一个问题:

在 AI 范式剧烈变化的时候,一个人、一个团队、一个组织,到底应该怎么做事?

这期访谈真正打动我的地方,不只是大模型技术本身,而是它呈现了一种在高速变化环境下的生存方式:提前判断方向,快速组织试错,敢于停止错误投入,并且用足够开放的组织结构去吸收新的信号。


一、 这不是一次普通访谈,而是一次范式切换的现场记录

这期播客表面上在聊 OpenClaw、MiMo、Agent、后训练、模型架构和组织管理。但我认为它最核心的判断是:AI 正在从 Chat 时代进入 Agent 时代。

  • Chat 时代的核心是: 用户问一句,模型答一句。
  • Agent 时代的核心是: 模型要能长期理解上下文,调用工具,执行任务,修正错误,并在复杂环境里持续完成事情。

这不是简单的产品形态变化,而是整个技术栈和组织方式都要跟着变化。

过去大模型竞争很大程度上是 Pre-train 的竞争:谁的数据更好,谁的参数更多,谁的算力更强,谁的基座能力更强。但到了 Agent 时代,Post-train 变得极其重要。模型不仅要会“说”,还要会“做”;不仅要懂语言,还要懂任务;不仅要在 benchmark 上表现好,还要能在真实工具链和长程任务中稳定工作。

所以我觉得这期播客最大的价值不是告诉我某个模型多强,而是提醒我:

以后真正重要的能力,不只是训练模型,而是设计一个能让模型完成任务的系统。

这句话对我自己的科研、学习和产品思考都有很强的冲击。

二、 扁平化不是情怀,而是新范式下的效率结构

我以前听到“扁平化管理”,会觉得这是一种创业公司常见话术,好像听起来很自由、很理想主义。但罗福莉这期访谈让我重新理解了这件事。

她所在的小米大模型团队虽然属于大公司,但实际状态更像一个高密度、高不确定性的创业团队。她提到他们没有严格的小组、没有传统职级,甚至没有特别强的 deadline 约束。这听起来很反常,尤其是在训练 1T 级模型这种巨大工程里。

但我现在理解了:在一个范式还没有稳定的领域,过强的层级会降低组织对新信号的感知速度。

传统组织适合处理确定性任务。比如目标明确、路径明确、指标明确,只需要把任务拆开、分发、推进、验收。但大模型和 Agent 这种领域不是这样。它的问题是:

  • 技术路线变化太快;
  • 昨天有效的方法今天可能失效;
  • 一线工程师、研究员可能比管理者更早看到新信号;
  • benchmark 可能还没来得及定义,真实体验已经发生变化;
  • 很多判断不能等层层审批后再做。

这个时候,如果组织层级太重,就会出现一个很危险的问题:真实信号传不上去,错误决策停不下来。 我现在更愿意把扁平化理解为: 在高度不确定环境下,让真实信号以最短路径进入决策系统。

一个小团队真正需要的不是形式上的分工,而是高质量的信息流:谁能最快发现问题,谁敢指出问题,谁能在方向错的时候让项目停下来。

三、 遇到问题停下来改,不是浪费,而是专业

我特别注意到一个细节:她们在训练模型时,如果遇到问题,会停下来分析和改进,而不是为了“不浪费已经投入的算力”继续硬训。

因为我自己做科研或者跑实验时,经常会有一种心理:“既然已经跑了这么久,要不先跑完再说。” 但这其实是一种沉没成本陷阱。

在大模型训练里,算力当然昂贵。但比算力更昂贵的是:在错误方向上继续投入。

  • 如果数据有问题,继续训只会把问题放大。
  • 如果任务定义错了,loss 再漂亮也没有意义。
  • 如果评估指标不匹配真实目标,跑出来的分数越高,反而越危险。

这让我想到我自己做 3DGS 相关实验时也遇到过类似问题。有时候不是训练迭代数不够,而是更基础的东西错了:数据集语义对了吗?相机参数对了吗?当前结果是真的变好,还是只是指标表面好看?

所以我从这期播客里得到一个很重要的方法论:先判断系统是否正确,再决定是否扩大投入。

以后我做实验时,应该建立一种“停止机制”:

  • 数据错了,停;
  • 任务定义错了,停;
  • 可视化明显跑偏,停;
  • 只是为了不浪费已经跑的时间而继续,停。

真正专业的研发不是一直往前冲,而是知道什么时候应该停下来。

四、 一个好模型,不是在发布前一个月突然做出来的

这期播客里最值得反复琢磨的一点是:训练一个好模型,很多胜负在半年甚至一年前就已经决定了。

一个模型发布时,大家看到的是结果:速度快、成本低、Agent 表现好。但这些能力往往来自很早之前的一系列判断:是否提前意识到 Long Context 会重要?是否提前建设 Post-train Infra?是否提前判断未来真正的瓶颈在哪里?

这让我意识到一个残酷事实:真正的竞争,往往发生在别人看不见的时候。 等到一个趋势已经成为热点,再开始追,很多时候已经晚了。

我现在应该思考:半年后,AI 编程会变成什么样?3DGS、视觉互动产品哪些会被商品化,哪些还有研究空间?我现在积累的能力,半年后还值钱吗?

今天的选择,会变成半年后的能力边界。

五、 关于“招大二大三”:不是学历问题,而是路径依赖问题

为什么她会觉得年轻本科生“还没有被污染”?

我理解,不是说本科生一定比研究生强,而是:在旧规则失效、新规则还没完全形成的时候,没有被旧路径训练得太牢的人,反而更容易切换。

很多人越有经验,越容易有路径依赖。在科研里,传统路径可能是:读论文 $\rightarrow$ 找 baseline $\rightarrow$ 改模块 $\rightarrow$ 跑指标 $\rightarrow$ 写论文。这套方法不是没用,但面对 Agent 时代的新研究方式时,可能会反应慢。

因为现在很多事情已经变了:文献调研可以被 AI 加速,实验对比可以被自动化,研究流程本身可以被 Agent 化。

所以“没被污染”的本质是:是否还能用新的方式重新组织自己的工作流。

如果我还是用旧方式学习 AI(等自己完全懂了再动手、卡在环境配置里很久、只会问 ChatGPT 单点问题),那我也会很快被污染。不要只是学习 AI,而要用 AI 重构自己的学习方式。

六、 关于睡眠少:不要学表象,要学高反馈系统

最浅的理解是:她很拼,所以她成功。但我现在更准确的理解是:她处在一个高反馈、高意义、高兴奋度的系统里。

当一个人每天都能看到新东西,能通过工具把原来需要几周的事情压缩到几小时完成,他自然会被强烈的反馈点燃。

我自己很多时候状态不好,是因为工作系统反馈太慢:配环境配一天没有结果,跑实验跑很久不知道对不对。这种状态很容易消耗人。

所以我真正应该学的不是少睡觉,而是设计自己的高反馈系统

  • 每天必须有一个可见输出;
  • 每两小时尽量形成一个小结论;
  • 每次实验都要有截图、日志和判断;
  • 每个失败都沉淀成 failure case。

高精力不是硬熬出来的,而是被高反馈喂出来的。

七、 雷军放手:真正重要的是“可信任的自由”

雷军愿意信任她,让她放手做。这件事表面看是领导风格,深层看是战略授权

在大模型这种方向上,很多正确的事情在早期看起来都不确定。如果放到传统管理框架里,可能都需要证明、汇报、审批、对齐。等你全部证明完,窗口期可能已经过去了。

这给我一个很现实的启发:以后我找导师、找合作者,不应该只看资源和名头,还要看对方能不能给“可信任的自由”。 没有资源,事情做不大;没有自由,事情做不新;没有信任,自由会变成内耗。

八、 Agent 时代最残酷的地方:经验会被 Skill 化

很多原本被认为有创造力的工作,也可能被 Skill 化、Workflow 化。只要一个任务可以被拆解成流程,它的经验就可以被 Agent 吸收。

这意味着很多能力都会快速贬值:单纯会写代码、会调参、会复现模型,都会贬值。

那什么更重要?

  • 问题品味: 知道什么问题值得做;
  • 方向判断: 知道趋势往哪走;
  • 系统设计: 能把模型、工具、数据流程组织起来;
  • 停止能力: 知道什么时候不该继续。

我应该把自己训练成:能定义问题、组织系统、判断方向的人。

九、 对我做科研与做产品的启发

做科研:把科研流程 Agent 化 我不应该只是用 AI 问问题,而应该让 AI 进入完整科研链路:自动提取方法差异、自动记录训练日志、自动沉淀失败原因。我不能再把 AI 当成搜索框,而要把它变成我的科研操作系统。

做产品:从生成工具走向社交 Agent 真正有生命力的 AI 产品,不应该只是一次生成,而应该是一个持续理解用户、场景和关系的系统。比如我的【有应】项目,如果它能理解用户的真实情绪、群友的关系、哪些应该被记住,它才可能从“AI 工具”变成“社交 Agent”。 未来好的 AI 产品,前端可能很轻,但背后的 Agent 框架(记忆系统、场景理解、多模型调度)会很厚。


💡 我最想记住的三句话

  1. 组织不是管人,而是提高信息流速。 最重要的不是谁职位高,而是谁最先看到真实问题。
  2. 资源不是最贵的,方向错才最贵。 继续在错误方向上努力,不是坚持,是浪费。
  3. 今天的判断,决定半年后的能力边界。 真正的胜负,早在更早的时候就已经开始了。

写在最后:我不想只做一个追热点的人

AI 时代最可怕的不是技术变化快,而是旧的努力方式会突然失效。如果我还是用过去的方式学习和科研,也许会显得很努力,但不一定有效。

我不想只是看完一个播客,觉得“这个人很厉害”。我更希望自己能从中学到一种做事方式: 在不确定中判断方向,在高速变化中组织试错,在错误路径上及时停下,在新工具出现时主动重构自己。