从罗福莉访谈里，我看到的不是大模型，而是一种新范式下的做事方式

最近看完一场关于罗福莉的播客访谈，我一开始关注的是一些比较“人物化”的信息：她喜欢招大二、大三的本科生，觉得他们还没有被旧范式污染；她睡眠很少，精力很强；雷军对她足够信任，愿意放手让她去做。

但再往深处想，我发现这些都不是孤立的八卦。它们背后其实指向同一个问题：

在 AI 范式剧烈变化的时候，一个人、一个团队、一个组织，到底应该怎么做事？

这期访谈真正打动我的地方，不只是大模型技术本身，而是它呈现了一种在高速变化环境下的生存方式：提前判断方向，快速组织试错，敢于停止错误投入，并且用足够开放的组织结构去吸收新的信号。

一、这不是一次普通访谈，而是一次范式切换的现场记录

这期播客表面上在聊 OpenClaw、MiMo、Agent、后训练、模型架构和组织管理。但我认为它最核心的判断是：AI 正在从 Chat 时代进入 Agent 时代。

Chat 时代的核心是： 用户问一句，模型答一句。
Agent 时代的核心是： 模型要能长期理解上下文，调用工具，执行任务，修正错误，并在复杂环境里持续完成事情。

这不是简单的产品形态变化，而是整个技术栈和组织方式都要跟着变化。

过去大模型竞争很大程度上是 Pre-train 的竞争：谁的数据更好，谁的参数更多，谁的算力更强，谁的基座能力更强。但到了 Agent 时代，Post-train 变得极其重要。模型不仅要会“说”，还要会“做”；不仅要懂语言，还要懂任务；不仅要在 benchmark 上表现好，还要能在真实工具链和长程任务中稳定工作。

所以我觉得这期播客最大的价值不是告诉我某个模型多强，而是提醒我：

以后真正重要的能力，不只是训练模型，而是设计一个能让模型完成任务的系统。

这句话对我自己的科研、学习和产品思考都有很强的冲击。

二、扁平化不是情怀，而是新范式下的效率结构

我以前听到“扁平化管理”，会觉得这是一种创业公司常见话术，好像听起来很自由、很理想主义。但罗福莉这期访谈让我重新理解了这件事。

她所在的小米大模型团队虽然属于大公司，但实际状态更像一个高密度、高不确定性的创业团队。她提到他们没有严格的小组、没有传统职级，甚至没有特别强的 deadline 约束。这听起来很反常，尤其是在训练 1T 级模型这种巨大工程里。

但我现在理解了：在一个范式还没有稳定的领域，过强的层级会降低组织对新信号的感知速度。

传统组织适合处理确定性任务。比如目标明确、路径明确、指标明确，只需要把任务拆开、分发、推进、验收。但大模型和 Agent 这种领域不是这样。它的问题是：

技术路线变化太快；
昨天有效的方法今天可能失效；
一线工程师、研究员可能比管理者更早看到新信号；
benchmark 可能还没来得及定义，真实体验已经发生变化；
很多判断不能等层层审批后再做。

这个时候，如果组织层级太重，就会出现一个很危险的问题：真实信号传不上去，错误决策停不下来。 我现在更愿意把扁平化理解为： 在高度不确定环境下，让真实信号以最短路径进入决策系统。

一个小团队真正需要的不是形式上的分工，而是高质量的信息流：谁能最快发现问题，谁敢指出问题，谁能在方向错的时候让项目停下来。

三、遇到问题停下来改，不是浪费，而是专业

我特别注意到一个细节：她们在训练模型时，如果遇到问题，会停下来分析和改进，而不是为了“不浪费已经投入的算力”继续硬训。

因为我自己做科研或者跑实验时，经常会有一种心理：“既然已经跑了这么久，要不先跑完再说。” 但这其实是一种沉没成本陷阱。

在大模型训练里，算力当然昂贵。但比算力更昂贵的是：在错误方向上继续投入。

如果数据有问题，继续训只会把问题放大。
如果任务定义错了，loss 再漂亮也没有意义。
如果评估指标不匹配真实目标，跑出来的分数越高，反而越危险。

这让我想到我自己做 3DGS 相关实验时也遇到过类似问题。有时候不是训练迭代数不够，而是更基础的东西错了：数据集语义对了吗？相机参数对了吗？当前结果是真的变好，还是只是指标表面好看？

所以我从这期播客里得到一个很重要的方法论：先判断系统是否正确，再决定是否扩大投入。

以后我做实验时，应该建立一种“停止机制”：

数据错了，停；
任务定义错了，停；
可视化明显跑偏，停；
只是为了不浪费已经跑的时间而继续，停。

真正专业的研发不是一直往前冲，而是知道什么时候应该停下来。

四、一个好模型，不是在发布前一个月突然做出来的

这期播客里最值得反复琢磨的一点是：训练一个好模型，很多胜负在半年甚至一年前就已经决定了。

一个模型发布时，大家看到的是结果：速度快、成本低、Agent 表现好。但这些能力往往来自很早之前的一系列判断：是否提前意识到 Long Context 会重要？是否提前建设 Post-train Infra？是否提前判断未来真正的瓶颈在哪里？

这让我意识到一个残酷事实：真正的竞争，往往发生在别人看不见的时候。 等到一个趋势已经成为热点，再开始追，很多时候已经晚了。

我现在应该思考：半年后，AI 编程会变成什么样？3DGS、视觉互动产品哪些会被商品化，哪些还有研究空间？我现在积累的能力，半年后还值钱吗？

今天的选择，会变成半年后的能力边界。

五、关于“招大二大三”：不是学历问题，而是路径依赖问题

为什么她会觉得年轻本科生“还没有被污染”？

我理解，不是说本科生一定比研究生强，而是：在旧规则失效、新规则还没完全形成的时候，没有被旧路径训练得太牢的人，反而更容易切换。

很多人越有经验，越容易有路径依赖。在科研里，传统路径可能是：读论文 $\rightarrow$ 找 baseline $\rightarrow$ 改模块 $\rightarrow$ 跑指标 $\rightarrow$ 写论文。这套方法不是没用，但面对 Agent 时代的新研究方式时，可能会反应慢。

因为现在很多事情已经变了：文献调研可以被 AI 加速，实验对比可以被自动化，研究流程本身可以被 Agent 化。

所以“没被污染”的本质是：是否还能用新的方式重新组织自己的工作流。

如果我还是用旧方式学习 AI（等自己完全懂了再动手、卡在环境配置里很久、只会问 ChatGPT 单点问题），那我也会很快被污染。不要只是学习 AI，而要用 AI 重构自己的学习方式。

六、关于睡眠少：不要学表象，要学高反馈系统

最浅的理解是：她很拼，所以她成功。但我现在更准确的理解是：她处在一个高反馈、高意义、高兴奋度的系统里。

当一个人每天都能看到新东西，能通过工具把原来需要几周的事情压缩到几小时完成，他自然会被强烈的反馈点燃。

我自己很多时候状态不好，是因为工作系统反馈太慢：配环境配一天没有结果，跑实验跑很久不知道对不对。这种状态很容易消耗人。

所以我真正应该学的不是少睡觉，而是设计自己的高反馈系统：

每天必须有一个可见输出；
每两小时尽量形成一个小结论；
每次实验都要有截图、日志和判断；
每个失败都沉淀成 failure case。

高精力不是硬熬出来的，而是被高反馈喂出来的。

七、雷军放手：真正重要的是“可信任的自由”

雷军愿意信任她，让她放手做。这件事表面看是领导风格，深层看是战略授权。

在大模型这种方向上，很多正确的事情在早期看起来都不确定。如果放到传统管理框架里，可能都需要证明、汇报、审批、对齐。等你全部证明完，窗口期可能已经过去了。

这给我一个很现实的启发：以后我找导师、找合作者，不应该只看资源和名头，还要看对方能不能给“可信任的自由”。没有资源，事情做不大；没有自由，事情做不新；没有信任，自由会变成内耗。

八、 Agent 时代最残酷的地方：经验会被 Skill 化

很多原本被认为有创造力的工作，也可能被 Skill 化、Workflow 化。只要一个任务可以被拆解成流程，它的经验就可以被 Agent 吸收。

这意味着很多能力都会快速贬值：单纯会写代码、会调参、会复现模型，都会贬值。

那什么更重要？

问题品味： 知道什么问题值得做；
方向判断： 知道趋势往哪走；
系统设计： 能把模型、工具、数据流程组织起来；
停止能力： 知道什么时候不该继续。

我应该把自己训练成：能定义问题、组织系统、判断方向的人。

九、对我做科研与做产品的启发

做科研：把科研流程 Agent 化 我不应该只是用 AI 问问题，而应该让 AI 进入完整科研链路：自动提取方法差异、自动记录训练日志、自动沉淀失败原因。我不能再把 AI 当成搜索框，而要把它变成我的科研操作系统。

做产品：从生成工具走向社交 Agent 真正有生命力的 AI 产品，不应该只是一次生成，而应该是一个持续理解用户、场景和关系的系统。比如我的【有应】项目，如果它能理解用户的真实情绪、群友的关系、哪些应该被记住，它才可能从“AI 工具”变成“社交 Agent”。未来好的 AI 产品，前端可能很轻，但背后的 Agent 框架（记忆系统、场景理解、多模型调度）会很厚。

💡 我最想记住的三句话

组织不是管人，而是提高信息流速。 最重要的不是谁职位高，而是谁最先看到真实问题。
资源不是最贵的，方向错才最贵。 继续在错误方向上努力，不是坚持，是浪费。
今天的判断，决定半年后的能力边界。 真正的胜负，早在更早的时候就已经开始了。

写在最后：我不想只做一个追热点的人

AI 时代最可怕的不是技术变化快，而是旧的努力方式会突然失效。如果我还是用过去的方式学习和科研，也许会显得很努力，但不一定有效。

我不想只是看完一个播客，觉得“这个人很厉害”。我更希望自己能从中学到一种做事方式： 在不确定中判断方向，在高速变化中组织试错，在错误路径上及时停下，在新工具出现时主动重构自己。

一、 这不是一次普通访谈，而是一次范式切换的现场记录#

二、 扁平化不是情怀，而是新范式下的效率结构#

三、 遇到问题停下来改，不是浪费，而是专业#

四、 一个好模型，不是在发布前一个月突然做出来的#

五、 关于“招大二大三”：不是学历问题，而是路径依赖问题#

六、 关于睡眠少：不要学表象，要学高反馈系统#

七、 雷军放手：真正重要的是“可信任的自由”#

八、 Agent 时代最残酷的地方：经验会被 Skill 化#

九、 对我做科研与做产品的启发#

💡 我最想记住的三句话#

写在最后：我不想只做一个追热点的人#