AI 能写文章,但写不出能力

AI 写得挺好,为什么还要自己写?

AI 给个主题就能生成结构清晰、逻辑通顺的文章。那自己写图什么?

要看你写博客是为了什么。

如果目标是内容生产:传播、曝光、SEO、涨粉,那 AI 确实能帮你干完大部分活。你出方向,它负责生成和优化。

但如果写博客是为了提升能力和决策质量,那就不一样了。

AI 生成的文章看上去很好,但你可能只是"完成了一篇文章",没有"形成能力"。读懂了,不代表真实场景里用得上。记住了,不代表压力下能做对。

AI 可以替你产内容,很难替你长能力。

能力是用出来的,不是读出来的

就像代码和文档的区别。AI 能写文档告诉你"函数怎么用",但写文档这件事本身不会让你学会写代码。你可以读懂文档,但没写过代码,你还是不会写。

写作也一样。AI 生成一篇"如何做决策"的文章,步骤、原则都有。但如果你自己没推理过、没找过反例、没做过取舍,真实场景里你用不上这些东西。

能力形成有三层:

  1. 文本模型(AI/文章):写在纸上的结构,能读懂
  2. 概念模型(复述/质疑):用自己的话讲一遍,找反例,质疑边界
  3. 行为模型(真实调用):压力下自动调用,做对

AI 擅长生成文本模型,但从文本到行为的跨越它帮不了你。这段路只能自己走:推理、找反例、应用、犯错、修正。

graph TD A[文本模型<br/>AI生成的文章<br/>可读懂] -->|人:推理、反例、质疑| B[概念模型<br/>你复述/质疑<br/>找边界] B -->|人:应用、犯错、修正| C[行为模型<br/>真实情境调用<br/>压力下做对] D[AI能力边界] -.只能生成.-> A D -.无法跨越.-> B D -.无法跨越.-> C E[人的必须参与] -.推理与担保.-> B E -.实践与内化.-> C style A fill:#FFE4B5 style B fill:#87CEEB style C fill:#90EE90 style D fill:#FFB6C1 style E fill:#FFD700

这篇文章在说什么,不在说什么

我讨论的是一种特定写作目标:把经验压成可复用的决策模型。

适用场景:你写作是为了能力提升、决策质量提升、积累复利型认知资产。最终想留下 checklist、decision tree、runbook 这类东西。

纯记录型(生活日记)、纯传播型(资讯搬运)、纯共鸣型(情绪叙事)、纯教学型(面向新手 step-by-step),不在讨论范围。这些有各自的价值,只是如果你追求"可复用的决策能力",衡量标准不一样。

举个例子:通用教程的边际价值越来越低,但"踩坑后的反直觉决策型教程"仍然值钱。区别在于:有没有把经验压成模型,还是只把步骤复述了一遍。

人做什么,AI 做什么

既然 AI 产内容行、长能力不行,那怎么分工?

我用 A/B 类错误来区分。

A 类错误:会改变行动选择的错误(做错事、做了不该做的事)。立场、因果、边界、证据、最终结论,必须人来把关。

B 类错误:不改变行动选择的错误(只影响阅读体验)。结构、措辞、例子、标题、润色,交给 AI 没问题。

灰区判定:一个"表达/结构"如果导致边界条件被省略,让读者行动变了,就按 A 类处理。

错误类型 定义 影响 责任归属
A类 会改变行动选择 做错事/误用 必须人负责
B类 不改变行动选择 只影响阅读体验 可交给AI
灰区 表达导致边界条件省略 让读者行动改变 视为A类

判定标准只有一个:行动是否改变。不是"理解是否改变",因为最终都要落到行动上。

比如:把一个 tradeoff 写成"总是更好",边界被抹掉,读者会误用,行动改变了,这就是 A 类。把段落润色得更顺更短,结论没变,读者行动不会改变,这是 B 类。

思考幻觉:完成感不等于拥有

最大的风险是思考幻觉。

AI 生成的文章容易让你产生"我已经想过了"的错觉。读懂了,记住了,甚至能复述了。但没经历过推理、反例、取舍的过程,压力下你调用不出来。

怎么识别?两周后回到真实场景,你能用上吗?用不上的话,那只是"完成了一篇文章"。

内化有三个层次:

  • Level 1:需要提示才能想起。有价值,适合短期或低频知识
  • Level 2:能复述核心机制。适合中频复用
  • Level 3:真实情境中自动调用并做对。这是你想攒的复利资产

停留在 Level 1 或 2,大概率只是"完成了文章"。

AI 生成不是没用,但对能力形成的贡献取决于你有没有参与推理和取舍。一个结论如果没经历过推理、反例、取舍,它很难在压力下被调用。

和 AI 怎么协作

AI 有价值,但不能替你长能力。协作的前提是:AI 输出默认不可信,只当候选用,过了校验才能进正文。

AI 擅长四件事:发散生成(提供候选)、对抗审计(帮你攻击自己的论点)、结构压缩(建模)、表达优化(省时间)。

但每一项都有失败模式:

AI 能力 可能出错的地方 人该怎么把关
发散 噪音多 按目标函数筛选
攻击 浅层挑刺 追问到因果链
压缩 丢边界 边界回填检查
建模 自信胡编 最小反例验证

最终模型的所有权必须在人手上。AI 生成文本模型,人负责把文本模型训练成行为模型。

能力形成就是慢的

内容生产可以快、可以批量、可以外包。能力形成必须慢、必须亲自来、必须长期积累。

AI 加速的是信息处理(生成候选、攻击、压缩),加速不了内化过程(推理、反例、应用)。从文本模型到行为模型的跨越需要时间,这个过程只能靠实践完成。

怎么落地

怎么把文章转成可复用的决策模型?一个最小可用模板:

  1. 情境/触发条件:什么场景下适用
  2. 结论/动作:该做什么
  3. 约束/不做什么:边界条件
  4. 风险与可逆性:错了代价多大,能不能回滚
  5. 更新信号:出现什么迹象就该修正
graph TD A[情境/触发条件<br/>在什么情境下适用] --> B[结论/动作<br/>应该做什么决策] B --> C[约束/不做什么<br/>边界条件、不做什么] C --> D[风险与可逆性<br/>错了代价多大、能否回滚] D --> E[更新信号<br/>出现什么迹象就要修正] E -.复盘闭环.-> A F[文章] -->|压缩成| G[决策模型] G --> H[Checklist] G --> I[Decision Tree] G --> J[Runbook] style A fill:#E6F3FF style B fill:#90EE90 style C fill:#FFE4B5 style D fill:#FFB6C1 style E fill:#DDA0DD

两周后回来看一眼:这个模型在真实场景里用上了吗?效果怎么样?有新情况的话,更新对应维度就行。

关键是把文章转成可执行的资产(checklist、decision tree、runbook),别只留下一篇文章。

收尾

我现在写博客的方式就是这套逻辑:AI 帮我产候选、做压力测试,但推理和取舍我自己来。写完之后压成决策模型,两周后看能不能在真实场景里调用。能调用的才算能力,调用不了的就只是一篇文章。