当人人都能当导演：AI 时代的工作版图将被如何重写

记录时间：2026-06-06 21:27:15

这期播客在聊什么

投资人郑兰对话技术人郝培强（Tinyfool）的一期播客访谈。郝培强早年是硬核程序员、技术大 V，如今高频产出 AI 视频（主用 Sora 2）。两人围绕一个问题展开：当 AI 把「实现」的门槛拉平后，工作版图、创作方式、乃至个体的焦虑，会被如何重写。

视频原标题《当人人都能当导演：AI 时代的工作版图将被彻底重写？》，来源频道「Tinyfool的胡说八道」。以下是核心观点的整理。

核心观点：AI 带来的不是替代，而是角色的变化

这是贯穿全场的主线。郝培强的判断是——AI 不会简单地「替代」一个人，而是改变这个人扮演的角色。

写程序时：以前 90% 的时间花在具体实现代码上（登录、查询、增删改查这些重复劳动）。有了 AI 编程工具后，关注点从「怎么写」上移到「到底要做什么样的产品」——角色从编码工变成了产品经理 / 产品 owner。
做视频时：同理。任何视频都有大量重复套路（opening、特写、转场），这些和剧本要表达的核心其实关系不大。把这些交给 AI 后，人就回到了更本质的问题：我到底要的是什么样的作品。角色变成了编剧和导演。

「你似乎把演员去掉了，把场记去掉了，去掉了很多角色，但是编剧和导演并没有被去掉。核心灵魂还在。」

人们害怕的「AI 取代」，本质是害怕一种变化——自己熟悉的角色不再存在。但能不能适应「从一线执行抽离、变成导演 / 策划」，才是关键。

关于 AI 创作工具的实战体会

Sora 2 的冲击：用最简单的提示词得到好结果

郝培强不推崇复杂的「提示词工程」（一堆 JSON、镜头推拉的复杂描述）。他的做法是：

先用最简单的一句话描述场景；
出一个版本后，看它和想要的哪里不一样；
再针对性地补充提示。

Sora 2 让他震撼的点在于它的泛化能力——你给一个极简提示，它会自动延展剧情、把中间的动作、台词甚至表情合理化。比如他只写「我和一个超级大美女拥抱在一起」，没有设置任何台词，AI 自动补出了台词和表情，效果出人意料。这让他更能理解 Sora 所说的「世界模型」是什么。

「创建角色」即「无痛入镜」

Sora 2 创建角色的过程极简：对着屏幕念几个数字、摇头张嘴，约 30 秒完成。之后只要 @ 自己的 ID 加一句话（如「TinyFu 正在爬酋长岩 Free Solo」），就能生成精准的、把自己放进去的视频。扔到抖音后引发大量「这是真的还是假的」的讨论。

「抽卡」就是选角，「补拍」变得极廉价

抽卡 = 选角 / 多拍几遍：同一个提示词跑十遍，挑最满意的那一版再去修饰（比如改头发颜色），本质就是选演员。
补拍极容易：一个 20 分钟视频由大量 10 秒片段拼成，中间哪段不好，把相关信息拿回来重新生成即可。Sora、Veo（Google）都支持。Google 还把 Nano Banana 塞进 Veo——可以从生成的视频里取一帧，用 Nano Banana 改图后再作为素材回去生成视频。

关键的隐性工作：研究与交叉验证

这是常被忽略、但郝培强反复强调的部分——AI 创作不是「一句话躺平出片」。

以他做的「蒸汽机历史」3 分钟科普视频为例，工作流是：

让 ChatGPT 写一篇详细的蒸汽机历史（含瓦特之前的人物等他自己也不了解的细节）；
Review 后，让它转成分镜头脚本（拆成七八个镜头）；
进一步让它直接产出每个镜头的 Sora 提示词 + 画外音文案；
自己只做「执行」：把提示词扔进 Sora，得到 30-40 个片段，再和画外音整合、补动画。

他在中间做的是创意 + 决策：教 AI 怎么 break it down。

但交叉验证不可省：AI 会有幻觉。蒸汽机的机械原理 AI 一定生成错（它不懂曲轴、连杆怎么运动），他要去 Wiki 找最古老机器的图纸 → 喂给 Nano Banana 还原成真实机器 → 再用 Sora/Veo 做运转动画。「这个工作做得很辛苦。」

谈 AI 创作时大家很少讲后面这些：它需要研究、需要知识储备、需要交叉验证，不能完全相信生成结果。

AI 时代最重要的能力

郑兰把对话中的要点概括为三条：

想象力：新技术 / 新浪潮出现时，你的想象力边际有多大，就能做到多大的事。
重构的能力（把自己清零）：很多人有习惯性思维、固定路径不愿改。做风险投资养成的好习惯是「把自己清零」，在清零状态下看一件事的本质、看接下来往哪个方向有机会。
拥抱变化 + 适度的「懒」：郝培强补充——「专业精神」有时会拘泥于「怎么完成」的方式方法，而 AI 时代不断告诉我们：核心不是方式方法，而是结果，能不能最快得到结果。每次「重复自己」时的厌烦，正是该把活交给 AI 的信号。

投资人视角：不预测行业，看注意力在哪

郑兰分享了她的方法论：不去预测行业未来（多数人没这个能力），而是看 C 端消费者把注意力放在哪——谁抢占了用户注意力，哪里就有机会。

当下的事实是：内容信息从图文走向视频，短视频已占主导；内容供给方有大量提效诉求；而现在工具已经成熟。所以——能把创意快速实现出来，就是关键的入场点。

门槛被拉平后，技术大牛 vs 文艺青年谁更有优势

郝培强认为这不是问题，两者殊途同归：

以前的门槛是「实现的门槛」（2012-2013 年人人想做 iOS/安卓却找不到程序员）。今天实现已经不难。
视频同理：以前要搭团队、找好演员，今天「AI 就是好演员，它做演员、我们做导演」。
核心是你 focus 在哪个点。他 focus 的是结果，所以不在乎门槛下降——「门槛下降反而让我有机会入场去玩」。

他还把这点和电影史联系起来：乔治·卢卡斯早期的飞船是纸壳子，「你说 AI 做的飞船是假的，那纸壳子不是假的吗？」电影本就是「让观众相信」的艺术，用 AI 还是用纸壳子，本质都是怎么把一个信息、一种感觉传达给人。

快问快答里的几个判断

影视行业谁最先被取代、谁活到最后：最后可能都被淘汰，只剩导演。
Sora 像抽盲盒，失控感让你抓狂还是兴奋：只有简单任务能完全掌控；做任何复杂的东西本就充满随机因素。类比：以前拿砖块盖房子，现在用预制件直接拼一层楼——真正完成作品时仍有大量细节要调适，并非「无法精准控制」。
朋友圈/抖音会不会被「精致的垃圾」填满：问题不在创作端，在消费端——平台最终充斥什么由用户喜欢什么决定，算法会做过滤。
AI 用现有数据训练，是否只是重复过去的审美：理论上工具能做任何事（就像用人去演），最终选哪段、用什么提示词是你的选择；把成本降低后，反而能让想象力占据更多空间。
一个人就是一支队伍，会孤独吗：没问题，想做团队照样可以分工，只是角色都收敛成了导演和编剧这两个最重要的角色。
「眼见为实」是否作废：「真实本来就不存在」——互联网兴起后他认识的 90% 的人先在网上认识，世界本就是大脑在调用数据。新技术来临必然伴随新鲜感、争议与焦虑，但人作为个体总能用智慧消化新东西并在上面开花结果。

一个更大的图景：人类终将走向「互相娱乐」

郝培强引用了一条历史脉络来安放这次 AI 浪潮：

圈地运动（羊吃人）开始，全球农民数量锐减；今天美国仅约 1% 人口务农，一个农民管约 1000 公顷——说明「不需要那么多人来种地」。
工业革命有 30-100 年好坏参半的阵痛（污染、工人贫困），但结果是今天我们吃得更饱、活得更好。工业化才催生了真正意义上的都市、餐饮住宿成为行业。
电与收音机出现后，娱乐产业才真正变大——从一个剧场几百人，到上百万人同时听一档广播；再到电视、视频网站、抖音。

他的推论：这一次可能是「终极问题」。如果 AI 和机器人达到想象中的水平，5-10 年甚至 20 年后，很可能 90% 的实体制造工作、70-80% 的 office job 都会消失，物质生产高度自动化。而抖音是一个「先声」——所有人娱乐所有人，人类最终可能去做的一件事，就是互相娱乐。

关于焦虑：本质是「时间不够」的错觉

郑兰分享了一个化解焦虑的视角：35-40 岁的人常因迷茫而焦虑，但如果假设寿命是 150 年或 300 年，当下的烦恼大多就不成立。焦虑的根源在于「认为自己没那么多时间了」或陷在「本该如何却没有」的懊悔里。

由此她对「会不会被 AI 取代」的回答是：只要你的技能随着行业、产业、技术向上迭代，就不会被淘汰；被淘汰的是技能停在原地、只在侧端发展的人。「永远知道这个时代往前走的主流是什么，抓住它就可以了。」而善用 AI 工具，本质是拓宽了生命的宽度，让生活更精彩。

小结

整场对话可以收敛成一句话：AI 拉平的是「实现」的门槛，而非「创意、决策与品味」的门槛。

角色上移：从执行者变成编剧 / 导演 / 产品经理，聚焦结果而非过程；
隐性功夫仍在：研究、知识储备、交叉验证决定作品上限，AI 不能无脑相信；
心态上：把自己清零、拥抱变化、允许自己「懒」于重复劳动；
焦虑可解：跟随主流技术向上迭代，把节省下来的时间还给想象力。