当人人都能当导演:AI 时代的工作版图将被如何重写
记录时间:2026-06-06 21:27:15
这期播客在聊什么
投资人郑兰对话技术人郝培强(Tinyfool)的一期播客访谈。郝培强早年是硬核程序员、技术大 V,如今高频产出 AI 视频(主用 Sora 2)。两人围绕一个问题展开:当 AI 把「实现」的门槛拉平后,工作版图、创作方式、乃至个体的焦虑,会被如何重写。
视频原标题《当人人都能当导演:AI 时代的工作版图将被彻底重写?》,来源频道「Tinyfool的胡说八道」。以下是核心观点的整理。
核心观点:AI 带来的不是替代,而是角色的变化
这是贯穿全场的主线。郝培强的判断是——AI 不会简单地「替代」一个人,而是改变这个人扮演的角色。
- 写程序时:以前 90% 的时间花在具体实现代码上(登录、查询、增删改查这些重复劳动)。有了 AI 编程工具后,关注点从「怎么写」上移到「到底要做什么样的产品」——角色从编码工变成了产品经理 / 产品 owner。
- 做视频时:同理。任何视频都有大量重复套路(opening、特写、转场),这些和剧本要表达的核心其实关系不大。把这些交给 AI 后,人就回到了更本质的问题:我到底要的是什么样的作品。角色变成了编剧和导演。
「你似乎把演员去掉了,把场记去掉了,去掉了很多角色,但是编剧和导演并没有被去掉。核心灵魂还在。」
人们害怕的「AI 取代」,本质是害怕一种变化——自己熟悉的角色不再存在。但能不能适应「从一线执行抽离、变成导演 / 策划」,才是关键。
关于 AI 创作工具的实战体会
Sora 2 的冲击:用最简单的提示词得到好结果
郝培强不推崇复杂的「提示词工程」(一堆 JSON、镜头推拉的复杂描述)。他的做法是:
- 先用最简单的一句话描述场景;
- 出一个版本后,看它和想要的哪里不一样;
- 再针对性地补充提示。
Sora 2 让他震撼的点在于它的泛化能力——你给一个极简提示,它会自动延展剧情、把中间的动作、台词甚至表情合理化。比如他只写「我和一个超级大美女拥抱在一起」,没有设置任何台词,AI 自动补出了台词和表情,效果出人意料。这让他更能理解 Sora 所说的「世界模型」是什么。
「创建角色」即「无痛入镜」
Sora 2 创建角色的过程极简:对着屏幕念几个数字、摇头张嘴,约 30 秒完成。之后只要 @ 自己的 ID 加一句话(如「TinyFu 正在爬酋长岩 Free Solo」),就能生成精准的、把自己放进去的视频。扔到抖音后引发大量「这是真的还是假的」的讨论。
「抽卡」就是选角,「补拍」变得极廉价
- 抽卡 = 选角 / 多拍几遍:同一个提示词跑十遍,挑最满意的那一版再去修饰(比如改头发颜色),本质就是选演员。
- 补拍极容易:一个 20 分钟视频由大量 10 秒片段拼成,中间哪段不好,把相关信息拿回来重新生成即可。Sora、Veo(Google)都支持。Google 还把 Nano Banana 塞进 Veo——可以从生成的视频里取一帧,用 Nano Banana 改图后再作为素材回去生成视频。
关键的隐性工作:研究与交叉验证
这是常被忽略、但郝培强反复强调的部分——AI 创作不是「一句话躺平出片」。
以他做的「蒸汽机历史」3 分钟科普视频为例,工作流是:
- 让 ChatGPT 写一篇详细的蒸汽机历史(含瓦特之前的人物等他自己也不了解的细节);
- Review 后,让它转成分镜头脚本(拆成七八个镜头);
- 进一步让它直接产出每个镜头的 Sora 提示词 + 画外音文案;
- 自己只做「执行」:把提示词扔进 Sora,得到 30-40 个片段,再和画外音整合、补动画。
他在中间做的是创意 + 决策:教 AI 怎么 break it down。
但交叉验证不可省:AI 会有幻觉。蒸汽机的机械原理 AI 一定生成错(它不懂曲轴、连杆怎么运动),他要去 Wiki 找最古老机器的图纸 → 喂给 Nano Banana 还原成真实机器 → 再用 Sora/Veo 做运转动画。「这个工作做得很辛苦。」
谈 AI 创作时大家很少讲后面这些:它需要研究、需要知识储备、需要交叉验证,不能完全相信生成结果。
AI 时代最重要的能力
郑兰把对话中的要点概括为三条:
- 想象力:新技术 / 新浪潮出现时,你的想象力边际有多大,就能做到多大的事。
- 重构的能力(把自己清零):很多人有习惯性思维、固定路径不愿改。做风险投资养成的好习惯是「把自己清零」,在清零状态下看一件事的本质、看接下来往哪个方向有机会。
- 拥抱变化 + 适度的「懒」:郝培强补充——「专业精神」有时会拘泥于「怎么完成」的方式方法,而 AI 时代不断告诉我们:核心不是方式方法,而是结果,能不能最快得到结果。每次「重复自己」时的厌烦,正是该把活交给 AI 的信号。
投资人视角:不预测行业,看注意力在哪
郑兰分享了她的方法论:不去预测行业未来(多数人没这个能力),而是看 C 端消费者把注意力放在哪——谁抢占了用户注意力,哪里就有机会。
当下的事实是:内容信息从图文走向视频,短视频已占主导;内容供给方有大量提效诉求;而现在工具已经成熟。所以——能把创意快速实现出来,就是关键的入场点。
门槛被拉平后,技术大牛 vs 文艺青年谁更有优势
郝培强认为这不是问题,两者殊途同归:
- 以前的门槛是「实现的门槛」(2012-2013 年人人想做 iOS/安卓却找不到程序员)。今天实现已经不难。
- 视频同理:以前要搭团队、找好演员,今天「AI 就是好演员,它做演员、我们做导演」。
- 核心是你 focus 在哪个点。他 focus 的是结果,所以不在乎门槛下降——「门槛下降反而让我有机会入场去玩」。
他还把这点和电影史联系起来:乔治·卢卡斯早期的飞船是纸壳子,「你说 AI 做的飞船是假的,那纸壳子不是假的吗?」电影本就是「让观众相信」的艺术,用 AI 还是用纸壳子,本质都是怎么把一个信息、一种感觉传达给人。
快问快答里的几个判断
- 影视行业谁最先被取代、谁活到最后:最后可能都被淘汰,只剩导演。
- Sora 像抽盲盒,失控感让你抓狂还是兴奋:只有简单任务能完全掌控;做任何复杂的东西本就充满随机因素。类比:以前拿砖块盖房子,现在用预制件直接拼一层楼——真正完成作品时仍有大量细节要调适,并非「无法精准控制」。
- 朋友圈/抖音会不会被「精致的垃圾」填满:问题不在创作端,在消费端——平台最终充斥什么由用户喜欢什么决定,算法会做过滤。
- AI 用现有数据训练,是否只是重复过去的审美:理论上工具能做任何事(就像用人去演),最终选哪段、用什么提示词是你的选择;把成本降低后,反而能让想象力占据更多空间。
- 一个人就是一支队伍,会孤独吗:没问题,想做团队照样可以分工,只是角色都收敛成了导演和编剧这两个最重要的角色。
- 「眼见为实」是否作废:「真实本来就不存在」——互联网兴起后他认识的 90% 的人先在网上认识,世界本就是大脑在调用数据。新技术来临必然伴随新鲜感、争议与焦虑,但人作为个体总能用智慧消化新东西并在上面开花结果。
一个更大的图景:人类终将走向「互相娱乐」
郝培强引用了一条历史脉络来安放这次 AI 浪潮:
- 圈地运动(羊吃人)开始,全球农民数量锐减;今天美国仅约 1% 人口务农,一个农民管约 1000 公顷——说明「不需要那么多人来种地」。
- 工业革命有 30-100 年好坏参半的阵痛(污染、工人贫困),但结果是今天我们吃得更饱、活得更好。工业化才催生了真正意义上的都市、餐饮住宿成为行业。
- 电与收音机出现后,娱乐产业才真正变大——从一个剧场几百人,到上百万人同时听一档广播;再到电视、视频网站、抖音。
他的推论:这一次可能是「终极问题」。如果 AI 和机器人达到想象中的水平,5-10 年甚至 20 年后,很可能 90% 的实体制造工作、70-80% 的 office job 都会消失,物质生产高度自动化。而抖音是一个「先声」——所有人娱乐所有人,人类最终可能去做的一件事,就是互相娱乐。
关于焦虑:本质是「时间不够」的错觉
郑兰分享了一个化解焦虑的视角:35-40 岁的人常因迷茫而焦虑,但如果假设寿命是 150 年或 300 年,当下的烦恼大多就不成立。焦虑的根源在于「认为自己没那么多时间了」或陷在「本该如何却没有」的懊悔里。
由此她对「会不会被 AI 取代」的回答是:只要你的技能随着行业、产业、技术向上迭代,就不会被淘汰;被淘汰的是技能停在原地、只在侧端发展的人。「永远知道这个时代往前走的主流是什么,抓住它就可以了。」而善用 AI 工具,本质是拓宽了生命的宽度,让生活更精彩。
小结
整场对话可以收敛成一句话:AI 拉平的是「实现」的门槛,而非「创意、决策与品味」的门槛。
- 角色上移:从执行者变成编剧 / 导演 / 产品经理,聚焦结果而非过程;
- 隐性功夫仍在:研究、知识储备、交叉验证决定作品上限,AI 不能无脑相信;
- 心态上:把自己清零、拥抱变化、允许自己「懒」于重复劳动;
- 焦虑可解:跟随主流技术向上迭代,把节省下来的时间还给想象力。