AI Agent 多线程方法论：1 人 100 分钟同时交付 iOS 应用、官网、视频和 PPT

Codex Full Course 2026: The NEW Best AI Coding Tool

来源Riley Brown（YouTube AI 实战教学频道，X 全网 27.5 万粉丝） × 无（独立教学视频）视频时长约 103 分钟报告字数8,030字阅读时间17min原始链接https://www.youtube.com/watch?v=KXIdYEdOPys

本报告由 AI 深度分析生成，基于视频完整字幕。

📺 原视频约 103 分钟📖 本报告 8,030字⏱ 预计阅读 17min

一、Codex 不是命令行工具：先把概念厘清

这是普通人最容易踩的认知坑——绝大多数人听到"Codex"会以为是 OpenAI 那个老命令行版本。

名字	是什么	用什么
`codex` 命令行（旧）	OpenAI 早期开放给开发者的 CLI 编程工具，跟 Claude Code 终端版定位类似	终端里跑 `codex exec`
Codex Super-App（新，本视频主角）	2026 年 4 月发布的桌面应用，把对话、代码、设计、文档、computer use、自动化全装一个界面	下载 macOS / Windows app
Codex Cloud	后台 agent 服务，长任务跑在云端	Web 界面或集成到桌面 app

下载入口是浏览器搜 codex app download，会跳到 chatgpt.com/codex/desktop 这个 URL。注意：你需要 ChatGPT 订阅才能用这个桌面端——这是 OpenAI 把订阅权益从"网页 chat" 扩展到 "桌面 super-app" 的一步关键迭代。

打开后，左侧栏从上到下分五个区域：

Search（CMD+G 调出，搜全部历史 chat）
Plugins（OpenAI 官方做好的能力扩展，目前有 Figma、Google Calendar、Gmail、Remotion、Linear、Notion 等几十个）
Skills（自创的"工作流食谱"，可以分享给别人）
Automations（定时任务列表）
Projects（绑定到本地某个文件夹的项目空间）

关键概念分清楚：

Project = 一个本地文件夹。你新建项目时实际是在你硬盘选一个文件夹，所有这个项目里的 chat 产出的文件全部落到那个文件夹的 outputs/ 子目录里——没有云端隐藏存储，所有文件你都能用 Finder 直接看。这一点对非程序员很重要：你永远清楚"我创建的东西在哪儿"。
Chat = 一个对话，绑在某个 project 下。但有一种特殊位置叫 "general agent tasks"——不绑项目的杂事都进这里。
Plugins ≠ Skills。Riley 说官方词汇有点乱（OpenAI 叫 plugins+skills，Anthropic 叫 connectors+skills），他自己的判断是："Skill 是可复用的食谱，Plugin 是安装的扩展能力。"（"A skill is a reusable workflow recipe, a plugin is the installable unit that extends Codex with more capabilities."）实战中两者经常合用——比如他先装一个 Figma plugin，然后让 Codex 写一个 skill 来"标准化调用 Figma plugin 完成某类设计任务"。

二、把"五个底层动作"先练熟

Part 1 的 35 分钟其实在反复教五个动作。这五个动作组合起来，就是 Codex 99% 的日常用法：

动作 1：建项目 + 在项目里开 chat

新建 project 时第一选择就决定了所有后续文件去哪。Riley 的建议是：先在 ~/Documents/ 下建一个 Riley's Codex Projects/ 总目录，然后每个具体活儿（"Codex Desktop Research"、"Chorus App"）再开子项目。不要把 project 放进随机位置，否则一周后你就找不到东西了。

动作 2：让 agent 创建文件，然后在新 chat 里 @-mention 这些文件

Riley 演示了一个非常好的工作模式：

Chat A：让 agent 调研 OpenAI 新功能，让它输出成 .xlsx 表格而不是纯文本回复
表格自动落到项目 outputs/ 文件夹
Chat B：在新 chat 里输入 @codex-desktop-features.xlsx，让另一个 agent 基于上一个表格做补充

这是非程序员最该学的一课：把"中间产出"具象化为文件，让多个 chat 协作。不要让所有信息只活在某一个 chat 的对话历史里——chat 历史会因为 context 窗口被截断，但文件不会。

动作 3：装 Plugin → 自然语言调用

视频里他演示了 Google Calendar plugin：装完之后输入"列出我这周日程并发邮件给我做周历回顾"，agent 直接搞定。用法的关键是斜杠 / 触发——你也可以不打 /，agent 自己会判断该调用哪个 plugin，但显式 /calendar 让它更稳。

动作 4：把"重复劳动"做成 Skill

Riley 演示的 YouTube Researcher Skill 是个绝佳样本，三步：

找到外部 API（Supadata，专门做 YouTube 字幕和元数据抓取）
在 chat 里输入：skill creator. Please create a skill that lets me ask you to summarize the latest 10 videos from a YouTube channel using the Supadata API. My API key is: <key>
重启 chat，新 chat 输入 /youtube-researcher，就可以说"看 Riley Brown 的最近 10 个视频，分析哪些 hook 表现好"

这一步他用了一个隐藏触发词：skill creator——输入这两个字会触发一个内置的"如何创建 skill"的元 skill，让 agent 知道要按 OpenAI 的 skill 规范产出文件。没有这两个字，它可能写出来的是个普通脚本而不是真正可复用的 skill。

动作 5：把任意 chat 变成 Automation

让人有点震撼的演示：他在调用 Calendar 写完周历邮件后，简单一句"please make this an automation for every Friday at 4pm"，Codex 直接把刚才那段对话变成一个定时任务。点 Automations 标签可以看到一个 cron-like 的列表，可以编辑、暂停、立即试跑。

洞察：这是把 agent 从"问答机"升级成"员工"的关键拐点。以前你用 ChatGPT 是"我提问 → 它回答"，现在变成"我教它一次 → 它替我永远做下去"。

三、Steering vs Queueing：Codex 的"插话能力"凭什么是大事

这是视频里一个看起来不起眼、实际上极为重要的细节。

传统的 ChatGPT/Claude/Cursor：你发了 prompt 后，模型在跑的过程中，你再发新 prompt，它会排队（queueing） ——等当前轮跑完才轮到你的新输入。

Codex 加了 Steering：当 agent 正在跑、你看到它产出的中间结果不对劲（比如 Figma 上某些按钮重叠了），你可以立刻发新 prompt 截断它，agent 在下一个工具调用边界就接收你的修正。

"It'll wait for the AI to be done before entering the prompt. But Codex has steering built in — like a steering wheel."（其他工具会等 AI 跑完才接收你的新 prompt。但 Codex 内置了 steering——就像方向盘一样。）

为什么这是大事：

随着 agent 任务越来越长（5-10 分钟一个 prompt 是常态，复杂任务 30 分钟到 2 小时也有），等它跑完才能纠错的代价是巨大的。比如 Riley 演示中 Remotion 视频生成跑了 6 分钟，结果一开始就把鼠标动画位置算错了——如果是排队模式，他要等 6 分钟看完成品才能修；用 steering，他在第 1 分钟就能截断说"鼠标位置错了，应该在 (1000, 610)"，agent 立即吸收新信息修正方向。

实操要点：发 prompt 时按钮有两个选项——steer（橙色）和 send (queue)（默认）。steer 是中断当前思路并入新输入；queue 是排队等下一轮。Riley 的工作习惯是激进的——大多数时候点 steer，让 agent 始终走在最新指示上。

四、Multitasking 实战：从 6 个并发任务里学到的工作流

这是视频 Part 2 的核心，也是最值得反复看的部分。Riley 给自己设的角色是"我叫 Riley Brown，要做一款叫 Chorus 的 AI agent 教学 app，需要在一个下午把 app + 官网 + 投资人 deck + launch video + 设计稿 + 自动化推文全部搞定"。

我把他的实际操作流程提炼成下面这张表（按时间顺序，每一行是一次 chat 启动）：

时间锚点	启动哪个 chat	让 agent 干什么	启动后做什么
00:00	Plan chat	让 agent 写一个 markdown 计划文件，列出 6 件事	不等，立刻去启动下一个 chat
02:00	Mobile Design chat	调用 `/mobile-design` skill 生成 8 个 iPhone 屏幕设计	不等，立刻去启动下一个 chat
03:00	iOS App chat	用 Swift 创建 Hello World 项目，打开 Xcode	等 5 分钟（必须等 Xcode 设置完才能继续）
08:00	回到 Mobile Design chat	拿到设计稿 prototype 链接，预览效果	切到 iOS App chat，让它把设计稿集成进去
12:00	Web App chat	创建 React landing page，嵌入 Tally 表单	切到 Database chat
15:00	Database chat	让 Codex 配置 Supabase MCP + 创建数据库 schema	切到 Launch Video chat
18:00	Launch Video chat	调用 `@remotion` plugin 创建 90 秒动画	切到 App Icon chat
22:00	App Icon chat	用内置 image generation 生成 10 个 app 图标候选	回到 iOS App chat 看进度
...	...	...	...
80:00	Investor Deck chat（fork from iOS App chat）	基于 app 已有上下文生成 PowerPoint	切到 Claude Code 终端
85:00	终端里开 Claude Code	让 Opus 4.7 帮忙提升 deck 的视觉设计水平	切回检查其他 agent
100:00	全部 chat 检查 + 最后调整	上 TestFlight、部署 Vercel、提交 X 自动化	收工

这张表里藏着 Riley 工作流的全部秘密——他从来不在任何一个 chat 上停留超过 3-5 分钟。每发完一个 prompt，他立即切到下一个 chat。他自己把这个动作描述得非常精准：

"It's not even like multitasking, you're like serializing. Each prompt that you type in is the task."（这甚至不算多任务，叫"串行任务"更准确——你打的每一个 prompt 本身就是一个任务，发完它就结束了。）

重新理解一下"任务"的定义——传统打工人脑子里，"任务"=做一件完整的事（写一个 PPT、改一个 bug、画一张图）。Riley 的工作框架里，"任务"=写一个 prompt。一旦你按下回车，那个任务就结束了。剩下的事是 agent 的——你要做的下一个任务是写下一个 prompt。

这个重新定义是有威力的，因为：

一次只专注一个 prompt——你不需要在写完 prompt 后还盯着屏幕看 agent 的中间输出。盯着看是浪费的，因为你的注意力价值远高于 agent 反馈的边际信息。
agent 跑得越慢，你的并发空间越大——一个 agent 跑 10 分钟，你这 10 分钟里可以发 5-6 个 prompt 启动其他任务。
错的 prompt 比慢的 agent 危险——既然你只能控制写 prompt 的部分，那么写 prompt 的质量就是唯一可控的杠杆。Riley 的 prompt 都很长、很具体（"我用的是 Tally，请帮我把这个表单嵌入网站，先不管设计，等会再调样式"），他从不写"做个网站"这种短指令。

洞察：未来真正稀缺的能力，可能不是"会写代码"或"会用 AI"，而是"会同时管理 5-10 个 AI 子任务的人脑调度能力"。这跟以前管理一个开发团队的项目经理能力高度相似——只是协作对象从人变成了 agent。

五、Codex 不擅长设计？让 Claude Code 在它体内打工

视频里有一个非常戏剧性的反转情节：当 Riley 想优化网页 landing page 的视觉、想优化 investor deck 的排版时，他直接放弃 Codex，在 Codex 的 terminal 里打开 Claude Code 让 Opus 4.7 来做设计。

"Codex is just not the best at web design. So we're going to use Opus."（Codex 真的不太擅长网页设计，所以我们用 Opus 4.7。）

具体操作：

Codex 桌面端右上角有个 terminal 标签（默认在当前 project 文件夹下）
输入 claude --dangerously-skip-permissions 启动 Claude Code 的终端版（自动 bypass 所有权限询问）
给 Claude 长 prompt：让它读 iOS app 的代码风格，让 landing page 跟 app 视觉一致

这个组合的本质是什么：

Codex（GPT-5.5） = "干杂活的项目管家"——多任务调度好、computer use 强、plugin 生态全、文档/表格/PPT 处理稳定
Claude Code（Opus 4.7） = "审美顾问 + 复杂代码重构师"——视觉品味更好、写出的 React/CSS 代码更"看着舒服"、长 thinking 更深入

对普通用户的启示：不要在工具里站队。如果你既订了 ChatGPT 又订了 Claude，最好的工作方式可能是同时打开两个 agent，让它们做各自擅长的事。Riley 这里的工作流相当于一个真实的小团队——Codex 是 PM 兼后端，Claude Code 是设计 + 前端，他自己是产品老板做指挥。

他原话："I have a Claude subscription but I want to use Codex because Codex is a better interface but Claude is better at design."（我有 Claude 订阅，但我想用 Codex 因为它界面更好；不过 Claude 设计更强。所以两个都用。）

六、Skills 的"杠杆效应"：一个晚上做出能用十年的工具

这是视频里最被低估的一段。Riley 在 Part 1 演示完 YouTube Researcher Skill 后顺手做了一个 Automation：每月最后一天自动用这个 skill 抓取自己 YouTube 频道的当月数据，分析 hook 表现，生成 Word 文档报告。

他花了 5 分钟创建这个工作流，但这个工作流会自动运行很多年——只要 Codex 还在、只要他还做 YouTube。

Skill 的"复利结构"：

一次性成本（创建 skill）：5-15 分钟
每次调用收益：节省 30-60 分钟的手动操作
调用频次：每周/每月/无限

只要这个工作流被调用 10 次以上，创建成本就回本了。100 次以上，就是 10x 杠杆。这跟以前编程世界里写一个小脚本一样——但门槛从"会写 Python"降到了"会写中文 prompt"。

Riley 演示的几个值得借鉴的 skill 类型：

YouTube Researcher（抓取+分析）——任何"我每周/每月都要做的数据汇总"都可以做成
Mobile Design（包装设计能力）——他从 Anthropic 的 claude.ai/design 工具反向工程出来的，把别人做好的设计能力变成你自己的 skill
Typefully Control（控制第三方 SaaS）——只要那个 SaaS 有 API + 你有 API key，就能让 Codex 完全控制它发推/排程/分析

对普通人的建议：列一张表，写下你每周重复做的 5 件杂事（处理客户邮件、更新销售记录、整理报销凭证、写周报、整理读书笔记），每件挑一个开始问 agent："请教我怎么把这件事做成一个 skill。" 你不需要懂任何技术——agent 会一边教你一边帮你做。三个月后你的 skill 库会成为一笔无声的复利资产。

七、几个非常具体的"小工程师 trick"

这部分是给已经在用 Codex 的人的实战 cheatsheet。如果你完全没用过 Codex，可以跳过。

7.1 Forking Chat（分叉对话）

右键任意 chat → Fork into Local。这会复制当前 chat 的全部上下文，开一个新 chat 继续。典型用例：你在 Mobile App chat 里跟 agent 把整个 app 设计完了，现在要做投资人 deck——直接 fork 这个 chat，新 chat 已经知道所有 app 上下文，你只要说"基于这些做 deck"就行。比"重新解释一遍"省 10-20 分钟。

7.2 Mini-Window 模式

右键任意 chat → Open in Mini Window。chat 会变成一个浮动小窗口。用途：让 agent 在后台干活，你正面用其他软件（比如 Figma、Photoshop），需要时随时瞄一眼小窗看进度。Riley 经常这样：Mini Window 跑设计 → 主窗口看 Xcode 模拟器。

7.3 Remotion 视频精确指令

视频是 30 帧/秒。如果你要让 agent 修改某一帧的内容（比如"鼠标 1.5 秒时位置错了"），精确说"frame 45"或"1 second 15 frames"，比说"在 1.5 秒"准确得多。Riley 还教了一个隐藏技巧——让 agent 打开 grid lines 显示坐标轴，然后你直接用像素坐标指挥（"鼠标应该到 (1000, 610) 而不是 (140, 540)"）。

7.4 Supabase MCP 配置后必须重启 Codex

视频里 Riley 配 Supabase 时遇到一个坑：装完 MCP server 后 agent 说"我配好了但当前 session 还看不到这个 server，请你重启 Codex"。亲测：MCP 类的 plugin/server 装完一定要 quit + 重开 Codex。OpenAI 这块的 hot reload 还不完善。

7.5 PowerPoint → Canva 的一键导出

Codex 用内置 /word-doc skill 生成 .pptx 后，点开文件预览右上角有个 "Open in Canva" 按钮——一键把 PowerPoint 打开为 Canva 模板继续编辑。Riley 的反应是 "Wow, this is actually very cool. I did not realize you can do that that easily."（哇，这真的很爽，我之前都不知道这么简单就能做到。）这意味着 Codex 已经做了 OpenAI ↔ Canva 的格式适配，导入后排版不会乱。

7.6 iOS 真机调试不需要付费 Apple 开发者账号（视频中走了 TestFlight）

Xcode 里打开你的 Apple ID 登录后，可以直接选自己的 iPhone 作为 Run Target——不需要 99 美金/年的 Apple Developer 账号。只是装到自己手机用没问题，发 App Store 才需要付费账号。 Riley 视频里就是这么直接装到他自己 iPhone 上演示的。

7.7 Whisper Flow 是隐藏生产力武器

Riley 的所有 prompt 几乎都是用语音输入的。他用的工具叫 Whisper Flow（按住 Fn 键说话，松开自动转文字）。他打一个 5 行的 prompt 平均只要 15 秒——这是他能保持高速 multitask 的物理基础。如果你打字慢（中文输入也算），强烈考虑加一个语音输入工具到工作流。

八、最重要的认知转变：AI 时代的"杠杆"在哪

视频结尾 Riley 没说什么大道理，但他演示出来的工作方式本身就是一个深刻的判断。让我替他把它显式说出来：

老世界：杠杆 = 雇人

软件行业过去 30 年的"做事杠杆"基本就是雇人。一个产品经理想做 5 个新功能，要雇 5 个工程师。一个创业者想跑得快，要融资雇团队。

新世界：杠杆 = 同时管理多少个 agent

Riley 用 100 分钟交付的工作量，按传统算法需要：1 名 iOS 工程师 + 1 名前端工程师 + 1 名 UI 设计师 + 1 名视频剪辑师 + 1 名 BD（投资人 deck）+ 1 名社媒运营。这 6 个人的成本（按硅谷工资）一年大约 100-150 万美元。

Riley 用一个人 100 分钟做完了。他付出的不是体力，是 prompt 数量和上下文切换次数——那 100 分钟里他大概写了 50-80 个 prompt，每个 30 秒到 2 分钟。

这不是要把一线程序员/设计师吓死的预言。这是一个事实层面的观察：这种事情已经能做了，且只会越来越能做。一个 25 岁的创业者，在他职业生涯结束之前，会和 50-100 个 AI agent 同时工作。

真正稀缺的不是技能，是判断力

当 agent 能同时干 6 件事的时候，瓶颈就回到了"做哪 6 件事"和"做完后怎么验收"。Riley 在演示里反复展现这种判断力：

判断力 1：Codex 自己做的 deck 不好看 → 立即决定换 Claude Code 做。没有死磕一个工具的执念。
判断力 2：Codex 报错说"Supabase MCP 在当前 session 看不到" → 不是去 debug 代码，而是直接重启 Codex 再试。优先选最简单的解。
判断力 3：Tally 表单接入卡住 → 直接打开 tally.so 手动建表单 → 复制 embed code → 让 agent 嵌进去。人手 30 秒能干完的事不要让 agent 试 5 分钟。
判断力 4：Remotion 视频跑 6 分钟出来效果不对 → steering 中断 → 给精确坐标 → 让它继续跑。不死等不重新开始，用最小改动撬最大产出。

这些判断力没法外包给 AI——它来自 Riley 长期做产品、做内容、踩过的坑。AI 时代的"专业能力"会从"会做某件事"快速迁移到"知道什么时候做、什么时候停、什么时候换工具"。

行动启示（这是给你的）

如果你看完想立即用上这些方法，按这个优先级动手：

本周：装 Codex 桌面端 + 跑通 1 个 plugin（Calendar 或 Gmail）+ 创建 1 个 automation。目标：让 agent 替你做一件每周重复的杂事。 时间投入：1 小时。
下周：列出 5 个你日常手动做的"信息处理"任务（搜资料、写周报、整理客户名单、生成会议纪要等），选一个让 Codex 帮你做成 skill。投入：2 小时。
下个月：试一次 Multitasking——挑一个本来要花 1 周做的项目（比如新产品上线、季度复盘报告），强迫自己用 Riley 的方式 2-3 小时内做出 v1。完成后回看：哪些环节可以全自动？哪些需要你判断？投入：3 小时。
持续：每次手动做完一件事都问自己："这件事下一次能不能让 agent 做？"——把答案写进一个 skill ideas list。坚持 3 个月，你会有 20-50 个备选 skill，那是你专属的生产力护城河。

九、值得警惕的几个点

视频是教学性质的，Riley 主要展示"能做什么"。但客观看，这套工作流也有非常具体的局限性：

Codex 写的代码风格非常统一但没什么品味。他自己反复说 "Codex is not the best at design"——投资人看 demo 时会说"挺工整但有点 ChatGPT 味"。如果你做的是 to-C 产品，纯靠 Codex 出活会被设计师看出来。对策：跟 Claude Code/Cursor 配合用，让有审美的工具做最后润色。
Multitasking 对认知带宽要求高。Riley 是熟练玩家，他知道每个 chat 跑到哪一步、知道哪些可以打断、哪些不能。新手如果同时开 6 个 chat，很可能是混乱不堪、产出全部劣质。对策：先练熟"2 个 chat 并行"，再升到 3-4 个，半年后再尝试 Riley 的水平。
依赖 ChatGPT 订阅 + 一堆第三方 SaaS（Tally、Supabase、Typefully、Vercel、Canva）。每个工具都要钱，还都有 vendor lock-in。对策：至少选一个核心数据资产（比如客户邮箱列表）放在你能完全 export 的地方，其余可以用 SaaS。
TestFlight 不等于 App Store。视频结尾 Riley 把 app 推到了 TestFlight，但真正提交 App Store 审核需要 7 天到 3 周，可能被打回。Codex 没法替你过 Apple 审核——审核员看的是产品逻辑而非代码质量。对策：把 vibe coding 当 v0/v1 的快速原型方式，正式上线前要花时间打磨用户体验和合规细节。
GPT-5.5 + extra high effort 烧钱。Riley 没说他这 100 分钟的 token 消耗多少，但凭经验 6-10 个 chat 同时跑 + Computer Use + 视频生成，估计单次会话花 5-15 美元。对策：日常杂事用 normal effort 模型（便宜 5-10 倍），只在真需要"做完整功能"时才用 GPT-5.5 high。

十、金句收录（中英对照）

"Codex is the only unified all-purpose AI agent tool." Codex 是目前唯一一个真正"全能型"的 AI 代理工具——把代码、协作、浏览器、电脑控制全装进一个界面里。 —— Riley Brown, 03:30

"Every month that goes by, AI agents are working for longer and longer to the point where AI agents can take up to an hour or two hours on any given task. So in order to become effective at using AI, you need to learn how to multitask." 每过一个月，AI 代理就能在单个任务上工作得更久——现在已经到了一个任务能跑 1 到 2 小时的程度。所以想真正用好 AI，你必须学会多任务并行。 —— Riley Brown, 02:25

"It's not even like multitasking, you're like serializing. Each prompt that you type in is the task." 这甚至不算"多任务"，更准确的说法是"串行任务"——你写的每一个 prompt 本身就是一个完整的任务。 —— Riley Brown, 36:32

"If you ever get stuck, just ask the agent. If you ever want a skill, just ask the agent if you can create a skill." 卡住了就问代理；想要一个新 skill，就问代理能不能帮你创建一个。 —— Riley Brown, 1:42:48

"Codex is just not the best at web design. So we're going to use Opus." Codex 真的不太擅长网页设计，所以我们换 Opus 4.7 来。 —— Riley Brown, 1:09:46（在 Codex 终端里打开 Claude Code 时）

"I highly recommend to just take everything that you do in your job or in your business and try and figure out how you can automate as much as you can." 我强烈建议：把你工作和生意里的每一件事都拿出来过一遍，看看哪些能自动化，能自动化多少就自动化多少。 —— Riley Brown, 1:42:30

"There's so much that you can do on these AI-powered super apps and they're only going to get better." 这些 AI 驱动的超级应用上能做的事情多得超出想象——而且只会越来越强。 —— Riley Brown, 1:42:55（视频结尾）

十一、术语表

Codex Super-App：OpenAI 2026 年 4 月推出的桌面 AI 工作台，区别于命令行 codex。
GPT-5.5：Codex 桌面端默认使用的 OpenAI 旗舰模型，需 ChatGPT 订阅。
Effort（推理强度） ：模型可调参数，分 Low/Medium/High/Extra High。Riley 默认 Extra High，质量最高但慢且贵。
Plugin：OpenAI 官方维护的能力扩展，对接第三方 SaaS（Figma/Calendar/Linear 等），一键安装。
Skill：用户/社区自创的工作流食谱，可以包装外部 API 让 agent 标准化调用。
Automation：定时执行的 chat，可引用 skill 和 plugin。
Computer Use：让 AI 直接操控你电脑的鼠标键盘，OpenAI 的实现是行业最强的之一。
MCP（Model Context Protocol） ：Anthropic 提出的开放协议，允许 AI 标准化连接外部工具。Codex 兼容 MCP server。
Steering vs Queueing：Codex 的两种新 prompt 提交方式——steering 是中途打断 agent 修正方向，queueing 是排队等当前任务完成。
Forking Chat：右键 chat 选 "Fork into Local"，复制当前对话的全部上下文创建新 chat 继续。
Project：绑定到本地某个文件夹的工作空间，所有产出落到该文件夹的 outputs/ 子目录。
Remotion：用 React 代码生成程序化视频的开源框架，Codex 提供 plugin 集成。
TestFlight：Apple 提供的 iOS app 内测分发渠道，开发者可以推送 app 给最多 1 万名内测用户，无需 App Store 审核。
Tally：在线表单工具，免费版支持基础的 lead capture，可生成 embed code 嵌入任意网页。
Supabase：开源的 Firebase 替代品，提供 Postgres 数据库 + 认证 + 实时同步，是当前 vibe coding 圈最常用的后端。
Vibe Coding：Riley 等人推广的术语，指完全用自然语言对话来"编程"，而不写一行代码。

十二、时间线索引

[00:00] 开场介绍：Codex 是统一的 AI agent 工具，分两部分讲——基础和多任务
[02:54] Part 1 开始：下载 Codex 桌面端
[03:20] 界面总览：左侧栏五大区域
[04:53] Projects = 本地文件夹绑定
[07:37] 创建表格演示：让 agent 写 .xlsx，文件落到 outputs/
[10:42] Codex 总览回顾
[14:29] Skills 与 Plugins 的区别
[16:29] Calendar plugin 实战
[18:07] 第一次 Automation：每周五 4pm 周历回顾
[19:18] Figma plugin 测试 + 设计师替代品 Paper 介绍
[21:37] 内置图像生成
[24:17] Mini-Window 模式
[25:26] Steering vs Queueing 关键差异
[27:35] 创建第一个自定义 Skill：YouTube Researcher（用 Supadata API）
[31:34] 用 YouTube Researcher 分析自己 YouTube 表现
[33:24] 把 Skill 变成 Automation：每月最后一天自动跑
[35:27] Part 2 开始：6 任务并发实战
[37:54] 创建 Project："my new business"
[38:31] 让 agent 写 6 任务计划文件
[40:25] 调用 Mobile Design Skill 生成 iOS 屏幕设计
[41:47] 创建 Swift 项目，打开 Xcode
[45:08] 把 Mobile Design 集成到 Swift app
[46:13] 创建 React landing page
[46:45] 用 Tally 做表单，生成 embed code
[49:43] 重命名/置顶 chat 保持组织
[52:12] Supabase MCP 配置
[53:19] 让 agent 生成 10 个 app icon
[54:08] 第一次调用 Remotion 创建测试视频
[59:32] Remotion 时间线和编辑器
[1:05:37] 用 grid lines 给 agent 精确坐标
[1:07:11] 编辑 Web App
[1:09:46] 关键转折：在 Codex 终端打开 Claude Code 做设计
[1:17:20] Fork chat 创建 Investor Deck
[1:19:09] 用 Claude Opus 4.7 提升 deck 视觉
[1:20:22] 测试 Canva 一键导出（"哇真好用"）
[1:22:33] 在真机 iPhone 跑 app（不是模拟器）
[1:28:58] 收尾各项目
[1:31:56] 在 Canva 里做最后微调
[1:33:13] 用 Vercel plugin 部署 Web App
[1:33:44] 给 Remotion 视频加配乐（Chasing Horizons）
[1:35:26] Typefully 自动发推 skill 创建
[1:37:57] App 上 TestFlight 成功
[1:39:58] 最终 Remotion 视频成品
[1:41:04] 总结与启示
[1:42:55] 视频结束

Ctrl+Enter 发送

还没有评论，来第一个留言吧 ✨

你可能也喜欢

AI 前沿

罗福莉×小米 MiMo：OpenClaw 重塑 Agent 认知，1T 是 2026 入场券

张小军 × 罗福莉（小米大模型团队负责人）

15min · 7,166字

AI 前沿

Claude Code 的 7 个隐藏指令：从 ultrathink 到 /clear，99% 的人不知道

Sabrina Ramonov × 无（独白教学）

8min · 3,704字

AI 前沿

AI 让每个员工都是创始人：Replit CEO 谈未来公司只剩两类岗位

Y Combinator × Amjad Masad（Replit 联合创始人 / CEO）

13min · 6,275字

AI 前沿

Token 正在吃 SaaS：All-In #270 拆解 SpaceX 买 Cursor、SaaS 债务炸弹与 Tim Cook 卸任

The All-In Podcast × Chamath Palihapitiya、David Sacks、David Friedberg（4 个固定 bestie 共同主持）

13min · 6,020字

← 浏览更多报告

AI 前沿

AI Agent 多线程方法论：1 人 100 分钟同时交付 iOS 应用、官网、视频和 PPT

Codex Full Course 2026: The NEW Best AI Coding Tool

本报告由 AI 深度分析生成，基于视频完整字幕。

📺 原视频约 103 分钟📖 本报告 8,030字⏱ 预计阅读 17min

一、Codex 不是命令行工具：先把概念厘清

这是普通人最容易踩的认知坑——绝大多数人听到"Codex"会以为是 OpenAI 那个老命令行版本。

名字	是什么	用什么
`codex` 命令行（旧）	OpenAI 早期开放给开发者的 CLI 编程工具，跟 Claude Code 终端版定位类似	终端里跑 `codex exec`
Codex Super-App（新，本视频主角）	2026 年 4 月发布的桌面应用，把对话、代码、设计、文档、computer use、自动化全装一个界面	下载 macOS / Windows app
Codex Cloud	后台 agent 服务，长任务跑在云端	Web 界面或集成到桌面 app

打开后，左侧栏从上到下分五个区域：

Search（CMD+G 调出，搜全部历史 chat）
Plugins（OpenAI 官方做好的能力扩展，目前有 Figma、Google Calendar、Gmail、Remotion、Linear、Notion 等几十个）
Skills（自创的"工作流食谱"，可以分享给别人）
Automations（定时任务列表）
Projects（绑定到本地某个文件夹的项目空间）

关键概念分清楚：

Project = 一个本地文件夹。你新建项目时实际是在你硬盘选一个文件夹，所有这个项目里的 chat 产出的文件全部落到那个文件夹的 outputs/ 子目录里——没有云端隐藏存储，所有文件你都能用 Finder 直接看。这一点对非程序员很重要：你永远清楚"我创建的东西在哪儿"。
Chat = 一个对话，绑在某个 project 下。但有一种特殊位置叫 "general agent tasks"——不绑项目的杂事都进这里。
Plugins ≠ Skills。Riley 说官方词汇有点乱（OpenAI 叫 plugins+skills，Anthropic 叫 connectors+skills），他自己的判断是："Skill 是可复用的食谱，Plugin 是安装的扩展能力。"（"A skill is a reusable workflow recipe, a plugin is the installable unit that extends Codex with more capabilities."）实战中两者经常合用——比如他先装一个 Figma plugin，然后让 Codex 写一个 skill 来"标准化调用 Figma plugin 完成某类设计任务"。

二、把"五个底层动作"先练熟

Part 1 的 35 分钟其实在反复教五个动作。这五个动作组合起来，就是 Codex 99% 的日常用法：

动作 1：建项目 + 在项目里开 chat

动作 2：让 agent 创建文件，然后在新 chat 里 @-mention 这些文件

Riley 演示了一个非常好的工作模式：

Chat A：让 agent 调研 OpenAI 新功能，让它输出成 .xlsx 表格而不是纯文本回复
表格自动落到项目 outputs/ 文件夹
Chat B：在新 chat 里输入 @codex-desktop-features.xlsx，让另一个 agent 基于上一个表格做补充

动作 3：装 Plugin → 自然语言调用

动作 4：把"重复劳动"做成 Skill

Riley 演示的 YouTube Researcher Skill 是个绝佳样本，三步：

找到外部 API（Supadata，专门做 YouTube 字幕和元数据抓取）
在 chat 里输入：skill creator. Please create a skill that lets me ask you to summarize the latest 10 videos from a YouTube channel using the Supadata API. My API key is: <key>
重启 chat，新 chat 输入 /youtube-researcher，就可以说"看 Riley Brown 的最近 10 个视频，分析哪些 hook 表现好"

动作 5：把任意 chat 变成 Automation

洞察：这是把 agent 从"问答机"升级成"员工"的关键拐点。以前你用 ChatGPT 是"我提问 → 它回答"，现在变成"我教它一次 → 它替我永远做下去"。

三、Steering vs Queueing：Codex 的"插话能力"凭什么是大事

这是视频里一个看起来不起眼、实际上极为重要的细节。

传统的 ChatGPT/Claude/Cursor：你发了 prompt 后，模型在跑的过程中，你再发新 prompt，它会排队（queueing） ——等当前轮跑完才轮到你的新输入。

"It'll wait for the AI to be done before entering the prompt. But Codex has steering built in — like a steering wheel."（其他工具会等 AI 跑完才接收你的新 prompt。但 Codex 内置了 steering——就像方向盘一样。）

为什么这是大事：

四、Multitasking 实战：从 6 个并发任务里学到的工作流

我把他的实际操作流程提炼成下面这张表（按时间顺序，每一行是一次 chat 启动）：

时间锚点	启动哪个 chat	让 agent 干什么	启动后做什么
00:00	Plan chat	让 agent 写一个 markdown 计划文件，列出 6 件事	不等，立刻去启动下一个 chat
02:00	Mobile Design chat	调用 `/mobile-design` skill 生成 8 个 iPhone 屏幕设计	不等，立刻去启动下一个 chat
03:00	iOS App chat	用 Swift 创建 Hello World 项目，打开 Xcode	等 5 分钟（必须等 Xcode 设置完才能继续）
08:00	回到 Mobile Design chat	拿到设计稿 prototype 链接，预览效果	切到 iOS App chat，让它把设计稿集成进去
12:00	Web App chat	创建 React landing page，嵌入 Tally 表单	切到 Database chat
15:00	Database chat	让 Codex 配置 Supabase MCP + 创建数据库 schema	切到 Launch Video chat
18:00	Launch Video chat	调用 `@remotion` plugin 创建 90 秒动画	切到 App Icon chat
22:00	App Icon chat	用内置 image generation 生成 10 个 app 图标候选	回到 iOS App chat 看进度
...	...	...	...
80:00	Investor Deck chat（fork from iOS App chat）	基于 app 已有上下文生成 PowerPoint	切到 Claude Code 终端
85:00	终端里开 Claude Code	让 Opus 4.7 帮忙提升 deck 的视觉设计水平	切回检查其他 agent
100:00	全部 chat 检查 + 最后调整	上 TestFlight、部署 Vercel、提交 X 自动化	收工

"It's not even like multitasking, you're like serializing. Each prompt that you type in is the task."（这甚至不算多任务，叫"串行任务"更准确——你打的每一个 prompt 本身就是一个任务，发完它就结束了。）

这个重新定义是有威力的，因为：

一次只专注一个 prompt——你不需要在写完 prompt 后还盯着屏幕看 agent 的中间输出。盯着看是浪费的，因为你的注意力价值远高于 agent 反馈的边际信息。
agent 跑得越慢，你的并发空间越大——一个 agent 跑 10 分钟，你这 10 分钟里可以发 5-6 个 prompt 启动其他任务。
错的 prompt 比慢的 agent 危险——既然你只能控制写 prompt 的部分，那么写 prompt 的质量就是唯一可控的杠杆。Riley 的 prompt 都很长、很具体（"我用的是 Tally，请帮我把这个表单嵌入网站，先不管设计，等会再调样式"），他从不写"做个网站"这种短指令。

五、Codex 不擅长设计？让 Claude Code 在它体内打工

"Codex is just not the best at web design. So we're going to use Opus."（Codex 真的不太擅长网页设计，所以我们用 Opus 4.7。）

具体操作：

Codex 桌面端右上角有个 terminal 标签（默认在当前 project 文件夹下）
输入 claude --dangerously-skip-permissions 启动 Claude Code 的终端版（自动 bypass 所有权限询问）
给 Claude 长 prompt：让它读 iOS app 的代码风格，让 landing page 跟 app 视觉一致

这个组合的本质是什么：

Codex（GPT-5.5） = "干杂活的项目管家"——多任务调度好、computer use 强、plugin 生态全、文档/表格/PPT 处理稳定
Claude Code（Opus 4.7） = "审美顾问 + 复杂代码重构师"——视觉品味更好、写出的 React/CSS 代码更"看着舒服"、长 thinking 更深入

他原话："I have a Claude subscription but I want to use Codex because Codex is a better interface but Claude is better at design."（我有 Claude 订阅，但我想用 Codex 因为它界面更好；不过 Claude 设计更强。所以两个都用。）

六、Skills 的"杠杆效应"：一个晚上做出能用十年的工具

他花了 5 分钟创建这个工作流，但这个工作流会自动运行很多年——只要 Codex 还在、只要他还做 YouTube。

Skill 的"复利结构"：

一次性成本（创建 skill）：5-15 分钟
每次调用收益：节省 30-60 分钟的手动操作
调用频次：每周/每月/无限

Riley 演示的几个值得借鉴的 skill 类型：

YouTube Researcher（抓取+分析）——任何"我每周/每月都要做的数据汇总"都可以做成
Mobile Design（包装设计能力）——他从 Anthropic 的 claude.ai/design 工具反向工程出来的，把别人做好的设计能力变成你自己的 skill
Typefully Control（控制第三方 SaaS）——只要那个 SaaS 有 API + 你有 API key，就能让 Codex 完全控制它发推/排程/分析

七、几个非常具体的"小工程师 trick"

这部分是给已经在用 Codex 的人的实战 cheatsheet。如果你完全没用过 Codex，可以跳过。

7.1 Forking Chat（分叉对话）

7.2 Mini-Window 模式

7.3 Remotion 视频精确指令

7.4 Supabase MCP 配置后必须重启 Codex

7.5 PowerPoint → Canva 的一键导出

7.6 iOS 真机调试不需要付费 Apple 开发者账号（视频中走了 TestFlight）

7.7 Whisper Flow 是隐藏生产力武器

八、最重要的认知转变：AI 时代的"杠杆"在哪

视频结尾 Riley 没说什么大道理，但他演示出来的工作方式本身就是一个深刻的判断。让我替他把它显式说出来：

老世界：杠杆 = 雇人

软件行业过去 30 年的"做事杠杆"基本就是雇人。一个产品经理想做 5 个新功能，要雇 5 个工程师。一个创业者想跑得快，要融资雇团队。

新世界：杠杆 = 同时管理多少个 agent

Riley 用一个人 100 分钟做完了。他付出的不是体力，是 prompt 数量和上下文切换次数——那 100 分钟里他大概写了 50-80 个 prompt，每个 30 秒到 2 分钟。

真正稀缺的不是技能，是判断力

当 agent 能同时干 6 件事的时候，瓶颈就回到了"做哪 6 件事"和"做完后怎么验收"。Riley 在演示里反复展现这种判断力：

判断力 1：Codex 自己做的 deck 不好看 → 立即决定换 Claude Code 做。没有死磕一个工具的执念。
判断力 2：Codex 报错说"Supabase MCP 在当前 session 看不到" → 不是去 debug 代码，而是直接重启 Codex 再试。优先选最简单的解。
判断力 3：Tally 表单接入卡住 → 直接打开 tally.so 手动建表单 → 复制 embed code → 让 agent 嵌进去。人手 30 秒能干完的事不要让 agent 试 5 分钟。
判断力 4：Remotion 视频跑 6 分钟出来效果不对 → steering 中断 → 给精确坐标 → 让它继续跑。不死等不重新开始，用最小改动撬最大产出。

行动启示（这是给你的）

如果你看完想立即用上这些方法，按这个优先级动手：

本周：装 Codex 桌面端 + 跑通 1 个 plugin（Calendar 或 Gmail）+ 创建 1 个 automation。目标：让 agent 替你做一件每周重复的杂事。 时间投入：1 小时。
下周：列出 5 个你日常手动做的"信息处理"任务（搜资料、写周报、整理客户名单、生成会议纪要等），选一个让 Codex 帮你做成 skill。投入：2 小时。
下个月：试一次 Multitasking——挑一个本来要花 1 周做的项目（比如新产品上线、季度复盘报告），强迫自己用 Riley 的方式 2-3 小时内做出 v1。完成后回看：哪些环节可以全自动？哪些需要你判断？投入：3 小时。
持续：每次手动做完一件事都问自己："这件事下一次能不能让 agent 做？"——把答案写进一个 skill ideas list。坚持 3 个月，你会有 20-50 个备选 skill，那是你专属的生产力护城河。

九、值得警惕的几个点

视频是教学性质的，Riley 主要展示"能做什么"。但客观看，这套工作流也有非常具体的局限性：

Codex 写的代码风格非常统一但没什么品味。他自己反复说 "Codex is not the best at design"——投资人看 demo 时会说"挺工整但有点 ChatGPT 味"。如果你做的是 to-C 产品，纯靠 Codex 出活会被设计师看出来。对策：跟 Claude Code/Cursor 配合用，让有审美的工具做最后润色。
Multitasking 对认知带宽要求高。Riley 是熟练玩家，他知道每个 chat 跑到哪一步、知道哪些可以打断、哪些不能。新手如果同时开 6 个 chat，很可能是混乱不堪、产出全部劣质。对策：先练熟"2 个 chat 并行"，再升到 3-4 个，半年后再尝试 Riley 的水平。
依赖 ChatGPT 订阅 + 一堆第三方 SaaS（Tally、Supabase、Typefully、Vercel、Canva）。每个工具都要钱，还都有 vendor lock-in。对策：至少选一个核心数据资产（比如客户邮箱列表）放在你能完全 export 的地方，其余可以用 SaaS。
TestFlight 不等于 App Store。视频结尾 Riley 把 app 推到了 TestFlight，但真正提交 App Store 审核需要 7 天到 3 周，可能被打回。Codex 没法替你过 Apple 审核——审核员看的是产品逻辑而非代码质量。对策：把 vibe coding 当 v0/v1 的快速原型方式，正式上线前要花时间打磨用户体验和合规细节。
GPT-5.5 + extra high effort 烧钱。Riley 没说他这 100 分钟的 token 消耗多少，但凭经验 6-10 个 chat 同时跑 + Computer Use + 视频生成，估计单次会话花 5-15 美元。对策：日常杂事用 normal effort 模型（便宜 5-10 倍），只在真需要"做完整功能"时才用 GPT-5.5 high。

十、金句收录（中英对照）

"Codex is the only unified all-purpose AI agent tool." Codex 是目前唯一一个真正"全能型"的 AI 代理工具——把代码、协作、浏览器、电脑控制全装进一个界面里。 —— Riley Brown, 03:30

"Every month that goes by, AI agents are working for longer and longer to the point where AI agents can take up to an hour or two hours on any given task. So in order to become effective at using AI, you need to learn how to multitask." 每过一个月，AI 代理就能在单个任务上工作得更久——现在已经到了一个任务能跑 1 到 2 小时的程度。所以想真正用好 AI，你必须学会多任务并行。 —— Riley Brown, 02:25

"It's not even like multitasking, you're like serializing. Each prompt that you type in is the task." 这甚至不算"多任务"，更准确的说法是"串行任务"——你写的每一个 prompt 本身就是一个完整的任务。 —— Riley Brown, 36:32

"If you ever get stuck, just ask the agent. If you ever want a skill, just ask the agent if you can create a skill." 卡住了就问代理；想要一个新 skill，就问代理能不能帮你创建一个。 —— Riley Brown, 1:42:48

"Codex is just not the best at web design. So we're going to use Opus." Codex 真的不太擅长网页设计，所以我们换 Opus 4.7 来。 —— Riley Brown, 1:09:46（在 Codex 终端里打开 Claude Code 时）

"I highly recommend to just take everything that you do in your job or in your business and try and figure out how you can automate as much as you can." 我强烈建议：把你工作和生意里的每一件事都拿出来过一遍，看看哪些能自动化，能自动化多少就自动化多少。 —— Riley Brown, 1:42:30

"There's so much that you can do on these AI-powered super apps and they're only going to get better." 这些 AI 驱动的超级应用上能做的事情多得超出想象——而且只会越来越强。 —— Riley Brown, 1:42:55（视频结尾）

十一、术语表

Codex Super-App：OpenAI 2026 年 4 月推出的桌面 AI 工作台，区别于命令行 codex。
GPT-5.5：Codex 桌面端默认使用的 OpenAI 旗舰模型，需 ChatGPT 订阅。
Effort（推理强度） ：模型可调参数，分 Low/Medium/High/Extra High。Riley 默认 Extra High，质量最高但慢且贵。
Plugin：OpenAI 官方维护的能力扩展，对接第三方 SaaS（Figma/Calendar/Linear 等），一键安装。
Skill：用户/社区自创的工作流食谱，可以包装外部 API 让 agent 标准化调用。
Automation：定时执行的 chat，可引用 skill 和 plugin。
Computer Use：让 AI 直接操控你电脑的鼠标键盘，OpenAI 的实现是行业最强的之一。
MCP（Model Context Protocol） ：Anthropic 提出的开放协议，允许 AI 标准化连接外部工具。Codex 兼容 MCP server。
Steering vs Queueing：Codex 的两种新 prompt 提交方式——steering 是中途打断 agent 修正方向，queueing 是排队等当前任务完成。
Forking Chat：右键 chat 选 "Fork into Local"，复制当前对话的全部上下文创建新 chat 继续。
Project：绑定到本地某个文件夹的工作空间，所有产出落到该文件夹的 outputs/ 子目录。
Remotion：用 React 代码生成程序化视频的开源框架，Codex 提供 plugin 集成。
TestFlight：Apple 提供的 iOS app 内测分发渠道，开发者可以推送 app 给最多 1 万名内测用户，无需 App Store 审核。
Tally：在线表单工具，免费版支持基础的 lead capture，可生成 embed code 嵌入任意网页。
Supabase：开源的 Firebase 替代品，提供 Postgres 数据库 + 认证 + 实时同步，是当前 vibe coding 圈最常用的后端。
Vibe Coding：Riley 等人推广的术语，指完全用自然语言对话来"编程"，而不写一行代码。