OpenAI Codex 新手指南:6 个非程序员场景,从 Excel 到 Gmail 把 GPT 5.5 当员工用
How to Use ChatGPT Codex : Codex Tutorial for Beginners
本报告由 AI 深度分析生成,基于视频完整字幕。
导读
大多数人提到 Codex 时,第一反应是「OpenAI 的代码助手」——就像 Claude Code 之于 Anthropic。这是个被严重误读的产品定位。
TheAIGRID(一个独立 AI 工具分析频道)这期 16 分钟的实操教程,专门拆掉这个误解:Codex 真正的能力是「在你电脑上完成工作」,不是「写代码」。它能直接产出 Excel 表格、PowerPoint、Word 文档;能在指定文件夹里读现有文件并基于内容生成新文件;能接入 Gmail 帮你处理邮件;能定时自动跑任务;能定义"技能"让特定工作流可复用。
这意味着 Codex 是 OpenAI 对「Cursor / Claude Code 包围圈」的反击牌——不在程序员市场跟 Anthropic 死磕,而是直接打非程序员办公自动化。当你看完这 6 个实操场景,会理解为什么 Sam Altman 把 Codex 定位为"GPT 5.5 时代的旗舰应用"——它不是代码工具,它是 OpenAI 想把 ChatGPT 变成"AI 员工"的关键一步。
一句话核心论点:Codex 的真正价值不是写代码,是「让非程序员的日常工作(写 Excel、整理邮件、做 PPT、批量出图)从「我自己做」升级为「我指挥 AI 做」——这是 OpenAI 对 Anthropic 在程序员市场的「Claude Code 优势」的侧翼包抄;理解这一点决定你是把 Codex 当玩具还是当生产力杠杆。
核心观点速览
-
Codex 的真正定位是「能在你电脑上完成工作的 AI 队友」:不是聊天机器人也不是代码生成器,它能直接生成可双击打开的标准文件(Excel、Word、PowerPoint)并在你的本地文件夹里组织成项目。
-
5 月 1 日起 Codex 默认模型是 GPT 5.5:注意这个模型特别烧 credit——长任务可能消耗大量 token。新手必须先去设置里把模式从"coding"改成"everyday work",并在 reasoning level 上选 medium(标准任务)或 high(复杂任务)。
-
Projects(项目模式)是真正的 game changer:让 Codex 在指定文件夹里工作——它能读你已有的文件、基于这些文件生成新文件、把所有产出都放回同一个文件夹。这是 ChatGPT Web 版做不到的核心差异化。
-
三档权限设置决定 Codex 的"自主度":default permissions(每步确认)/ auto review(事后审查)/ full access(完全自主)。新手用 default、熟手用 full access——后者能让 Codex 像真员工一样独立干完一个项目,你来时只看结果。
-
插件机制让 Codex 接入外部 SaaS:本期演示了 Gmail 插件——Codex 接入后能读邮件、给出"哪些紧急 / 哪些待处理 / 哪些值得注意"的分类报告,甚至帮你起草回复直接保存到 Gmail 草稿箱。
-
Automations(定时自动化)+ Skills(可复用工作流)= 真正的 AI 员工:定时自动化让 Codex 每周一 9 点自动跑某项工作并发邮件;Skills 让"按 240 字符 + 90 IQ 普通话写 Twitter"这种风格规则一次定义、永久复用。这两个组合后,Codex 才真正变成「AI 员工」而不是「AI 助手」。
主体
一、设置:进 Codex 前必做的 3 个调整
视频开头 TheAIGRID 给了 3 个新手必做的设置调整。忽略它们 = 用错 Codex:
调整 1:从 "coding" 模式切到 "everyday work" 模式
File → Settings → 模式选择
默认: coding
应该改成: everyday work
为什么:coding 模式给的回答偏技术细节,everyday work 模式回答更直白、更针对非程序员。90% 的非程序员用户应该用后者。
调整 2:模型选 GPT 5.5 + reasoning level 选 medium 或 high
- 标准任务(写 Excel、整理文件、回邮件)→ medium
- 涉及代码的任务(建简单 Web App)→ high 或 extra high
核心洞察:reasoning level 越高 = 推理更精准 = 但 credit 消耗更快。新手最容易踩的坑就是默认 extra high 跑普通任务,结果一周用完一个月配额。用 medium 是最佳起点。
调整 3:建立用量监控习惯
Settings → Usage → 实时查看剩余 credit
特别提醒:GPT 5.5 当 agent 跑长任务时烧 credit 极快(视频原话:"will kind of burn through your credits if you're not careful")。养成每天看一次 usage 的习惯——这是 Codex 用户跟普通 ChatGPT 用户的最大区别(后者完全不用看)。
二、用法 1:让 Codex 直接生成可打开的 Excel / Word / PPT
这是 Codex 最反直觉的能力——它不返回"代码"或"文字答案",它返回真实的 .xlsx / .docx / .pptx 文件。
视频演示的具体例子:
"Create an Excel sheet based on revenues of 10K per month increasing by 5% per month and show me what 2027 and 2026 looks like. Expenses are $736 per month. This is a creator business." (创建一个 Excel 表,月收入 1 万、每月增长 5%,显示 2026 和 2027 数据,月支出 $736,这是个创作者业务。)
结果:
- Codex 工作了 3 分 46 秒
- 直接弹出 Excel 工作簿 → 包含收入、预期增长、支出、净利润、净利润率
- 自动覆盖了 2026 和 2027 两个时间区间
核心洞察:这跟 ChatGPT 复制粘贴 CSV 表格的体验完全不同——你拿到的是个可直接发给会计 / 同事的实际 Excel 文件,不是一段你还要手动转格式的文本。这个差异在职场实际工作流里是质变:从"AI 帮我想"升级到"AI 帮我交付"。
适用场景:
- 财务建模(创作者业务、初创公司估值、家庭预算)
- 项目管理(Gantt 表、人员配置)
- 数据整理(把混乱信息整理成结构化表格)
- 报告制作(PPT 提案、Word 文档草稿)
iterative editing(迭代编辑)的隐藏功能:点 expand panel → 直接对生成的 Excel 文件提建议 → "add a tab for 2028" → Codex 在原文件上加新标签页。这是「持续协作」而不是"一次性生成"——更像跟同事来回改文档。
三、用法 2:Projects 模式 — Codex 进你的文件夹工作
Projects 模式是 Codex 跟 ChatGPT Web 版最大的差异化。
操作流程:
- 创建新 Project
- 选定一个本地文件夹(视频里命名为 "Codex demo")
- 把要让 Codex 处理的文件放进文件夹(视频里放了 2 个文字 transcript)
- 给 Codex 提示:「summarize the two files inside the folder and then create a Word document on what they are」(总结文件夹里的两个文件并生成 Word 文档)
- 结果:Codex 工作 5 分钟 → 直接在原文件夹里生成 Word 总结文件
为什么这个能力革命性:
"This works for PowerPoint files, document files, and many different files that you would use on a day-to-day basis." (这适用于 PowerPoint、Word 等你日常使用的各种文件类型。)
核心洞察:ChatGPT Web 版需要你"复制粘贴文件内容"——Codex Projects 模式让你"把文件夹给它"。这个差异看起来微妙,实际改变了人机协作的物理形式——从"你伺候 AI"到"AI 在你的工作环境里干活"。
典型应用场景:
- 处理一批客户邮件(把邮件 .txt 放进去 → 生成回复 Word)
- 整理调研资料(把 PDF 摘要放进去 → 生成总结报告)
- 视频创作工作流(把字幕 .srt 放进去 → 生成短视频脚本)
- 学习笔记(把课程录音 transcript 放进去 → 生成结构化笔记)
四、用法 3:批量图片生成(Instagram Carousel)
视频演示的进阶用例:
"Create an Instagram carousel based on the GPT 5 workspace agent document and make four pictures." (基于 GPT 5 workspace agent 文档创建 Instagram 轮播 + 生成 4 张图。)
结果:
- 第一次:Codex 用 HTML 生成了 4 张基础风格的图(可用但简陋)
- 用户追加:"do it again, but with image generation instead"
- 第二次:Codex 用图像生成模型出了 4 张高质量营销图(5 分钟)
核心洞察:Codex 的"自我纠错"能力意外地好——你给一个反馈("换成图像生成")它能立刻调整生成路径。这种交互比传统 AI 工具的"重新提交完整 prompt"省力得多——更像跟设计师来回沟通。
实操扩展:同样的工作流可以用于:
- YouTube 缩略图(4 个不同方案对比)
- LinkedIn 帖子图(基于已有 Word 文档的核心观点出图)
- 微信公众号配图(一键 6 张配同一篇文章)
- 电商详情页(基于产品描述出多张视觉)
五、用法 4:Plugins 接入 Gmail
视频演示的接入流程:
Sidebar → Plugins → Gmail Plugin → Install
→ 跳转浏览器登录 Google 账号
→ 授权
→ 回到 Codex
→ Gmail 已连接
演示用法:
"What is the latest update with my late node workflow? @Gmail" (我的 LATE node 工作流最新更新是什么?@Gmail)
结果:
- Codex 自动读邮件
- 输出 3 类分类:urgent / needs attention soon / worth noting
- 直接告诉你哪几封邮件最重要
进阶用法:
"Generate draft replies for these emails. They will then actually be sitting in your Gmail." (为这些邮件起草回复,草稿会直接保存到你的 Gmail 草稿箱。)
核心洞察:这个能力的真正价值不是"AI 帮你回邮件",是「Codex 成为你的命令中心」——你可以让它先扫邮件、然后总结到 Word、再把总结做成 Instagram 海报,全程不需要切换不同工具。这种端到端工作流是 ChatGPT Web 版做不到的。
值得注意的隐私维度:Gmail 插件意味着 OpenAI 能读你所有邮件——对个人用户问题不大,对企业用户必须先评估合规性。
六、用法 5:Automations(定时自动化)
这是把 Codex 从"AI 助手"变成"AI 员工"的关键功能。
视频演示:
Sidebar → Automations → New Automation
→ 名称: "Marketing Email Automation"
→ 文件夹: Codex demo
→ 频率: Weekly (每周日 9:00 AM)
→ 任务: "Summarize the videos I worked on, then use @Gmail to send the summary"
结果:每周日上午 9 点,Codex 自动:
- 读 Codex demo 文件夹里的所有文件
- 总结当周做了哪些视频
- 通过 Gmail 把总结发到指定邮箱
核心洞察:Automations 把"我每周日花 1 小时写报告"自动化为"我每周日上午 9 点收到自动报告邮件"——这是真正的"AI 替代你做重复性工作"。
特别值得做 Automation 的场景:
- 每周财报总结(财务文件夹 → Excel 总结 → 邮件给 CEO)
- 每日 AI 行业新闻摘要(监控文件夹 → 总结 → 邮件给自己)
- 客户跟进提醒(CRM 导出 → 分析进度 → 邮件给销售团队)
- 周报自动生成(项目 GitHub commit + Notion → Word 周报 → 飞书发送)
警告:Automation 默认会持续消耗 credit——记得在 reasoning level 选 low 或 medium,不要默认 extra high,否则一周烧掉一个月配额。
七、用法 6:Skills(可复用工作流)—— 最被低估的功能
Skills 是 TheAIGRID 在视频结尾才介绍的,但它是这 6 个用法里最值得记住的。
Skills 的定义:
"A skill is essentially a reusable task-specific capability made from instructions or an optional script." (Skill 是一种可复用的、任务特定的能力,由一组指令或可选脚本构成。)
视频演示:
Sidebar → Plugins → Create → Create Skill
→ 名称: "Plain Twitter Post"
→ 描述: "Make Twitter posts only 240 characters long and always explain stuff in 90 IQ layman's terms."
之后的使用方式:
Prompt: "Create 10 tweets about the recent GPT-5.5 announcement and what it is. @Plain Twitter Post"
Codex 在 1 分 49 秒内生成 10 条符合 Skill 规则的推文(240 字符、平民化解释、无 jargon / hashtag / emoji)。
核心洞察:Skills 解决的是「重复性高质量产出」的问题——你不需要每次写 prompt 都重复"用平民化语言、240 字符内、不要 emoji",这些规则一次性定义好,永久绑定到 Skill 上。
Skills vs custom GPTs 的关键差异:
| custom GPTs | Skills |
|---|---|
| 独立的 chatbot 入口 | 在任何对话里 @调用 |
| 需要切换上下文 | 无缝集成 |
| 主要是 prompt template | 可以包含可执行 script |
| 通常需要手动测试 | 自动绑定到正确工作流 |
最值得创建的 Skills:
- 「品牌视觉风格」(每次出图都按这个调性)
- 「写邮件风格」(你的邮件签名 + 语气 + 长度规则)
- 「Excel 报告模板」(公司标准格式 + 公式)
- 「会议纪要格式」(标准 sections 和 bullet 风格)
核心规则:
"A skill is more than 'please behave this way'. It's more like 'when I ask for this type of job, follow this exact workflow.'" (Skill 不只是「请这样做」。它更像「当我提这类任务时,按这个精确工作流执行」。)
八、对中文读者的特别意义:Codex vs Claude Code vs DeepSeek 三家对比
如果你刚看了之前 Riley Brown / DeepSeek + Claude Code 那两篇报告,应该已经感受到 2026 年 4-5 月 AI 编码工具市场的激烈竞争。这里给一个简明对比:
| 维度 | OpenAI Codex | Claude Code | DeepSeek + Claude Code |
|---|---|---|---|
| 定位 | AI 队友(覆盖编程 + 办公) | AI 编程助手(程序员为主) | 便宜版 Claude Code(同生态) |
| 强项 | 文件操作 + Skills + Automations + Plugins | skills 生态深 + tool calling 精准 + Anthropic 模型品质 | 100 倍便宜 |
| 弱项 | 模型本质还是 GPT,深度推理偶有偏差 | 设计太程序员向 | 中国数据隐私 + UI 弱 |
| 适合 | 想从办公自动化切入 AI 的非程序员 | 全职开发者、追求最高代码品质 | 个人副业、原型项目、不敏感场景 |
| 价格门槛 | $20 ChatGPT Plus 起 | Claude Pro $20 起 | DeepSeek $2-5 充值 |
实操判断:
- 如果你不写代码、想用 AI 做办公自动化 → Codex(本期视频展示的 6 个场景就是你的入口)
- 如果你写代码、追求最高品质 → Claude Code(参考 Riley Brown 那期)
- 如果你写代码、想压成本 → DeepSeek + Claude Code 组合(参考 Jack Roberts 那期)
核心洞察:OpenAI 在 Codex 上的策略是「不跟 Anthropic 在程序员市场死磕,反而打非程序员办公自动化的侧翼」——这是一个非常聪明的产品定位。未来 6 个月,Codex 的真正对手不是 Claude Code,是微软 Copilot Studio + Notion AI + Lindy 等"AI 工作流"产品。
九、视频里没说但需要注意的几个坑
坑 1:Permission 模式选错代价大
视频提到 3 档权限:default / auto review / full access。新手最容易踩的坑是直接选 full access 让 Codex 完全自主,结果它在你电脑上做了你不想要的操作(删文件、改设置)。** 新手必用 default,逐步 build trust 后再升级**。
坑 2:Credit 消耗的非线性
GPT 5.5 在 agent 模式下烧 credit 比纯 chat 模式快5-10 倍。一个长任务(如本期视频里的 Excel 生成 3 分 46 秒)可能消耗你日常聊天 1 周的 token。预算意识必须建立——否则一周用完一个月配额是常态。
坑 3:插件的隐私边界
Gmail 插件、Google Drive 插件、Slack 插件——这些都意味着 OpenAI 能读你授权范围内的所有数据。对个人用户:评估具体哪些信息你不想让 OpenAI 看到。对企业用户:必须先过 IT / 安全部门,企业邮件接入风险极高。
坑 4:Skills 的"过度组合"陷阱
新手容易一口气建 10 个 Skills 然后忘了哪个是干嘛的。最佳实践:从 2-3 个高频 Skill 开始(例如"Twitter 风格"、"邮件签名风格"),测试 2 周后再扩展。
坑 5:Automation 的失控风险
定时自动化最大的风险是"我忘了它在跑"——某天 Codex 在凌晨 3 点跑了一个错误的 prompt 把客户邮件全标记成 urgent 发出去了。新手 Automation 一定要先短周期测试(每天跑 → 测一周 → 改成每周) 。
行动启示
Step 1(今天 30 分钟):装 Codex + 调三个设置
- 升级到 ChatGPT Plus($20/月)即可用 Codex
- 改设置:File → Settings → mode = everyday work
- 选模型 = GPT 5.5,reasoning level = medium
- 把 Settings → Usage 加到收藏
Step 2(本周):试 3 个用法
- 场景 1(5 分钟):让 Codex 生成你下个月的项目预算 Excel
- 场景 2(10 分钟):建一个 Project 文件夹,扔几个文档进去,让 Codex 总结成 Word
- 场景 3(15 分钟):装 Gmail 插件,让 Codex 给你做一份"今日邮件分类报告"
Step 3(本月):建立 1 个 Skill + 1 个 Automation
- Skill:你最高频的输出(例如「公众号文章风格」、「周报格式」),定义好风格规则
- Automation:你最不想做的重复性任务(每周三晚上 8 点自动整理订阅 RSS、每月 1 号自动统计上月支出),让 Codex 自动跑
Step 4(持续):每周看一次 Usage
养成"周日晚上看一次 credit 用量"的习惯。这是用 AI Agent vs 用普通 ChatGPT 最大的不同——前者需要预算管理,后者不需要。
最值得记住的元洞察:「AI 工具」从「我自己用」升级为「让它替我跑」需要 3 个能力——Projects(让它进你的文件夹)+ Plugins(让它接你的 SaaS)+ Automations(让它定时执行) 。这三个组合后,Codex 才真正变成"AI 员工"。未来 1-2 年的 AI 工具竞争,会从"哪个模型最聪明"转向"哪个工具最像员工"——而 Codex 在这个新赛道上目前领先。
附录
金句收录
"Don't view it as a coding assistant. View it as something that can get work done on your computer." 不要把它当编码助手。把它当成能在你电脑上完成工作的东西。 ——对 Codex 真正定位的核心解读
"Codex can essentially do things from plain English." Codex 本质上能基于普通英语完成事情。 ——非程序员入口的关键
"With higher levels of intelligence and reasoning come higher levels of cost." 更高的智能和推理水平意味着更高的成本。 ——Reasoning level 选择的真理
"This is much more useful than going back and forth between multiple different projects and files." 这比在多个项目和文件之间来回切换有用得多。 ——Projects 模式的工作流革命
"Codex can practically be your command center." Codex 实际上可以成为你的命令中心。 ——Plugins 接入后的最大价值
"A skill is more than 'please behave this way'. It's more like 'when I ask for this type of job, follow this exact workflow.'" Skill 不只是「请这样做」。它更像「当我提这类任务时,按这个精确工作流执行」。 ——Skills vs prompt template 的核心差异
术语表
- Codex:OpenAI 的 AI Agent 产品,基于 GPT 5.5。注意:早期 OpenAI 的 Codex 是个代码生成模型(2021 年),现在的 Codex 是个完整的 Agent 平台,含义已变。
- Projects:Codex 的核心功能——在指定本地文件夹里读写文件并执行任务。
- Plugins:Codex 接入外部 SaaS(Gmail、Drive、Slack 等)的接口。
- Skills:用户定义的可复用任务工作流。
- Automations:定时自动执行的任务。
- Permission Modes:default(每步确认)/ auto review(事后审查)/ full access(完全自主)。
- Reasoning Level:low / medium / high / extra high,影响推理质量和 credit 消耗。
- everyday work mode vs coding mode:Codex 的两种回答风格设置。
时间线索引
[00:00]开篇:Codex ≠ 代码助手,Codex = AI 队友[00:40]设置 1:mode 切到 everyday work[01:00]设置 2:reasoning level 选 medium 或 high[01:30]设置 3:Usage 监控习惯[02:04]用法 1 开始:直接生成 Excel[02:32]Excel 演示 prompt(创作者业务收入预测)[03:24]Permission 三档介绍[04:00]Excel 工作簿生成结果[04:30]iterative editing 演示[05:00]用法 2 开始:Projects 模式[05:30]创建 Codex demo 文件夹 + 加 2 个 transcript[06:00]让 Codex 总结文件夹文件并生成 Word[06:50]用法 3 开始:Instagram carousel 批量出图[07:30]HTML 版 vs 图像生成版对比[08:30]用法 4 开始:Plugins 接 Gmail[09:30]Gmail 插件登录授权流程[10:00]Gmail 邮件分类报告演示[10:30]用法 5 开始:Automations 介绍[11:30]创建 Marketing Automation 演示[12:00]Automation + Gmail 组合:每周自动发邮件[13:00]用法 6 开始:Skills 介绍[14:00]创建 Plain Twitter Post Skill 演示[14:50]Skills 应用:用 @调用风格生成 10 条推文[15:30]Skills vs custom GPTs 对比[16:00]收尾:Codex 不只是代码工具,是非程序员的 AI Agent
评论
还没有评论,来第一个留言吧 ✨