用了三个月 Codex,我不想回 Claude Code 了
之前的视频我聊了三个工具怎么选,一段时间过去了,我的看法变了。现在我强烈推荐 Codex 作为首选的 agent 应用。Codex 是 OpenAI 推出的官方 agent 应用,它的桌面 app 真的非常好用。原因有三点:
- 桌面 app 体验远超 Claude Code 和 Cursor
- GPT-5.4 之后的模型,在 agent 方面的能力已经追上 Claude,某些方面更强
- 对于中国用户更友好——付费门槛低、不封号、性价比极高
一、桌面 app 概览
Codex app 设计非常优雅,对于 agent 工作流理解非常深刻。
App 的中心区域是对话区,左侧是项目区,右侧可以预览。这个设计的好处在于,你可以更方便地管理你所有的项目和对话,也可以更方便地进行文件预览、git 版本控制、diff 预览等。Codex 甚至内置了命令行。
OpenAI 绝对意识到了 git 对于 AI 的重要性,是 AI 工作流核心的工具之一,所以 Codex app 一开始就内置了 git 的状态预览、worktree 功能等等。随着 app 的更新,这部分的 UI 和交互体验也一直在迭代,变得更丝滑,足以看出这部分功能的重要性。
我个人使用下来,这些功能能够有效地减少工作打断。
Yes,所有的这些功能你都可以通过命令行来完成,但相信我,这个 app 能够让这些体验变得更加丝滑,当你需要的时候你会发现它们正好就在那里。
自从今年 2 月开始,我就开始尝试使用 Codex app,在简单的使用之后,我就料定 OpenAI 这次做对了。经过几个月的迭代,Codex app 变得越来越好用,我现在对它的依赖程度已经超过了 Claude Code 和 Cursor。
Agent 这个概念是由 Anthropic 发扬光大的,Claude Code 也是非常革命性的工具,它坚持一个理念:bash is all you need。正因如此,Claude Code 也一直以命令行为核心。虽然 Claude 的桌面端也有 Code 的入口,但那个用户体验有点残废,功能和交互比起命令行差了一大截。
与此同时,OpenAI 的 Codex 却强力推进了一个桌面端的 app。
有趣的是,这个 app 本身是完全 vibe coding 出来的,所有的代码 100% 由 AI 编写。OpenAI 还发了一篇 blog 来分享其中的技术原理,这个概念最近挺火的,叫做 harness engineering。
这个 app 切中了很多 Claude Code 的痛点,在我看来,它比 Claude Code 对人类的交互更加友好。
这背后其实代表了两种设计哲学。Claude Code 更像是以 AI agent 为中心,而 Codex 则更强调人类与 AI 协同工作。
macOS app 最近还更新了 computer use,虽然只限于 Mac 系统,但原生无需配置就能操作所有电脑 app,比起配置龙虾方便了不少。
二、GPT 的模型能力
从 GPT-5.3-Codex 之后,我认为 GPT 系列模型写代码的水平就不亚于 Claude Opus 了,两者没有绝对的高低之分,但各自擅长的领域还是有明显区分。
Claude Opus 模型擅长探索、响应迅速及时,创意和发散性高于 GPT 系列。
GPT 系列的模型则能更忠实地执行用户的需求,写出来的代码 bug 更少,思考更加全面和谨慎。缺点是推理的时间明显比 Claude 更长。
GPT 模型从 5.3、5.4、5.5 在 agent 和写代码方面一直在稳步前进,每个版本我认为都有肉眼可见的提升。
反而是 Claude Opus 4.7 的更新让人毁誉参半,模型虽然在多模态推理方面有提升,但是价格提高、推理时间变长和语言组织能力的下降着实是体验下降。有很多用户反应,Opus 4.7 可能是蒸馏了 GPT,开始”接住”了,我觉得这个猜测不是空穴来风。
GPT Pro 模型
GPT-5 之后,Pro 用户一直有一个专属的 Pro 模型,这个模型目前只在网页上可用,它的特点就是:超级深度思考和干货能力。这个模型在数学和严谨的干活方面非常强,我能感觉到明显高于 Claude Opus。
唯一的缺点就是目前只能网页版,加每次思考时间特别长。
如果你的工作有大量数学推导,那么 Claude 几乎是不可用的,GPT 是你唯一的选择(Gemini 算半个)。Claude 代码写得好、工具调用得好,但是数学方面确实不太擅长,不能胜任任何严肃的数学工作,但 GPT 是真的可以。
我个人日常还在大量使用 Opus 4.6、4.7,因为我更喜欢 4.6 的文笔和 Opus 的交互体验,但 GPT/Codex 在我工作中的比例已经超过一半。
三、对中国用户更友好
这一点对于中国用户特别重要,因为一个东西你想用它,首先你得能有方法用得上。
Claude 的官方订阅在中国大陆门槛特别高。首先,动不动就封号。其次,对于付款方式筛选特别严格,远远高于 OpenAI 的审查。这个公司就是不想让你用。我之所以还捏着鼻子用,也只是因为它的 Opus 模型确实也还有其独到之处。
OpenAI 现在存在大量中转号和代充值付费,只要不是黑产搞的账号,OpenAI 一般不会去封禁。梯子也只需要选择提供服务的区域就能正常使用。可以说,解锁它的官方订阅的门槛属于较低的类型,和 Cursor 处于同一水平。
价格低廉,性价比极高
Codex 的订阅 plan 是目前市面上性价比最高的计划。$20 的 plan,可以说足够大部分人去完成自己的工作。换算成 API 计费,至少是几百刀的用量。
与之相比,Claude Code $20 的计划,你可能问一个问题就消耗 20% 的 5 小时额度,用量基本不能胜任严肃学习、工作。
最近 Anthropic 还灰测不给 $20 用户 Claude Code 的权限。
与此同时,Codex 还推出了 $100 的 Pro 订阅档位。如果你愿意花这个钱,你基本上可以站起来蹬自行车了,使劲蹬,随便你蹬。这个档位的用量,已经不是你随便聊天就能用完的了。你得研究和学习一些技巧,然后努力工作,才能消耗完这个额度。
如果你能有意义地消耗完一个 Pro 账号的额度,你绝对是一个 AI 专家了。
好了,今天这期视频就到这里。Agent 和模型的进化速度非常快,过一段时间我再来更新,看看这个排名有没有变化,拜拜。