Codex上手机、长时程Agent元年、一人公司大爆发

2026-05-17 · AI资讯

一、Codex正式上手机，OpenAI补齐最后一块拼图

5月15日，OpenAI一连宣布了Codex的三项更新：

移动端上线。 Codex以Preview形式接入iOS和安卓版ChatGPT App。你可以在手机上查看Codex的运行状态、下发新指令、随时接管任务。OpenAI的说法是"不仅是远程操控单一任务、向电脑下发新指令那么简单"，可以做到"多端协同"——在电脑上跑着的任务，手机上看进度；手机上发一条指令，电脑上自动执行。 Hooks正式GA（Generally Available）。 Hooks是Codex的"钩子"机制——你设定规则，Codex在执行任务时自动触发检查。比如扫描提示词里的敏感信息、验证输出结果的正确性、记录对话历史、定制Codex在特定项目中的行为。之前Hooks是内测功能，现在所有用户都可以用了。 周活跃用户突破400万。 OpenAI CFO Sarah Friar同时公布了数据：ChatGPT周活跃用户超9亿，Codex周活400万。从年初的几十万涨到现在的400万，只用了不到半年。

把这三件事放在一起看，OpenAI的策略很清楚：桌面端（macOS + Windows）、浏览器（Chrome扩展）、手机端（iOS + 安卓），三个入口全占满，让别人无路可走。

但有个细节值得注意：移动端目前还是Preview，功能上不如桌面端完整。你现在能在手机上"看"Codex在干什么，但想在手机上"用"Codex写代码——体验还远不如桌面端。移动端的核心价值不是替代桌面，而是"口袋指挥部"——当你不在电脑前，想确认任务进度、加一条指令、或者看看报错情况，掏出手机就行。

二、长时程Agent元年：从智谱唐杰到红杉，业内形成共识

5月14日，智谱AI创始人兼首席科学家唐杰在X上发了一篇长帖，系统阐述了对AI发展趋势的判断。核心观点：2026年大模型的技术突破焦点，不再是"推理能力"，而是"长时程任务（Long-Horizon Tasks）"。

这不是他一个人的判断。今年1月，红杉资本就发文说过"长时程Agent实际上是通用人工智能（AGI），2026年将是它们的一年"。LangChain CEO Harrison Chase也明确提出"2026年是长时程Agents元年"。

那么，到底什么是"长时程任务"？

简单说，就是AI不再只处理你一句话就能说完的事，而是能连续工作几个小时甚至几天，完成一个复杂项目。 举个例子——

以前的AI：你问"帮我写一段Python代码"，它写完就结束了，整个过程几十秒。

长时程Agent：你告诉它"帮我开发一个网页版的待办事项应用，要有用户登录、任务列表、截止日期提醒"，然后AI自己规划步骤、写前端后端代码、调试、部署，中间如果报错自动修复，整个过程可能持续几个小时，你只需要偶尔看一眼进度。

目前OpenAI Codex和Claude Code都已经推出了支持长时程任务的功能。Codex的/Goal指令、Claude Code的Computer Use，本质上都是让AI在"环境"中长时间交互，而不是一问一答。Kimi K2.6模型也在发布会上演示过"连续编码12小时"的能力。

对普通人来说，这个趋势意味着什么？你的工作可能在更长的时间尺度上被AI替代。 以前AI只能替代"单个任务"，现在开始替代"整个工作流程"。

三、一人公司大爆发：90后、00后靠AI"单人成军"

今年3月，国家市场监督管理总局课题组发布了《中国OPC发展调研报告2026》。OPC（One Person Company，一人公司）的概念很简单：一个人借助AI工具，独立完成从产品设计到市场投放的全链路。

报告里的几个数据挺有意思：

- OPC在地域上集中于长三角、珠三角、京津冀，以及中西部新兴产业城市

- 创业者以90后、00后为主

- 行业分布呈现"轻资产、高智力、新业态"特征——翻译成人话就是，大部分是脑力活，不靠砸钱

这种模式的底层逻辑是：AI把很多"需要雇人做的事"变成了"自己就能做的事"。以前开一家设计公司，至少需要设计师、前端、市场三个人；现在一个人用AI生成设计稿、用AI写前端代码、用AI做营销内容——三个人的活，一个人干了。

2024年7月实施的新公司法也降低了注册门槛，让个人创办公司更便捷。

但说句实话：一人公司不等于"躺赚"。 AI让"做事"的门槛降低了，但"做什么事"的决策门槛没变。选错方向、选错赛道，AI帮不了你。另外，一人公司最大的风险不是技术问题，是孤独和缺乏反馈——没人给你纠错，没人跟你讨论。这些是AI目前还解决不了的问题。

本周Skills榜单

排名	项目	星数	说明
1	NousResearch/hermes-agent	123,517	开源自适应Agent框架
2	microsoft/markitdown	118,449	任意文件转Markdown
3	forrestchang/andrej-karpathy-skills	97,537	Claude Code开发配置集

榜单第1名详解：NousResearch/hermes-agent——开源Agent的"自来水厂"

先搞清楚一件事：hermes-agent到底是什么。

简单说，它是一个开源的Agent框架，让你能自己搭建一个像Claude Code或Codex那样的AI助手。不是聊天机器人，不是API包装，而是一个能自主操作的Agent。

它的核心设计思路是"自适应"——你不需要给Agent写好每一步该干什么，Agent自己能拆解任务、选择工具、执行并纠正错误。

为什么需要它？

现在的AI Agent格局是：Google有Gemini Agent，Anthropic有Claude Code，OpenAI有Codex。这三家都是闭源的——你用是能用，但看不到底层怎么运作的，也不能根据自己的需求深度定制。

hermes-agent的价值在于：它是完全开源的，你可以把它部署在任何服务器上，用自己的模型，接自己的工具，建自己专用的Agent。 对企业和有隐私需求的组织来说，这一点很关键。

怎么用？

安装依赖：

pip install hermes-agent

最基础的用法：

from hermes_agent import Agent

agent = Agent(
model="gpt-4",  # 也可以用本地模型
tools=["search", "code_executor", "file_manager"]
)

result = agent.run("帮我分析这个文件夹里的所有CSV数据，找出异常值")

Agent会自动：识别你指的是哪个文件夹→遍历所有CSV文件→对每个文件做数据分析→标记异常值→输出一份报告。

它和Codex、Claude Code比，差在哪？

劣势很明显：

1. 开箱体验不如商业产品。 Codex你装好就能用，hermes-agent需要自己配模型、搭环境、调试。

2. 模型能力依赖底层LLM。 它自己不提供模型，你得接一个能打的LLM——如果接了个弱模型，Agent的表现就会很平庸。

3. 社区资源少。 Codex和Claude Code的教程、论坛、第三方集成已经铺开了，hermes-agent还处于早期。

优势也同样明显：

1. 完全私有化。 数据不出你的服务器，医疗、金融、政府这些对隐私要求高的行业特别喜欢这一点。

2. 自由定制工具。 Codex的工具是OpenAI写好的，你只能选要不要用；hermes-agent的工具你可以自己写，想怎么接就怎么接。

3. 不依赖单一厂商。 你对OpenAI或Anthropic的政策变化有顾虑？用hermes-agent + 本地开源模型，完全自主可控。

适合谁用？

- 企业级用户，需要私有化部署AI Agent

- 想做Agent研究的开发者

- 对数据隐私有严格要求的行业（医疗、金融、法律）

不适合谁？如果你只是想快速上手用AI写代码，Codex或Claude Code就够了，不用折腾hermes-agent。

项目地址：https://github.com/NousResearch/hermes-agent

← ComfyUI … ComfyUI … →

Codex上手机、长时程Agent元年、一人公司大爆发

一、Codex正式上手机，OpenAI补齐最后一块拼图

二、长时程Agent元年：从智谱唐杰到红杉，业内形成共识

三、一人公司大爆发：90后、00后靠AI"单人成军"

本周Skills榜单

榜单第1名详解：NousResearch/hermes-agent——开源Agent的"自来水厂"

为什么需要它？

怎么用？

它和Codex、Claude Code比，差在哪？

适合谁用？

评论区

发表评论取消回复

欢迎回来

创建账号

Codex上手机、长时程Agent元年、一人公司大爆发

一、Codex正式上手机，OpenAI补齐最后一块拼图

二、长时程Agent元年：从智谱唐杰到红杉，业内形成共识

三、一人公司大爆发：90后、00后靠AI"单人成军"

本周Skills榜单

榜单第1名详解：NousResearch/hermes-agent——开源Agent的"自来水厂"

为什么需要它？

怎么用？

它和Codex、Claude Code比，差在哪？

适合谁用？

评论区

发表评论 取消回复

发表评论取消回复