欢迎回来

登录 EAKE AI,继续您的智能之旅

忘记密码?
还没有账号?立即注册

Codex上手机、长时程Agent元年、一人公司大爆发

2026-05-17 · AI资讯
Cover

一、Codex正式上手机,OpenAI补齐最后一块拼图

5月15日,OpenAI一连宣布了Codex的三项更新:

移动端上线。 Codex以Preview形式接入iOS和安卓版ChatGPT App。你可以在手机上查看Codex的运行状态、下发新指令、随时接管任务。OpenAI的说法是"不仅是远程操控单一任务、向电脑下发新指令那么简单",可以做到"多端协同"——在电脑上跑着的任务,手机上看进度;手机上发一条指令,电脑上自动执行。 Hooks正式GA(Generally Available)。 Hooks是Codex的"钩子"机制——你设定规则,Codex在执行任务时自动触发检查。比如扫描提示词里的敏感信息、验证输出结果的正确性、记录对话历史、定制Codex在特定项目中的行为。之前Hooks是内测功能,现在所有用户都可以用了。 周活跃用户突破400万。 OpenAI CFO Sarah Friar同时公布了数据:ChatGPT周活跃用户超9亿,Codex周活400万。从年初的几十万涨到现在的400万,只用了不到半年。

把这三件事放在一起看,OpenAI的策略很清楚:桌面端(macOS + Windows)、浏览器(Chrome扩展)、手机端(iOS + 安卓),三个入口全占满,让别人无路可走。

但有个细节值得注意:移动端目前还是Preview,功能上不如桌面端完整。你现在能在手机上"看"Codex在干什么,但想在手机上"用"Codex写代码——体验还远不如桌面端。移动端的核心价值不是替代桌面,而是"口袋指挥部"——当你不在电脑前,想确认任务进度、加一条指令、或者看看报错情况,掏出手机就行。


二、长时程Agent元年:从智谱唐杰到红杉,业内形成共识

5月14日,智谱AI创始人兼首席科学家唐杰在X上发了一篇长帖,系统阐述了对AI发展趋势的判断。核心观点:2026年大模型的技术突破焦点,不再是"推理能力",而是"长时程任务(Long-Horizon Tasks)"。

这不是他一个人的判断。今年1月,红杉资本就发文说过"长时程Agent实际上是通用人工智能(AGI),2026年将是它们的一年"。LangChain CEO Harrison Chase也明确提出"2026年是长时程Agents元年"。

那么,到底什么是"长时程任务"?

简单说,就是AI不再只处理你一句话就能说完的事,而是能连续工作几个小时甚至几天,完成一个复杂项目。 举个例子——

以前的AI:你问"帮我写一段Python代码",它写完就结束了,整个过程几十秒。

长时程Agent:你告诉它"帮我开发一个网页版的待办事项应用,要有用户登录、任务列表、截止日期提醒",然后AI自己规划步骤、写前端后端代码、调试、部署,中间如果报错自动修复,整个过程可能持续几个小时,你只需要偶尔看一眼进度。

目前OpenAI Codex和Claude Code都已经推出了支持长时程任务的功能。Codex的/Goal指令、Claude Code的Computer Use,本质上都是让AI在"环境"中长时间交互,而不是一问一答。Kimi K2.6模型也在发布会上演示过"连续编码12小时"的能力。

对普通人来说,这个趋势意味着什么?你的工作可能在更长的时间尺度上被AI替代。 以前AI只能替代"单个任务",现在开始替代"整个工作流程"。


三、一人公司大爆发:90后、00后靠AI"单人成军"

今年3月,国家市场监督管理总局课题组发布了《中国OPC发展调研报告2026》。OPC(One Person Company,一人公司)的概念很简单:一个人借助AI工具,独立完成从产品设计到市场投放的全链路。

报告里的几个数据挺有意思:

- OPC在地域上集中于长三角、珠三角、京津冀,以及中西部新兴产业城市

- 创业者以90后、00后为主

- 行业分布呈现"轻资产、高智力、新业态"特征——翻译成人话就是,大部分是脑力活,不靠砸钱

这种模式的底层逻辑是:AI把很多"需要雇人做的事"变成了"自己就能做的事"。以前开一家设计公司,至少需要设计师、前端、市场三个人;现在一个人用AI生成设计稿、用AI写前端代码、用AI做营销内容——三个人的活,一个人干了。

2024年7月实施的新公司法也降低了注册门槛,让个人创办公司更便捷。

但说句实话:一人公司不等于"躺赚"。 AI让"做事"的门槛降低了,但"做什么事"的决策门槛没变。选错方向、选错赛道,AI帮不了你。另外,一人公司最大的风险不是技术问题,是孤独和缺乏反馈——没人给你纠错,没人跟你讨论。这些是AI目前还解决不了的问题。


本周Skills榜单

排名项目星数说明
1NousResearch/hermes-agent123,517开源自适应Agent框架
2microsoft/markitdown118,449任意文件转Markdown
3forrestchang/andrej-karpathy-skills97,537Claude Code开发配置集

榜单第1名详解:NousResearch/hermes-agent——开源Agent的"自来水厂"

先搞清楚一件事:hermes-agent到底是什么。

简单说,它是一个开源的Agent框架,让你能自己搭建一个像Claude Code或Codex那样的AI助手。不是聊天机器人,不是API包装,而是一个能自主操作的Agent。

它的核心设计思路是"自适应"——你不需要给Agent写好每一步该干什么,Agent自己能拆解任务、选择工具、执行并纠正错误。

为什么需要它?

现在的AI Agent格局是:Google有Gemini Agent,Anthropic有Claude Code,OpenAI有Codex。这三家都是闭源的——你用是能用,但看不到底层怎么运作的,也不能根据自己的需求深度定制。

hermes-agent的价值在于:它是完全开源的,你可以把它部署在任何服务器上,用自己的模型,接自己的工具,建自己专用的Agent。 对企业和有隐私需求的组织来说,这一点很关键。

怎么用?

安装依赖:

pip install hermes-agent

最基础的用法:

from hermes_agent import Agent

agent = Agent(
model="gpt-4",  # 也可以用本地模型
tools=["search", "code_executor", "file_manager"]
)

result = agent.run("帮我分析这个文件夹里的所有CSV数据,找出异常值")

Agent会自动:识别你指的是哪个文件夹→遍历所有CSV文件→对每个文件做数据分析→标记异常值→输出一份报告。

它和Codex、Claude Code比,差在哪?

劣势很明显:

1. 开箱体验不如商业产品。 Codex你装好就能用,hermes-agent需要自己配模型、搭环境、调试。

2. 模型能力依赖底层LLM。 它自己不提供模型,你得接一个能打的LLM——如果接了个弱模型,Agent的表现就会很平庸。

3. 社区资源少。 Codex和Claude Code的教程、论坛、第三方集成已经铺开了,hermes-agent还处于早期。

优势也同样明显:

1. 完全私有化。 数据不出你的服务器,医疗、金融、政府这些对隐私要求高的行业特别喜欢这一点。

2. 自由定制工具。 Codex的工具是OpenAI写好的,你只能选要不要用;hermes-agent的工具你可以自己写,想怎么接就怎么接。

3. 不依赖单一厂商。 你对OpenAI或Anthropic的政策变化有顾虑?用hermes-agent + 本地开源模型,完全自主可控。

适合谁用?

- 企业级用户,需要私有化部署AI Agent

- 想做Agent研究的开发者

- 对数据隐私有严格要求的行业(医疗、金融、法律)

不适合谁?如果你只是想快速上手用AI写代码,Codex或Claude Code就够了,不用折腾hermes-agent。

项目地址:https://github.com/NousResearch/hermes-agent

评论区

发表评论