欢迎回来

登录 EAKE AI,继续您的智能之旅

忘记密码?
还没有账号?立即注册

今日 AI 速递 – OpenAI Codex 大升级、Claude Design 发布

2026-04-20 · AI资讯
AI Technology 2026年4月19日 · 星期日

? 今日 AI 圈重要资讯

重磅

OpenAI Codex 大升级:能操控你电脑上的所有应用

OpenAI 宣布对其 Codex 桌面应用进行重大更新,使其能够访问用户计算机上的所有其他应用程序。Codex 现在可以"看见、点击和输入"到任何应用中,甚至在 Mac 上可以在后台同时运行多个任务。此次更新还包括内置浏览器和与 gpt-image-1.5 的集成,允许用户生成图像并预览网页。OpenAI 确认 Codex 周活开发者已达 300 万。

最引人注目的是"Computer Use"功能,它允许 Codex 在后台操作应用,用户可以同时手动使用电脑。这意味着开发者可以让 Codex 测试前端更改或处理 JIRA 工单,而自己继续在其他应用中工作。

参考来源:VentureBeat 新品

Anthropic 推出 Claude Design:AI 驱动的视觉设计工具

Anthropic 发布全新产品 Claude Design,由最新模型 Opus 4.7 驱动。该工具允许用户与 Claude 协作创建精美的视觉作品,包括设计稿、原型、演示文稿、单页宣传材料等。目前处于研究预览阶段,仅向付费订阅者开放。

Claude Design 的推出标志着 Anthropic 从纯文本对话向多模态创意工具的扩展,与 OpenAI 的图像生成能力形成直接竞争。

参考来源:Anthropic 官方博客 / The Verge 行业

Google 与五角大楼洽谈机密级 AI 合作

据 The Information 报道,Google 正在与五角大楼洽谈,允许军方在机密环境中使用 Gemini AI。这标志着 Google 在军事合作方面的态度转变。此前 Google 与国防部的合同仅允许在非机密环境中使用 Gemini。

值得注意的是,合同条款似乎与 OpenAI 早些时候与五角大楼达成的协议类似,都包含"用于所有合法目的"的表述。专家指出,这种措辞虽然看似排除了完全自主致命武器和大规模国内监控,但可能无法真正阻止这些应用。

参考来源:The Verge / The Information

? GitHub Trending AI 项目 TOP 10

1 microsoft/TypeAgent 微软开源的 AI Agent 框架,支持自然语言与代码交互 2 getzep/graphiti 为 AI Agent 构建的知识图谱库,支持动态更新 3 patchy631/ai-engineering-hub AI 工程实践教程集合,涵盖 RAG、Agent 等热门技术 4 browser-use/browser-use 让 AI 控制浏览器的开源工具,支持自动化网页操作 5 kamranahmedse/developer-roadmap 开发者学习路线图,新增 AI/ML 工程师路径 6 n8n-io/n8n 工作流自动化工具,新增大量 AI 节点集成 7 langgenius/dify 开源 LLM 应用开发平台,支持工作流编排 8 mendableai/firecrawl 将网站转换为 LLM 可用数据的爬虫工具 9 comfyanonymous/ComfyUI 基于节点的 Stable Diffusion GUI,AI 绘画必备 10 microsoft/generative-ai-for-beginners 微软生成式 AI 入门课程,18 节课免费学习

⭐ 本日最值得关注项目

? browser-use/browser-use

让 AI 像人类一样使用浏览器

browser-use 是一个开源项目,它让 AI Agent 能够控制浏览器完成各种任务。与简单的网页爬虫不同,它可以像真实用户一样点击按钮、填写表单、滚动页面,甚至处理复杂的 JavaScript 交互。

这个项目与 OpenAI 最新发布的 Codex "Computer Use" 功能有异曲同工之妙,但它是完全开源的,支持多种 LLM 后端。对于想要构建能够自主浏览网页、收集信息、执行任务的 AI Agent 的开发者来说,这是一个非常有价值的工具。

GitHub 地址:https://github.com/browser-use/browser-use

? 一句话洞察

AI Agent 正在从"聊天工具"进化为"数字员工"。无论是 OpenAI 的 Codex Computer Use、Anthropic 的 Claude Cowork,还是开源的 browser-use,都在做同一件事:让 AI 能够真正操作工具、完成任务。2026 年,我们可能会看到更多"AI 员工"进入实际工作流程。

? 数字彩云 · 每日 AI 资讯速递

内容整理于 2026-04-19 · 信息来源:TechCrunch、The Verge、VentureBeat、Anthropic、OpenAI 官方

评论区

发表评论