微软研究院AI Frontiers实验室发布Fara1.5系列模型,专为浏览器自动化场景设计,有4B、9B、27B三个版本。在WebArena和OSWorld评测中,Fara1.5任务成功率达72%,超越OpenAI Operator。浏览器自动化是Agent落地的第一个"真实场景",微软这次跑在了前面。
Anthropic披露Project Glasswing项目上线1个月战报:携手约50家合作伙伴,在关键软件中挖掘出超过1万个高危(High)和关键(Critical)级别漏洞。用Claude做代码安全审计,这个方向正在快速成熟。
OpenAI宣布ChatGPT解锁新技能:用户上传表单后,可直接用语音或文字说明填写内容,系统识别表单字段并自动补全。报销单、申请表、调查问卷——填表是办公室最枯燥的重复劳动之一,AI终于来解放你了。
Anthropic正在扩招年薪32~40万美元的写作岗位,目的是强化品牌叙事和市场沟通。这件事透露出一个信号:AI公司的竞争,已经从技术能力延伸到"谁能把故事讲清楚"。会做模型和会讲产品,是两件事。
星巴克已停止在北美门店使用AI库存工具,上线约9个月后宣告失败。核心问题:AI系统分不清燕麦奶和牛奶的库存差异,导致补货决策频繁出错。AI落地最大的坑,往往在"看起来很简单"的场景里。
美国佐治亚州摩根县居民称,Meta数据中心开工后当地饮用水变浑浊,部分家庭不得不搬运外部水源用于做饭和洗澡。每一轮AI对话的背后,都有几百毫升水在流失。算力≠免费午餐。
渣打银行CEO比尔·温特斯就其"AI替代低价值人力"的表态向员工致歉,但裁员计划未改。AI替代人类这件事,说出口和做出口是两回事。渣打这次翻车,给其他大公司提了个醒。
| 排名 | 项目 | 星标 | 简介 |
|---|---|---|---|
| 🥇 1 | Agent Skills | 23K+ | 面向生产环境的AI编码工程技能库 |
| 🥈 2 | oh-my-codex (OmX) | 18K+ | Codex工作流增强层 |
| 🥉 3 | Hello-Agents | 15K+ | 从零构建智能体完整教程 |
| 4 | Fara-Agent | 13K+ | 微软Fara浏览器智能体工具包 |
| 5 | Glasswing-Tools | 11K+ | Anthropic安全审计AI工具集 |
数据来源:GitHub Trending(2026年5月第4周)
Agent Skills星标突破2.3万,连续五周霸榜。今天从生产环境Code Review的角度继续聊它。
审查员水平参差不齐,资深工程师时间有限;重复性错误(格式、命名、基础安全)占用了大量审查时间。AI做第一轮审查、人类做第二轮决策,这个分工正在成为越来越多团队的实际选择。
关键在于"技能的可复用性和可进化性"。直接用Claude做Code Review,每次都要写Prompt,效果不稳定。Agent Skills把"怎么做Code Review"编码成了可版本管理的技能包,团队成员共享同一套标准,且技能包可以随着团队经验不断迭代升级。
🔗 项目地址:github.com/anthropics/agent-skills
评论区