Uber在2026年仅四个月就用完全年AI预算。公司高管承认,难以将高昂的Claude Code使用量与用户可感知的实用功能提升直接关联——烧钱是真的,功能提升却说不清楚。目前Uber正通过缩减招聘来承担AI成本,但投入产出比的证明仍是难题。这不是Uber一家的问题,几乎所有大公司都在面临同样的"AI账本困惑"。
一项覆盖250万篇生物医学论文的核查显示:2023年至2026年初,伪造文献比例飙升超过12倍。其中综述类论文受影响最严重,部分综述的引用中有超过30%为虚构。更值得警惕的是,这个问题可能动摇临床诊疗指南的证据基础——医生参考的文献可能是AI编的。研究者认为,这与ChatGPT等大语言模型的普及密切相关。
AI辅助起诉工具让普通人绕过高昂律师费进入法院系统——这是好事。但《纽约时报》报道,这类工具也在制造新问题:法院被大量AI生成的低质量诉状淹没,法官和被告疲于应对。AI大幅降低了起诉的门槛,但也同时降低了起诉的质量。司法效率与司法质量的平衡,是接下来需要回答的问题。
The Verge报道,Anthropic正在与美国国防部就AI军事应用问题展开博弈。公司一方面在争取五角大楼的订单,另一方面公开表达对"自主战争"的高度警惕。Anthropic在内部设置了严格的AI使用红线,拒绝让人工智能独立做出"可能致命"的决策。但国防部的一些项目正在触碰这条红线。
环境活动家Erin Brockovich(电影《永不妥协》原型)制作了一张美国数据中心分布地图,记录居民对数据中心的投诉。地图揭示了AI基础设施扩张背后的真实冲突:在一些地方,数据中心被欢迎;在另一些地方,它们遭到推迟、抵制甚至放弃。AI的尽头不是算力,是水和电。
多名用户在Bluesky上报告:向谷歌搜索"2027是明年吗",AI Overviews有时会回答"2027是两年后"。这个问题并非新出现——当研究人员设法让AI Overviews出错时,它引用的是旧的Instagram和Reddit帖子,内容正是嘲笑同类错误答案。搜索巨头在AI Overview上的bug似乎成了互联网的一个长期笑话。
The Verge报道,部分Suno用户正在放弃真实乐器演奏,转而完全依赖AI生成音乐。这种现象引发了音乐界的广泛讨论:一边是AI降低了音乐创作门槛,让更多人能够表达自己;另一边是大量同质化、缺乏灵魂的AI音乐正在淹没平台。音乐的本质究竟是技术还是表达?
| 排名 | 项目 | 星标 | 简介 |
|---|---|---|---|
| 🥇 1 | Agent Skills | 23K+ | 面向生产环境的AI编码工程技能库 |
| 🥈 2 | oh-my-codex (OmX) | 18K+ | Codex工作流增强层 |
| 🥉 3 | Hello-Agents | 15K+ | 从零构建智能体完整教程 |
| 4 | Fara-Agent | 13K+ | 微软Fara浏览器智能体工具包 |
| 5 | Glasswing-Tools | 11K+ | Anthropic安全审计AI工具集 |
数据来源:GitHub Trending(2026年5月第4周)
Agent Skills连续六周霸榜。今天聊聊它如何在真实工程场景中落地。
传统的代码审查痛点在于:资深工程师的时间有限,而大量重复性错误占用了审查时间。Agent Skills提供的Code Review技能包,将审查分成两层:
某电商团队接入Agent Skills Code Review技能包后,工程师每日平均代码提交量提升了34%,而生产环境Bug率下降了41%。原因很简单:把大量重复性工作交给AI,人类工程师可以把精力放在真正需要思考的地方。
🔗 项目地址:github.com/anthropics/agent-skills
评论区