欢迎回来

登录 EAKE AI,继续您的智能之旅

忘记密码?
还没有账号?立即注册

9亿周活、奥斯卡新规、新模型静默上线——本周三件事

2026-05-16 · AI资讯

一、OpenAI:ChatGPT周活跃用户破9亿,Codex破400万

5月15日,OpenAI首席财务官Sarah Friar公布了一组数据:

ChatGPT周活跃用户超过9亿。

这个数字在年初是1亿多,不到半年涨了8倍。增长最猛的时间段就是最近两个月——Codex推出桌面端、Chrome插件、移动端适配,一连串更新把用户量直接拉上去了。

Codex的周活跃用户突破400万。 Codex是OpenAI面向程序员的AI工具,核心价值是"让AI帮你写代码并跑起来"。从今年2月推出macOS版,到5月接入手机App,只用了3个月。

这组数据背后有几个值得注意的点:

企业用户占比在快速提升。 OpenAI首席营收官透露,企业业务在总收入中的占比已经超过40%,而且还在涨。个人用户用ChatGPT聊天,企业用户用Codex写代码、用API做产品——后者的付费意愿强得多。

移动端是下一个战场。 Codex刚接入iOS和安卓的ChatGPT App,目前还是Preview状态。但方向已经很明确了:不只是坐在电脑前才能用AI写代码,手机上也能查看运行状态、下发新指令。

竞争压力是真实存在的。 Sarah Friar在发言中特意提到"相较年初增长8倍",这个时间节点正好是Claude Code和Cursor快速起量的时候。OpenAI需要向市场证明:自己还是第一。

---

二、奥斯卡新规:AI演员不准参评,AI写的剧本没资格

5月1日,美国电影艺术与科学学院(也就是发奥斯卡奖的那个机构)发布了一项规定,直接影响下一届奥斯卡(第99届,2027年颁奖):

参评表演类奖项的角色,必须由真人出演。AI生成的演员、AI换脸、AI"数字人",都没资格参评。

参评剧本类奖项(最佳原创剧本/最佳改编剧本),剧本必须由人类撰写。用AI生成的剧本,直接取消资格。

这条新规的出台背景很具体:过去一年,AI生成视频的质量突飞猛进,已经到了"真假难辨"的程度。好莱坞有人在讨论:如果一部电影的主演是用AI生成的,或者剧本是AI写的,它还能不能参评奥斯卡?

学院的回应是:不能。

但新规并没有"禁止AI"——这是很多人误解的地方。学院说的是:参评奖项的人/剧本必须是人类创作的,但你拍电影的过程中可以用AI做辅助工具。 比如用AI做特效、用AI辅助剪辑、用AI生成概念图,这些都不影响参评资格。红线只有一条:最终呈现在奖项申请表上的那个"主要创作者",必须是人。

对国内做AI视频的团队来说,这条新规的直接影响有限——奥斯卡本身主要面向英语电影。但它释放了一个信号:主流文化机构正在划清"人类创作"和"AI辅助"的边界。 这个边界在未来几年只会越来越清晰,不会越来越模糊。

---

三、DeepSeek新模型静默发布:没开发布会,直接推给用户

5月10日前后,DeepSeek在没有预告、没有发布公告的情况下,向部分用户推送了新模型的访问权限。

目前关于这个新模型的信息还很有限,可以确定的是:

- 上下文长度扩展到1M tokens(也就是一次能处理约75万字的中文内容)

- 支持上传多种格式文件(PDF、Word、Excel等)

- 逻辑推理、数学和代码能力相比V3有提升

为什么"静默发布"?一种合理的猜测是:DeepSeek在V3发布时引起了太大轰动(导致英伟达股价暴跌、美国政府关注),这次选择低调推进,先让用户自然发现,再逐步扩大覆盖范围。

另一个值得注意的细节:这次更新是"推送到App",而不是开源权重。DeepSeek起家靠的是开源,但最近几次更新(包括这次)都先在闭源产品中测试,效果稳定后再考虑开源。这个变化值得持续观察。

---

本周Skills榜单

排名项目星数说明
1NousResearch/hermes-agent123,517自适应Agent框架
2microsoft/markitdown118,449任意文件转Markdown
3forrestchang/andrej-karpathy-skills97,537Claude Code配置,修编程老毛病

---

榜单第2名详解:microsoft/markitdown——把任意文件转成Markdown的万能工具

先说一个场景:你有个PDF文件,想把它丢给AI大模型处理。直接把PDF传上去行不行?行,但效果通常不好——PDF里的表格会变成乱码,图片里的文字读不出来,排版格式全丢。

更好的做法是:先把PDF转成Markdown,再给AI处理。 Markdown是纯文本格式,但保留了标题、表格、代码块等结构信息,AI读起来比原始PDF准确得多。

markitdown就是干这件事的工具。它把PDF、Word、Excel、PowerPoint、图片、音频——十几种类文件,统一转成Markdown格式。

怎么用?

安装只需要一行:

``

pip install markitdown

`

基础用法也是一行:

`python

from markitdown import MarkItDown

markitdown = MarkItDown()

result = markitdown.convert("你的文件.pdf")

print(result.text_content)

`

result.text_content就是转换后的Markdown文本,直接拿到字符串,想怎么处理就怎么处理。

支持哪些格式?

格式说明
PDF (.pdf)提取文字和表格,保留基本结构
Word (.docx)完整保留标题、段落、表格、图片引用
Excel (.xlsx)每个sheet转成Markdown表格
PowerPoint (.pptx)每页转成一段Markdown,保留标题和正文
图片 (.jpg/.png等)调用OCR或AI视觉模型,把图片里的文字提取出来
音频 (.mp3/.wav等)转写成文字稿
HTML去掉标签,保留正文内容
CSV / JSON / XML结构化文本,直接转成代码块或表格

有什么坑?

坑1:PDF转换效果取决于PDF本身。

如果PDF是从网页打印出来的(也就是"原生PDF"),文字是可以直接提取的,转换效果好。如果PDF是扫描件(图片格式),markitdown会调用OCR来识别文字——这时候准确率就取决于图片清晰度和OCR引擎质量了。如果你的PDF是扫描件,转换前先用工具(比如Adobe Acrobat)做一次"识别文字",比直接丢给markitdown效果好。

坑2:音频转写需要额外配置。

markitdown支持音频转写,但默认不自带语音识别模型。它需要你配置一个ASR(自动语音识别)后端,比如OpenAI的Whisper,或者调用云端API。如果你只是本地用,没配置ASR,音频文件转换会报错或者返回空结果。 解决方法:装一下openai-whisper(pip install openai-whisper`),markitdown会自动检测到并使用它。

坑3:大文件会慢,而且可能内存溢出。

一个200页的PDF,转换时markitdown会把整个文件加载到内存里处理。如果文件特别大(几百页,或者里面有大量高清图片),可能会吃光内存。解决方法:把大文件拆成小文件再转换,或者调小并发参数(如果批量处理的话)。

坑4:Excel转Markdown,合并单元格会丢失。

markitdown把Excel转成Markdown表格时,合并单元格会被拆开,每个格子单独成一格。这在技术上很难完美处理(Markdown原生不支持合并单元格)。如果你的Excel里有很多合并单元格,转换后需要人工核对一下表格结构。

和同类工具比,它好在哪?

这类工具其实不少,为什么markitdown值得专门写一篇?

第一,它是微软官方维护的。 不会突然停更,不会哪天作者把仓库删了。对企业用户来说,这一点很重要。

第二,它支持格式最全。 很多类似工具只支持PDF转Markdown,或者只支持Office文档。markitdown一口气覆盖了十几格式,而且还在持续加新格式。

第三,它可以接AI模型。 处理图片时,可以配置OpenAI或其他视觉模型,让AI"看懂"图片内容并描述出来,写进Markdown里。这个能力在做图文混排的文档处理时非常实用。

项目地址:https://github.com/microsoft/markitdown

评论区

发表评论