AI资讯

9亿周活、奥斯卡新规、新模型静默上线——本周三件事

2026-05-16 · AI资讯

一、OpenAI：ChatGPT周活跃用户破9亿，Codex破400万

5月15日，OpenAI首席财务官Sarah Friar公布了一组数据：

ChatGPT周活跃用户超过9亿。

这个数字在年初是1亿多，不到半年涨了8倍。增长最猛的时间段就是最近两个月——Codex推出桌面端、Chrome插件、移动端适配，一连串更新把用户量直接拉上去了。

Codex的周活跃用户突破400万。 Codex是OpenAI面向程序员的AI工具，核心价值是"让AI帮你写代码并跑起来"。从今年2月推出macOS版，到5月接入手机App，只用了3个月。

这组数据背后有几个值得注意的点：

企业用户占比在快速提升。 OpenAI首席营收官透露，企业业务在总收入中的占比已经超过40%，而且还在涨。个人用户用ChatGPT聊天，企业用户用Codex写代码、用API做产品——后者的付费意愿强得多。

移动端是下一个战场。 Codex刚接入iOS和安卓的ChatGPT App，目前还是Preview状态。但方向已经很明确了：不只是坐在电脑前才能用AI写代码，手机上也能查看运行状态、下发新指令。

竞争压力是真实存在的。 Sarah Friar在发言中特意提到"相较年初增长8倍"，这个时间节点正好是Claude Code和Cursor快速起量的时候。OpenAI需要向市场证明：自己还是第一。

---

二、奥斯卡新规：AI演员不准参评，AI写的剧本没资格

5月1日，美国电影艺术与科学学院（也就是发奥斯卡奖的那个机构）发布了一项规定，直接影响下一届奥斯卡（第99届，2027年颁奖）：

参评表演类奖项的角色，必须由真人出演。AI生成的演员、AI换脸、AI"数字人"，都没资格参评。

参评剧本类奖项（最佳原创剧本/最佳改编剧本），剧本必须由人类撰写。用AI生成的剧本，直接取消资格。

这条新规的出台背景很具体：过去一年，AI生成视频的质量突飞猛进，已经到了"真假难辨"的程度。好莱坞有人在讨论：如果一部电影的主演是用AI生成的，或者剧本是AI写的，它还能不能参评奥斯卡？

学院的回应是：不能。

但新规并没有"禁止AI"——这是很多人误解的地方。学院说的是：参评奖项的人/剧本必须是人类创作的，但你拍电影的过程中可以用AI做辅助工具。 比如用AI做特效、用AI辅助剪辑、用AI生成概念图，这些都不影响参评资格。红线只有一条：最终呈现在奖项申请表上的那个"主要创作者"，必须是人。

对国内做AI视频的团队来说，这条新规的直接影响有限——奥斯卡本身主要面向英语电影。但它释放了一个信号：主流文化机构正在划清"人类创作"和"AI辅助"的边界。 这个边界在未来几年只会越来越清晰，不会越来越模糊。

---

三、DeepSeek新模型静默发布：没开发布会，直接推给用户

5月10日前后，DeepSeek在没有预告、没有发布公告的情况下，向部分用户推送了新模型的访问权限。

目前关于这个新模型的信息还很有限，可以确定的是：

- 上下文长度扩展到1M tokens（也就是一次能处理约75万字的中文内容）

- 支持上传多种格式文件（PDF、Word、Excel等）

- 逻辑推理、数学和代码能力相比V3有提升

为什么"静默发布"？一种合理的猜测是：DeepSeek在V3发布时引起了太大轰动（导致英伟达股价暴跌、美国政府关注），这次选择低调推进，先让用户自然发现，再逐步扩大覆盖范围。

另一个值得注意的细节：这次更新是"推送到App"，而不是开源权重。DeepSeek起家靠的是开源，但最近几次更新（包括这次）都先在闭源产品中测试，效果稳定后再考虑开源。这个变化值得持续观察。

---

本周Skills榜单

排名	项目	星数	说明
1	NousResearch/hermes-agent	123,517	自适应Agent框架
2	microsoft/markitdown	118,449	任意文件转Markdown
3	forrestchang/andrej-karpathy-skills	97,537	Claude Code配置，修编程老毛病

---

榜单第2名详解：microsoft/markitdown——把任意文件转成Markdown的万能工具

先说一个场景：你有个PDF文件，想把它丢给AI大模型处理。直接把PDF传上去行不行？行，但效果通常不好——PDF里的表格会变成乱码，图片里的文字读不出来，排版格式全丢。

更好的做法是：先把PDF转成Markdown，再给AI处理。 Markdown是纯文本格式，但保留了标题、表格、代码块等结构信息，AI读起来比原始PDF准确得多。

markitdown就是干这件事的工具。它把PDF、Word、Excel、PowerPoint、图片、音频——十几种类文件，统一转成Markdown格式。

怎么用？

安装只需要一行：


pip install markitdown


基础用法也是一行：

`python


from markitdown import MarkItDown
markitdown = MarkItDown()
result = markitdown.convert("你的文件.pdf")
print(result.text_content)

result.text_content就是转换后的Markdown文本，直接拿到字符串，想怎么处理就怎么处理。


支持哪些格式？

格式 说明
PDF (.pdf) 提取文字和表格，保留基本结构
Word (.docx) 完整保留标题、段落、表格、图片引用
Excel (.xlsx) 每个sheet转成Markdown表格
PowerPoint (.pptx) 每页转成一段Markdown，保留标题和正文
图片 (.jpg/.png等) 调用OCR或AI视觉模型，把图片里的文字提取出来
音频 (.mp3/.wav等) 转写成文字稿
HTML 去掉标签，保留正文内容
CSV / JSON / XML 结构化文本，直接转成代码块或表格

有什么坑？
坑1：PDF转换效果取决于PDF本身。
如果PDF是从网页打印出来的（也就是"原生PDF"），文字是可以直接提取的，转换效果好。如果PDF是扫描件（图片格式），markitdown会调用OCR来识别文字——这时候准确率就取决于图片清晰度和OCR引擎质量了。如果你的PDF是扫描件，转换前先用工具（比如Adobe Acrobat）做一次"识别文字"，比直接丢给markitdown效果好。
坑2：音频转写需要额外配置。

markitdown支持音频转写，但默认不自带语音识别模型。它需要你配置一个ASR（自动语音识别）后端，比如OpenAI的Whisper，或者调用云端API。如果你只是本地用，没配置ASR，音频文件转换会报错或者返回空结果。解决方法：装一下openai-whisper（pip install openai-whisper`），markitdown会自动检测到并使用它。

坑3：大文件会慢，而且可能内存溢出。

一个200页的PDF，转换时markitdown会把整个文件加载到内存里处理。如果文件特别大（几百页，或者里面有大量高清图片），可能会吃光内存。解决方法：把大文件拆成小文件再转换，或者调小并发参数（如果批量处理的话）。

坑4：Excel转Markdown，合并单元格会丢失。

markitdown把Excel转成Markdown表格时，合并单元格会被拆开，每个格子单独成一格。这在技术上很难完美处理（Markdown原生不支持合并单元格）。如果你的Excel里有很多合并单元格，转换后需要人工核对一下表格结构。

和同类工具比，它好在哪？

这类工具其实不少，为什么markitdown值得专门写一篇？

第一，它是微软官方维护的。 不会突然停更，不会哪天作者把仓库删了。对企业用户来说，这一点很重要。

第二，它支持格式最全。 很多类似工具只支持PDF转Markdown，或者只支持Office文档。markitdown一口气覆盖了十几格式，而且还在持续加新格式。

第三，它可以接AI模型。 处理图片时，可以配置OpenAI或其他视觉模型，让AI"看懂"图片内容并描述出来，写进Markdown里。这个能力在做图文混排的文档处理时非常实用。

项目地址：https://github.com/microsoft/markitdown

← ComfyUI … ComfyUI … →

9亿周活、奥斯卡新规、新模型静默上线——本周三件事

一、OpenAI：ChatGPT周活跃用户破9亿，Codex破400万

二、奥斯卡新规：AI演员不准参评，AI写的剧本没资格

三、DeepSeek新模型静默发布：没开发布会，直接推给用户

本周Skills榜单

榜单第2名详解：microsoft/markitdown——把任意文件转成Markdown的万能工具

怎么用？

支持哪些格式？

有什么坑？

和同类工具比，它好在哪？

评论区

发表评论取消回复

格式	说明
PDF (.pdf)	提取文字和表格，保留基本结构
Word (.docx)	完整保留标题、段落、表格、图片引用
Excel (.xlsx)	每个sheet转成Markdown表格
PowerPoint (.pptx)	每页转成一段Markdown，保留标题和正文
图片 (.jpg/.png等)	调用OCR或AI视觉模型，把图片里的文字提取出来
音频 (.mp3/.wav等)	转写成文字稿
HTML	去掉标签，保留正文内容
CSV / JSON / XML	结构化文本，直接转成代码块或表格

欢迎回来

创建账号

9亿周活、奥斯卡新规、新模型静默上线——本周三件事

一、OpenAI：ChatGPT周活跃用户破9亿，Codex破400万

二、奥斯卡新规：AI演员不准参评，AI写的剧本没资格

三、DeepSeek新模型静默发布：没开发布会，直接推给用户

本周Skills榜单

榜单第2名详解：microsoft/markitdown——把任意文件转成Markdown的万能工具

怎么用？

支持哪些格式？

有什么坑？

和同类工具比，它好在哪？

评论区

发表评论 取消回复

发表评论取消回复