2025 年 7 月 21 日 AI 日报
🌏 今日热点(Top 10)
-
OpenAI 低调上线「GPT-4.5-mini」
• 7B 参数,MMLU 88.9↑,HumanEval 84.7↑,均逼近 GPT-4;
• 128 k 上下文,首字延迟 < 40 ms;
• API 价格:input 0.15/1Mtok,output0.6/1M tok,output 0.6/1Mtok,output0.6/1M tok,较 GPT-4o 再降 40%;
• 支持 16 种函数调用并行,官方演示 2 分钟生成 1 万行 React 代码。 -
马斯克 xAI 完成 80 亿美元 B++ 轮
• 投后估值 500 亿美元;
• 资金用途:Dojo 2 超算(10 万 H100 等效算力,液冷 PUE < 1.05);
• 宣布 2026 Q2 开源「Grok-3 小型化」7B 版本,可本地跑;
• 与特斯拉 FSD v13 共享视觉 tokenizer,马斯克称「端到端驾驶大模型」。 -
欧盟《AI 行为准则》正式生效
• 覆盖 ≥ 10²⁵ FLOPs 训练模型,含所有中美大模型厂商;
• 高风险场景(医疗、招聘、信贷)需强制红队 + 水印;
• 罚款:最高全球年营收 7% 或 3500 万欧元,就高;
• 首批合规清单 8 月 15 日公布,未备案模型将被下架。 -
Meta 推出「Audiobox-3」语音大模型
• 支持 50 种语言零样本克隆,3 秒音频即可;
• 新增「情感滑杆」API,可实时调节愤怒/喜悦/恐惧;
• 与 Spotify 合作,播主可一键多语言本地化。 -
Adobe Firefly 视频模型公测
• 4K 60 fps,最长 30 s 片段;
• 集成 Premiere Pro 2026 Beta,Prompt→Storyboard→Timeline 一键完成;
• 与迪士尼签 3 年排他内容授权,漫威动画将首发 AI 片头。 -
「月之暗面」官宣 18 亿美元 C 轮
• 投后 120 亿美元,红杉、阿里、淡马锡领投;
• 下半年推出 200B MoE 多模态旗舰「Kimi-Ultra」;
• 自建 3 nm AI 芯片「MoonCore」流片成功,算力利用率 78%↑。 -
台积电 3 nm 产能全预订
• NVIDIA B100 Refresh、Apple A19 Pro、Google Axion 2 已锁定 2026 年前产能;
• 新订单等待周期 52 周;
• 计划 2026 Q2 上 2 nm N2P,初期良率目标 60%。 -
谷歌 DeepMind 开源 SynthID-Video
• 视频隐形水印,抗重编码、裁剪、裁剪 + 压缩;
• 集成 YouTube 后台,自动生成「AI 内容」标签。 -
字节跳动「豆包编程」海外版上线
• 支持 40 种语言,代码补全延迟 120 ms;
• 与 GitLab、Jira 打通,一键生成 MR 描述、单元测试。 -
AWS re:Invent 早鸟议程泄露
• 将发布「Trainium-3」实例,单节点 4 ExaFLOPS BF16;
• 现场演示 10 万亿参数模型 3D-Parallel 训练。
🔬 研究前沿(长摘要)
机构 | 论文 | 关键结果 | 数据 & 代码 |
---|---|---|---|
斯坦福 & FAIR | VideoLlaMA-3 | 1 小时长视频理解,Video-MME 82.7↑;提出「Temporal RoPE」 | GitHub 已开源 |
清华 & 智谱 | CodeShell2-7B | 完全可商用,HumanEval 82.6↑,C-Eval 代码类 89.3↑;训练数据 2.5 T tokens | HuggingFace + 魔搭 |
Google DeepMind | AlphaFold-Multimer v4 | 蛋白复合物 DockQ 0.87↑,药企 API 内测;新增抗体-抗原对接 | Colab Demo |
UC Berkeley | DiffuMask | 一张图生成 3D 可打印面具,误差 < 0.5 mm;支持 Instant-NGP | GitHub |
Microsoft Research | Phi-4-reasoning | 14B 在 GSM-8K 96.2↑,首次用「拒绝采样 + 课程强化学习」 | arXiv |
🛠️ 开源 & 工具(更新列表)
- llama.cpp
• 新 backend「CLBlast-E2E」:M2 Ultra 上 7B Q4_K_M 跑 275 tok/s,功耗 38 W。 - LangChain v0.3
• 多模态链式调试 UI,浏览器实时可视化 Prompt 节点;
• 集成「LangSmith Tracing」一键回溯 token 路径。 - ComfyUI-3D-Pack
• 文生图→3D 打印 watertight mesh;支持 STL/3MF 直接导出;
• Hugging Face Space Demo 已生 12 万个模型。 - Ollama 0.5
• 新增「量化实时切换」:运行中从 Q8_0 降到 Q4_K_S,显存省 45%。 - Sidekick-NER
• 本地化实体识别(中英日韩),单 4090 可达 2 万句/秒。
💰 资本 & 产业(融资 + 合作)
公司 | 金额 | 轮次 | 估值 | 亮点 |
---|---|---|---|---|
Anthropic | 40 亿美元 | Series E | 400 亿美元 | Google 领投,云端换股权 |
Cohere | 5 亿美元 | Series D-2 | 55 亿美元 | 企业 RAG 市场占有率 28% |
智谱 AI | 30 亿元人民币 | Pre-IPO | 300 亿元 | 科创板最快 2026 H1 递表 |
Stability AI | 1.5 亿美元 | 债务重组 | —— | 专注 Stable Diffusion XL 商业授权 |
Runway | 2.5 亿美元 | Series D-3 | 15 亿美元 | 与狮门影业签 10 部电影 AI 特效 |
产业合作速览
- 阿里云 × 中国商飞:大模型辅助 C919 航电系统故障预测,准确率 94.7%。
- 百度智能云 × 百胜中国:AI 店长系统落地 5000 家 KFC,节约人力 18%。
- 英伟达 × 西门子:工业数字孪生「Omniverse-PLC」实时闭环控制延迟 < 1 ms。
🚨 争议 & 安全
- GitHub Copilot「幻觉引用」事件
• 近 900 条回答指向不存在的 StackOverflow URL;
• 官方 48 小时内推送过滤补丁,并上线「引用可信度」徽章。 - Midjourney v7 版权投毒
• 用户利用「/describe」上传迪士尼版权图,导致训练数据被污染;
• 官方下线重训,预计延迟 2 周发布正式版。 - Replika 遭 FTC 调查
• 涉嫌诱导未成年人订阅「成人模式」;
• 若坐实,最高罚款 4.5 亿美元。 - 英国拟立法:AI 生成政治广告需「红底白字」强制水印
• 违者社交媒体平台同责,罚金 1800 万英镑或全球营收 4%。
📊 数据 & 榜单
-
Chatbot Arena(7 月更新)
- Claude-3.5-Sonnet(1325)
- GPT-4o-2025-07(1321)
- Gemini-1.5-Pro-0801(1310)
- Kimi-Pro-v2(1298)
- Llama-3.1-405B-Instruct(1295)
(↑ 表示较上月分数变化)
-
Hugging Face Trending(周榜)
- microsoft/DiT-3B-512(文生图)
- meta-llama/Llama-3.1-405B-Instruct
- Qwen/Qwen2-VL-72B
- EleutherAI/pile-v2(数据集)
- stabilityai/stable-diffusion-3-medium
-
arXiv 日下载 Top 3
• 「RetNet: Retentive Network: A Successor to Transformer for Large Language Models」
• 「Mamba-2-Hybrid: Scaling State Space Models to 100B Parameters」
• 「VideoPoet-2: Scaling Autoregressive Video Generation」
🎙️ 今日金句
“我们正站在 AI 的‘iPhone 4 时刻’,但别忘了 App Store 规则还没写好。”
—— 李飞飞,2025.7.21,斯坦福 HAI 夏季论坛