当前位置: 首页 > news >正文

2025 年 7 月 21 日 AI 日报

🌏 今日热点(Top 10)

  1. OpenAI 低调上线「GPT-4.5-mini」
    • 7B 参数,MMLU 88.9↑,HumanEval 84.7↑,均逼近 GPT-4;
    • 128 k 上下文,首字延迟 < 40 ms;
    • API 价格:input 0.15/1Mtok,output0.6/1M tok,output 0.6/1Mtokoutput0.6/1M tok,较 GPT-4o 再降 40%;
    • 支持 16 种函数调用并行,官方演示 2 分钟生成 1 万行 React 代码。

  2. 马斯克 xAI 完成 80 亿美元 B++ 轮
    • 投后估值 500 亿美元;
    • 资金用途:Dojo 2 超算(10 万 H100 等效算力,液冷 PUE < 1.05);
    • 宣布 2026 Q2 开源「Grok-3 小型化」7B 版本,可本地跑;
    • 与特斯拉 FSD v13 共享视觉 tokenizer,马斯克称「端到端驾驶大模型」。

  3. 欧盟《AI 行为准则》正式生效
    • 覆盖 ≥ 10²⁵ FLOPs 训练模型,含所有中美大模型厂商;
    • 高风险场景(医疗、招聘、信贷)需强制红队 + 水印;
    • 罚款:最高全球年营收 7% 或 3500 万欧元,就高;
    • 首批合规清单 8 月 15 日公布,未备案模型将被下架。

  4. Meta 推出「Audiobox-3」语音大模型
    • 支持 50 种语言零样本克隆,3 秒音频即可;
    • 新增「情感滑杆」API,可实时调节愤怒/喜悦/恐惧;
    • 与 Spotify 合作,播主可一键多语言本地化。

  5. Adobe Firefly 视频模型公测
    • 4K 60 fps,最长 30 s 片段;
    • 集成 Premiere Pro 2026 Beta,Prompt→Storyboard→Timeline 一键完成;
    • 与迪士尼签 3 年排他内容授权,漫威动画将首发 AI 片头。

  6. 「月之暗面」官宣 18 亿美元 C 轮
    • 投后 120 亿美元,红杉、阿里、淡马锡领投;
    • 下半年推出 200B MoE 多模态旗舰「Kimi-Ultra」;
    • 自建 3 nm AI 芯片「MoonCore」流片成功,算力利用率 78%↑。

  7. 台积电 3 nm 产能全预订
    • NVIDIA B100 Refresh、Apple A19 Pro、Google Axion 2 已锁定 2026 年前产能;
    • 新订单等待周期 52 周;
    • 计划 2026 Q2 上 2 nm N2P,初期良率目标 60%。

  8. 谷歌 DeepMind 开源 SynthID-Video
    • 视频隐形水印,抗重编码、裁剪、裁剪 + 压缩;
    • 集成 YouTube 后台,自动生成「AI 内容」标签。

  9. 字节跳动「豆包编程」海外版上线
    • 支持 40 种语言,代码补全延迟 120 ms;
    • 与 GitLab、Jira 打通,一键生成 MR 描述、单元测试。

  10. AWS re:Invent 早鸟议程泄露
    • 将发布「Trainium-3」实例,单节点 4 ExaFLOPS BF16;
    • 现场演示 10 万亿参数模型 3D-Parallel 训练。


🔬 研究前沿(长摘要)

机构论文关键结果数据 & 代码
斯坦福 & FAIRVideoLlaMA-31 小时长视频理解,Video-MME 82.7↑;提出「Temporal RoPE」GitHub 已开源
清华 & 智谱CodeShell2-7B完全可商用,HumanEval 82.6↑,C-Eval 代码类 89.3↑;训练数据 2.5 T tokensHuggingFace + 魔搭
Google DeepMindAlphaFold-Multimer v4蛋白复合物 DockQ 0.87↑,药企 API 内测;新增抗体-抗原对接Colab Demo
UC BerkeleyDiffuMask一张图生成 3D 可打印面具,误差 < 0.5 mm;支持 Instant-NGPGitHub
Microsoft ResearchPhi-4-reasoning14B 在 GSM-8K 96.2↑,首次用「拒绝采样 + 课程强化学习」arXiv

🛠️ 开源 & 工具(更新列表)

  • llama.cpp
    • 新 backend「CLBlast-E2E」:M2 Ultra 上 7B Q4_K_M 跑 275 tok/s,功耗 38 W。
  • LangChain v0.3
    • 多模态链式调试 UI,浏览器实时可视化 Prompt 节点;
    • 集成「LangSmith Tracing」一键回溯 token 路径。
  • ComfyUI-3D-Pack
    • 文生图→3D 打印 watertight mesh;支持 STL/3MF 直接导出;
    • Hugging Face Space Demo 已生 12 万个模型。
  • Ollama 0.5
    • 新增「量化实时切换」:运行中从 Q8_0 降到 Q4_K_S,显存省 45%。
  • Sidekick-NER
    • 本地化实体识别(中英日韩),单 4090 可达 2 万句/秒。

💰 资本 & 产业(融资 + 合作)

公司金额轮次估值亮点
Anthropic40 亿美元Series E400 亿美元Google 领投,云端换股权
Cohere5 亿美元Series D-255 亿美元企业 RAG 市场占有率 28%
智谱 AI30 亿元人民币Pre-IPO300 亿元科创板最快 2026 H1 递表
Stability AI1.5 亿美元债务重组——专注 Stable Diffusion XL 商业授权
Runway2.5 亿美元Series D-315 亿美元与狮门影业签 10 部电影 AI 特效

产业合作速览

  • 阿里云 × 中国商飞:大模型辅助 C919 航电系统故障预测,准确率 94.7%。
  • 百度智能云 × 百胜中国:AI 店长系统落地 5000 家 KFC,节约人力 18%。
  • 英伟达 × 西门子:工业数字孪生「Omniverse-PLC」实时闭环控制延迟 < 1 ms。

🚨 争议 & 安全

  • GitHub Copilot「幻觉引用」事件
    • 近 900 条回答指向不存在的 StackOverflow URL;
    • 官方 48 小时内推送过滤补丁,并上线「引用可信度」徽章。
  • Midjourney v7 版权投毒
    • 用户利用「/describe」上传迪士尼版权图,导致训练数据被污染;
    • 官方下线重训,预计延迟 2 周发布正式版。
  • Replika 遭 FTC 调查
    • 涉嫌诱导未成年人订阅「成人模式」;
    • 若坐实,最高罚款 4.5 亿美元。
  • 英国拟立法:AI 生成政治广告需「红底白字」强制水印
    • 违者社交媒体平台同责,罚金 1800 万英镑或全球营收 4%。

📊 数据 & 榜单

  • Chatbot Arena(7 月更新)

    1. Claude-3.5-Sonnet(1325)
    2. GPT-4o-2025-07(1321)
    3. Gemini-1.5-Pro-0801(1310)
    4. Kimi-Pro-v2(1298)
    5. Llama-3.1-405B-Instruct(1295)
      (↑ 表示较上月分数变化)
  • Hugging Face Trending(周榜)

    1. microsoft/DiT-3B-512(文生图)
    2. meta-llama/Llama-3.1-405B-Instruct
    3. Qwen/Qwen2-VL-72B
    4. EleutherAI/pile-v2(数据集)
    5. stabilityai/stable-diffusion-3-medium
  • arXiv 日下载 Top 3
    • 「RetNet: Retentive Network: A Successor to Transformer for Large Language Models」
    • 「Mamba-2-Hybrid: Scaling State Space Models to 100B Parameters」
    • 「VideoPoet-2: Scaling Autoregressive Video Generation」


🎙️ 今日金句

“我们正站在 AI 的‘iPhone 4 时刻’,但别忘了 App Store 规则还没写好。”
—— 李飞飞,2025.7.21,斯坦福 HAI 夏季论坛


http://www.lryc.cn/news/596202.html

相关文章:

  • 位运算符的妙用
  • 消息推送功能设计指南:精准触达与用户体验的平衡之道
  • OpenCV 零基础到项目实战 | DAY 1:图像基础与核心操作
  • Qt文件操作:读写文件的各种方法
  • 模运算常见定律
  • Java学习----Redis集群
  • Custom SRP - Draw Calls
  • Linux异常与信号处理
  • 11.【C语言学习笔记】指针(三)(回调函数、qsort排序函数、sizeof关键字和strlen函数)
  • Mixed Content错误:“mixed block“ 问题
  • 西门子 S7-1500分布式 I/O通信 :PROFINET IO 与 PROFIBUS DP核心技术详解(上)
  • 知识库搭建之Meilisearch‘s 搜索引擎-创建搜索引擎项目 测评-东方仙盟测评师
  • 【Godot4】状态栏组件StatusBar
  • python中 tqdm ,itertuples 是什么
  • RabbitMQ--批量处理
  • halcon手眼标定z方向实操矫正
  • VUE 中父级组件使用JSON.stringify 序列化子组件传递循环引用错误
  • 机器人氩弧焊保护气降成本的方法
  • Apache Ignite 的 SQL 功能和分布式查询机制
  • 50天50个小项目 (Vue3 + Tailwindcss V4) ✨ | ImageCarousel(图片轮播组件)
  • 深度学习篇---车道线循迹
  • FPGA自学——存储器模型
  • Kafka单条消息长度限制详解及Java实战指南
  • Apache Ignite 中 WHERE 子句中的子查询(Subqueries in WHERE Clause)的执行方式
  • Android 中 实现日期选择功能(DatePickerDialog/MaterialDatePicker)
  • 【无标题】buuctf-re3
  • JAVA中的IO流(四)数据流
  • 一个电脑抓包工具
  • 黄仁勋强调:首先,我是中国人
  • Python进阶第三方库之Numpy