当前位置：首页 > news >正文

【AI News | 20250630】每日AI进展

news 2025/7/1 12:32:33

AI Repos

1、spring-ai-alibaba
Spring AI Alibaba 是一个基于图（Graph）的多智能体AI框架，专为构建聊天机器人、工作流和多智能体应用而设计。它提供企业级AI生态集成，包括与阿里云百炼平台、ARMS 和 Langfuse 等的深度融合，并支持 Plan-Act 智能体产品如 JManus 和 DeepResearch。该框架支持流式并发生成高质量内容，简化了复杂AI应用的开发与生产部署。
在这里插入图片描述

2、superdesign
SuperDesign 是首个开源的 AI 设计代理，它直接集成在你的 IDE（如 VS Code、Cursor 等）中。用户可以通过自然语言提示，快速生成 UI 界面模型、组件和线框图，并能方便地进行迭代和复制。它支持产品级模型、可复用组件和低保真线框图的生成，所有设计都本地存储。SuperDesign 免费开源，支持自定义和现有 UI 更新，旨在提升设计效率。

3、anycrawl
AnyCrawl 是一款专为 LLM（大型语言模型）优化的高性能网络爬虫和数据抓取应用。它支持 SERP 爬取（多搜索引擎和批量处理）、网页内容提取和全站爬取，并采用多线程/多进程架构以实现高效率。AnyCrawl 提供 Docker 部署，支持多种爬取引擎（如 Cheerio、Playwright、Puppeteer）和代理设置，旨在为AI生态系统提供坚实的数据基础，加速AI技术发展。

AI News

1、知乎直答知识库重磅升级：AI搜索与社区融合开启新篇章
知乎近日发布了其AI搜索工具“知乎直答”的最新版本，重点升级了知识库功能，支持用户订阅和分享内容，并与知乎社区深度融合，提供沉浸式、多场景的AI问答体验。新功能包括沉浸式阅读、边看边问等，旨在提升用户获取信息的效率和个性化体验。知乎创始人周源表示，此次升级是知乎在AI时代构建护城河的重要一步，依托社区专家网络和专业内容生态，推动AI创新。

2、北京人工智能研究院推出OmniGen2：开源图文生成系统的新里程碑
北京人工智能研究院近日发布了开源系统OmniGen2，该系统专注于文本到图像的生成、图像编辑和上下文图像创作。OmniGen2采用了两条独立的解码路径，有效提升了多模态语言模型的表现。基于Qwen2.5-VL-3B变换器的大型多模态语言模型，OmniGen2在图像生成方面采用了自定义的扩散变换器，参数量达40亿。系统具备自我反思和改进功能，在多个基准测试中表现优异，特别是在图像编辑方面创下了新的开放源代码模型纪录。

3、谷歌Gemini推出“Scheduled Actions”功能
谷歌Gemini近日推出的“Scheduled Actions”功能，允许用户通过自然语言提示词设定未来或定期任务，标志着AI助理向更智能、更主动的角色迈进。该功能深度整合谷歌生态系统，支持单次或定期任务，极大提升任务管理灵活性。尽管存在隐私和可靠性考量，但其推出被视为AI助理从被动工具向主动代理转型的重要一步。

4、豆包APP推出「深入研究」功能，助力用户高效处理复杂任务
豆包APP、网页版及电脑版平台近日上线了「深入研究」功能，旨在帮助用户高效处理复杂任务，通过整合海量深度信息生成详尽的研究报告或可视化网页结果。该功能支持多种场景应用，如规划旅行、购买决策、政策解读等，并可将报告内容一键转换为播客形式，提升用户体验。

5、百度文心大模型4.5系列全面开源，引领AI技术新浪潮
百度正式发布了文心大模型4.5系列模型，并完全开源，提供10款不同版本的模型，涵盖多种参数配置。该系列模型在多项文本和多模态基准测试中表现优异，特别是在指令遵循、世界知识记忆、视觉理解和多模态推理等任务上取得了SOTA水平的成绩。百度还提供了开源的产业级开发套件和一站式使用指南，降低了后训练和部署的门槛，使开发者和研究人员能更方便地接触到最新的AI技术。

6、谷歌Gemini2.5Pro API免费回归
谷歌宣布其旗舰AI模型Gemini2.5Pro的API重新纳入Google AI Studio的免费层级，为开发者提供了更低门槛的创新机会。Gemini2.5Pro以其卓越的多模态能力和强大的推理性能而闻名，支持高达100万token的上下文窗口，能够处理多种输入类型。谷歌此举是对开发者需求的积极回应，同时也展现了其在AI技术普及化方面的努力。开发者社区对此反应积极，认为这为高性能测试和原型开发提供了宝贵机会。

7、阿里巴巴发布Ovis-U1多模态大模型
阿里巴巴国际AI团队于2025年6月29日正式发布了全新多模态大模型Ovis-U1，该模型集多模态理解、图像生成和图像编辑功能于一体，展现了强大的跨模态处理能力。Ovis-U1采用创新的架构设计，通过视觉分词器、视觉嵌入表和大型语言模型三大核心组件，高效对齐视觉与文本嵌入，显著提升了模型在复杂场景下的表现。此外，Ovis-U1延续了Ovis系列的开源传统，代码、模型权重和训练数据均已公开，为全球开发者提供了探索多模态AI的便捷工具。

8、腾讯开源Hunyuan-A13B大语言模型：小身材大能量，开启资源受限环境新可能
腾讯最新开源的Hunyuan-A13B大语言模型，采用创新的细粒度MoE架构，虽仅有130亿活跃参数但总参数量高达800亿，实现了在资源受限环境下的高效性能。该模型支持快慢思维混合推理模式和原生256K超长上下文理解，特别在智能体任务上表现卓越。通过Grouped Query Attention技术和多种量化格式支持，Hunyuan-A13B在数学、科学、编码等领域展现出强大竞争力。腾讯为开发者提供了全面的支持和部署方案，大大简化了使用流程。

9、中国首个海洋领域开源大模型OceanGPT（沧渊）在杭州发布，开启海洋科技新篇章
6月26日，中国首个专注于海洋领域的开源大模型OceanGPT（沧渊）在浙江杭州正式发布，由浙江大学的海洋精准感知技术全国重点实验室主导研发。OceanGPT具备海洋专业知识问答能力，能解读声呐图像和海洋观测图等多模态数据，其独特的“慢思考”推理机制有效降低了错误率。此外，OceanGPT还能生成水下机器人操控代码，简化操作流程，集成MCP大模型协议实现多机器人协同合作，已在浙江大学的海鹰系列水下机器人平台上完成技术验证。

10、华为开源盘古大模型及升腾推理技术，加速AI行业创新
华为于6月30日正式宣布开源盘古70亿参数的稠密模型和盘古Pro MoE720亿参数的混合专家模型，以及基于升腾的模型推理技术。这一举措旨在推动大模型技术的研究与创新发展，加速人工智能在各行业的应用。目前，相关模型权重和推理代码已上线开源平台，华为邀请全球开发者共同完善技术。

查看全文

http://www.lryc.cn/news/578106.html