当前位置: 首页 > news >正文

【AI News | 20250630】每日AI进展

AI Repos

1、spring-ai-alibaba
Spring AI Alibaba 是一个基于图(Graph)的多智能体AI框架,专为构建聊天机器人、工作流和多智能体应用而设计。它提供企业级AI生态集成,包括与阿里云百炼平台、ARMS 和 Langfuse 等的深度融合,并支持 Plan-Act 智能体产品如 JManus 和 DeepResearch。该框架支持流式并发生成高质量内容,简化了复杂AI应用的开发与生产部署。
在这里插入图片描述

2、superdesign
SuperDesign 是首个开源的 AI 设计代理,它直接集成在你的 IDE(如 VS Code、Cursor 等) 中。用户可以通过自然语言提示,快速生成 UI 界面模型、组件和线框图,并能方便地进行迭代和复制。它支持产品级模型、可复用组件和低保真线框图的生成,所有设计都本地存储。SuperDesign 免费开源,支持自定义和现有 UI 更新,旨在提升设计效率。

3、anycrawl
AnyCrawl 是一款专为 LLM(大型语言模型)优化的高性能网络爬虫和数据抓取应用。它支持 SERP 爬取(多搜索引擎和批量处理)、网页内容提取和全站爬取,并采用多线程/多进程架构以实现高效率。AnyCrawl 提供 Docker 部署,支持多种爬取引擎(如 Cheerio、Playwright、Puppeteer)和代理设置,旨在为AI生态系统提供坚实的数据基础,加速AI技术发展。

AI News

1、知乎直答知识库重磅升级:AI搜索与社区融合开启新篇章
知乎近日发布了其AI搜索工具“知乎直答”的最新版本,重点升级了知识库功能,支持用户订阅和分享内容,并与知乎社区深度融合,提供沉浸式、多场景的AI问答体验。新功能包括沉浸式阅读、边看边问等,旨在提升用户获取信息的效率和个性化体验。知乎创始人周源表示,此次升级是知乎在AI时代构建护城河的重要一步,依托社区专家网络和专业内容生态,推动AI创新。

2、北京人工智能研究院推出OmniGen2:开源图文生成系统的新里程碑
北京人工智能研究院近日发布了开源系统OmniGen2,该系统专注于文本到图像的生成、图像编辑和上下文图像创作。OmniGen2采用了两条独立的解码路径,有效提升了多模态语言模型的表现。基于Qwen2.5-VL-3B变换器的大型多模态语言模型,OmniGen2在图像生成方面采用了自定义的扩散变换器,参数量达40亿。系统具备自我反思和改进功能,在多个基准测试中表现优异,特别是在图像编辑方面创下了新的开放源代码模型纪录。

3、谷歌Gemini推出“Scheduled Actions”功能
谷歌Gemini近日推出的“Scheduled Actions”功能,允许用户通过自然语言提示词设定未来或定期任务,标志着AI助理向更智能、更主动的角色迈进。该功能深度整合谷歌生态系统,支持单次或定期任务,极大提升任务管理灵活性。尽管存在隐私和可靠性考量,但其推出被视为AI助理从被动工具向主动代理转型的重要一步。

4、豆包APP推出「深入研究」功能,助力用户高效处理复杂任务
豆包APP、网页版及电脑版平台近日上线了「深入研究」功能,旨在帮助用户高效处理复杂任务,通过整合海量深度信息生成详尽的研究报告或可视化网页结果。该功能支持多种场景应用,如规划旅行、购买决策、政策解读等,并可将报告内容一键转换为播客形式,提升用户体验。

5、百度文心大模型4.5系列全面开源,引领AI技术新浪潮
百度正式发布了文心大模型4.5系列模型,并完全开源,提供10款不同版本的模型,涵盖多种参数配置。该系列模型在多项文本和多模态基准测试中表现优异,特别是在指令遵循、世界知识记忆、视觉理解和多模态推理等任务上取得了SOTA水平的成绩。百度还提供了开源的产业级开发套件和一站式使用指南,降低了后训练和部署的门槛,使开发者和研究人员能更方便地接触到最新的AI技术。

6、谷歌Gemini2.5Pro API免费回归
谷歌宣布其旗舰AI模型Gemini2.5Pro的API重新纳入Google AI Studio的免费层级,为开发者提供了更低门槛的创新机会。Gemini2.5Pro以其卓越的多模态能力和强大的推理性能而闻名,支持高达100万token的上下文窗口,能够处理多种输入类型。谷歌此举是对开发者需求的积极回应,同时也展现了其在AI技术普及化方面的努力。开发者社区对此反应积极,认为这为高性能测试和原型开发提供了宝贵机会。

7、阿里巴巴发布Ovis-U1多模态大模型
阿里巴巴国际AI团队于2025年6月29日正式发布了全新多模态大模型Ovis-U1,该模型集多模态理解、图像生成和图像编辑功能于一体,展现了强大的跨模态处理能力。Ovis-U1采用创新的架构设计,通过视觉分词器、视觉嵌入表和大型语言模型三大核心组件,高效对齐视觉与文本嵌入,显著提升了模型在复杂场景下的表现。此外,Ovis-U1延续了Ovis系列的开源传统,代码、模型权重和训练数据均已公开,为全球开发者提供了探索多模态AI的便捷工具。

8、腾讯开源Hunyuan-A13B大语言模型:小身材大能量,开启资源受限环境新可能
腾讯最新开源的Hunyuan-A13B大语言模型,采用创新的细粒度MoE架构,虽仅有130亿活跃参数但总参数量高达800亿,实现了在资源受限环境下的高效性能。该模型支持快慢思维混合推理模式和原生256K超长上下文理解,特别在智能体任务上表现卓越。通过Grouped Query Attention技术和多种量化格式支持,Hunyuan-A13B在数学、科学、编码等领域展现出强大竞争力。腾讯为开发者提供了全面的支持和部署方案,大大简化了使用流程。

9、中国首个海洋领域开源大模型OceanGPT(沧渊)在杭州发布,开启海洋科技新篇章
6月26日,中国首个专注于海洋领域的开源大模型OceanGPT(沧渊)在浙江杭州正式发布,由浙江大学的海洋精准感知技术全国重点实验室主导研发。OceanGPT具备海洋专业知识问答能力,能解读声呐图像和海洋观测图等多模态数据,其独特的“慢思考”推理机制有效降低了错误率。此外,OceanGPT还能生成水下机器人操控代码,简化操作流程,集成MCP大模型协议实现多机器人协同合作,已在浙江大学的海鹰系列水下机器人平台上完成技术验证。

10、华为开源盘古大模型及升腾推理技术,加速AI行业创新
华为于6月30日正式宣布开源盘古70亿参数的稠密模型和盘古Pro MoE720亿参数的混合专家模型,以及基于升腾的模型推理技术。这一举措旨在推动大模型技术的研究与创新发展,加速人工智能在各行业的应用。目前,相关模型权重和推理代码已上线开源平台,华为邀请全球开发者共同完善技术。

http://www.lryc.cn/news/578106.html

相关文章:

  • 华为云Flexus+DeepSeek征文 | 从零开始搭建Dify-LLM应用开发平台:华为云全流程单机部署实战教程
  • 本地部署kafka4.0
  • Serverless 架构入门与实战:AWS Lambda、Azure Functions、Cloudflare Workers 对比
  • 打卡day58
  • 逻辑门电路Multisim电路仿真汇总——硬件工程师笔记
  • 设计模式(六)
  • 深入拆解AOP的Java技术栈:注解、反射与设计模式的完美融合
  • [springboot系列] 探秘JUnit 5: Java单元测试利器
  • xilinx axi datamover IP使用demo
  • 网络协议之网络探测协议ICMP及其应用ping,traceroute
  • Prompt 精通之路(七)- 你的终极 AI 宝典:Prompt 精通之路系列汇总
  • python+uniapp基于微信小程序蜀味道江湖餐饮管理系统nodejs+java
  • Java开发新变革!飞算JavaAI深度剖析与实战指南
  • 计算机是如何⼯作的
  • 【Java EE初阶】计算机是如何⼯作的
  • Android 中 使用 ProgressBar 实现进度显示
  • vue中表尾合计
  • 车载Tier1 supplier梳理
  • Android阴影效果的艺术与实现:从入门到精通
  • Linux 安装使用教程
  • C++ 第四阶段 STL 容器 - 第五讲:详解 std::set 与 std::unordered_set
  • 【甲方安全建设】SDL基线建设及审计评估
  • Linux习题
  • 机器学习,支持向量机svm和决策树xgboost介绍
  • 【读代码】TradingAgents:基于多智能体LLM的金融交易框架深度解析
  • 大模型的开发应用(十六):Agent 与 LangGraph基础
  • Waiting for another flutter command to release the startup lock...解决方法
  • 9.6 视觉专家模块+1536超清解析!智谱CogVLM-9B多模态模型中文场景实战评测,性能炸裂吊打LLaVA
  • Python 机器学习实战:泰坦尼克号生还者预测 (从数据探索到模型构建)
  • Spring Security 鉴权与授权详解(前后端分离项目)