当前位置: 首页 > news >正文

大模型日报2024-03-24

利用LLMs评分及解释K-12科学答案

  • 摘要: 本文研究了在K-12级科学教育中使用大型语言模型(LLMs)对短答案评分及解释。研究采用GPT-4结合少量样本学习和活跃学习,通过人机协作提供有意义的评估反馈。

MathVerse:多模态LLM解数学题效果评估

  • 摘要: 研究评估多模态大型语言模型(MLLMs)在视觉数学问题解答中的能力。通过创建MathVerse基准,收集并转换2,612个含图表的数学题,提出链式思考评估策略,深入分析MLLMs的理解和推理过程。

大模型高效微调综述

  • 摘要: 本文综述了高效微调大型模型的方法。介绍了各种参数高效微调(PEFT)算法,分析了它们的性能和计算成本,并探讨了减少PEFT计算成本的技术。

个性化视觉语言模型MyVLM研究

  • 摘要: 本研究旨在个性化视觉语言模型(VLMs),通过外部概念头学习用户特定概念,实现个性化图像标题生成和视觉问答。

PSALM:多模态图像分割模型

  • 摘要: PSALM通过引入掩码解码器和输入模式,扩展了大型多模态模型(LMM),解决图像分割任务。支持多数据集联合训练,提升了模型性能和任务泛化能力,在多个基准测试中取得优异成绩,并展现出对未见任务的零样本能力。

医学题目多选分类的大型语言模型

  • 摘要: 本文旨在评估基于多选题数据训练的大型语言模型在医学科目分类中的效能。通过深度神经网络,我们的MQ Sequence-BERT方法在MedMCQA数据集上超越了最新成果,开发集和测试集的准确率分别达到0.68和0.60。

RAmBLA:生物医学领域LLMs可靠性框架

  • 摘要: 本研究提出了RAmBLA框架,用以评估在生物医学领域中作为助手的大型语言模型(LLMs)的可靠性。通过设计模拟真实用户互动的任务,采用语义相似度评估LLMs的表现。

谷歌推动大型语言模型间的社会学习:AI互相学习成新趋势

  • 摘要: 谷歌引领了一场AI发展的革命性转变,实现了大型语言模型(LLMs)之间的社会学习。这一进步受到人类社会学习方式的启发,标志着AI技术在模仿人类学习行为方面迈出了重要一步。

语义解码时代探索

  • 摘要: 本文提出了‘语义解码’新视角,将大型语言模型(LLMs)视为语义处理器,通过优化语义空间内的交互来构建高效输出,探讨了在语义令牌空间内的优化潜力。

基于熵的动态温度采样改善模型生成

  • 摘要: 本文提出了一种基于熵的动态温度(EDT)采样方法,通过动态选择温度参数,有效平衡了大型语言模型生成任务的质量和多样性,并在不同基准测试中显示出显著优势。

Cobra: 多模态大型语言模型高效推理

  • 摘要: 本文提出Cobra模型,将Mamba语言模型扩展到视觉模态,通过线性计算复杂度提升多模态大型语言模型的效率。Cobra在保持竞争性能的同时,参数量仅为LLaVA的43%,并将代码开源。

RankPrompt:提升大型语言模型的准确性和效率

  • 摘要: RankPrompt在人工智能领域取得革命性进展,通过自主评估机制显著提高了大型语言模型(LLMs)的准确性和效率。这标志着对人工智能精细化追求的又一重要里程碑。

清华大学与微软的LLMLingua-2:用数据蒸馏和提示压缩提高大型语言模型效率

  • 摘要: 清华大学联合微软开发的LLMLingua-2大型语言模型采用了任务不可知技术,通过数据蒸馏和提示压缩方法,实现了在处理语言任务时的高效率。该模型的创新方法重新定义了大型语言模型的运行效率,对未来的自然语言处理技术发展具有重要意义。

HyperGAI推出突破性的多模态大型语言模型HPT

  • 摘要: HyperGAI的研究人员开发了Hyper Pretrained Transformers(HPT),这是一种全新的多模态语言模型。HPT能够处理不同类型的数据,为处理和理解多种形式的信息提供了强大的支持,标志着在人工智能领域的一大进步。

大型语言模型与多模态基础模型在精准肿瘤学中的应用进展

  • 摘要: 《npj Precision Oncology》一文报道,自2022年以来,人工智能(AI)技术在大型语言模型和多模态基础模型方面取得了巨大进步,这对肿瘤学领域产生了深远影响。这些进展为精准肿瘤治疗提供了新的工具和方法,有望改善癌症患者的治疗效果和生活质量。

谷歌研究如何超越大型语言模型中的预翻译

  • 摘要: 谷歌的研究人员提出,通过采用直接推理而非预翻译的方式,可以提升大型语言模型的性能。他们认为,直接处理原始语言数据,而不是先将其翻译成中间语言,有助于模型更准确地理解和生成文本。

谷歌即将推出巨型AI模型Gemini,行业趋向精简化

  • 摘要: 据最新消息,谷歌正准备推出一个名为Gemini的巨型语言模型(LLM)。尽管如此,人工智能产业目前正面临一个趋势转变,即从大型生成性AI模型向更小型、更精简的模型过渡。这一变化可能意味着像Gemini这样的巨型模型将变得较为罕见。

KL3M:首个获得“Licensed Model (L) Certification”认证的大型语言模型

  • 摘要: 近日,Fairly Trained宣布推出具有里程碑意义的大型语言模型KL3M。这是首个获得“Licensed Model (L) Certification”认证的语言模型,标志着AI领域的一个重要进展。KL3M的推出预示着语言模型的发展进入了一个全新的、经过公正训练认证的时代。

LLM4Decompile: 开源大型语言模型用于反编译,注重代码可执行性和可重编译性

  • 摘要: LLM4Decompile项目发布了一系列开源的大型语言模型,专注于提高反编译代码的可执行性和可重编译性。这意味着该模型能够将编译后的机器代码更准确地转换回源代码,有助于软件开发和安全分析等领域的工作。

乐天集团发布针对日语优化的开放大型语言模型

  • 摘要: 乐天集团作为其AI化倡议的一部分,发布了针对日语优化的开放式大型语言模型(LLMs)。这些高性能的语言模型旨在实现在各个领域中广泛应用人工智能技术,推动技术进步和创新。

Butternut AI 1.0:秒建AI网站

  • 摘要: Butternut AI是首款AI网站生成器,只需输入商业名称和关键词,即可快速打造定制化、响应式、内置SEO的多页面网站。

SEO AI写手:一键生成SEO内容

  • 摘要: SEO AI Writer是一款自动化工具,能通过分析谷歌搜索结果来创建博客内容。它能够制定结构化大纲,整合关键词以优化文章,并生成相关图片,提高内容的SEO友好度。

Claros:智能AI购物助手

  • 摘要: Claros是一款AI购物助手,旨在快速帮助用户在线找到更好的产品。该工具能够省去长时间的购物研究,提供比其他市场更加相关的商品推荐。

Alfred 5.5集成ChatGPT与DALL-E

  • 摘要: Alfred 5.5更新发布,新增Grid、Text、Image和PDF视图,使搜索结果更加直观生动。此版本重磅整合了ChatGPT与DALL-E,极大丰富了用户体验。

Legitt AI合同生成器:秒速合同草拟

  • 摘要: Legitt AI合同生成器是一款AI驱动的工具,能够在几秒内快速起草合同。该工具支持针对特定用例和需求的定制训练,提高合同制作的效率和准确性。

DataDepot:AI研究终端

  • 摘要: DataDepot是一款先进的AI研究工具,旨在帮助用户通过自然语言快速找到信息,并整合多家领先数据供应商的数据集,实时获取新见解。

QuizWizard AI:一键生成测验

  • 摘要: QuizWizard AI能将视频、文章或谷歌文档一键转化为互动式AI测验。轻松嵌入网站,提升用户参与度,转化为邮件订阅者。

Devika:智能AI编程助手

  • 摘要: Devika是一款开源AI软件工程师,能理解人类指令,研究信息并编写代码。它是Cognition AI的Devin的竞争对手,使用Python语言编写。

Lightning-AI:加速PyTorch模型

  • 摘要: Lightning-AI项目旨在通过Thunder源码编译器,实现PyTorch模型的快速加速。它支持多种硬件执行器同时使用,使用Python语言编写。

Unit-Mesh:多语言AI编程向导

  • 摘要: Unit-Mesh是一款AI编程向导,支持多语言,能自动生成代码,辅助修复bug。它还能自定义提示,并具备开发、测试、文档自动化功能。该项目使用Kotlin语言编写。

Janhq:开源离线版ChatGPT

  • 摘要: Janhq项目是ChatGPT的开源替代品,能够完全离线运行在个人电脑上。该项目使用TypeScript语言编写,旨在提供一个不依赖互联网的智能对话体验。

.NET智能组件AI实验项目

  • 摘要: dotnet-smartcomponents项目旨在为.NET应用程序提供全面的人工智能功能。该项目实验性地集成了端到端AI特性,虽然未标明编写语言,但专为.NET环境设计。

SakanaAI:模型合并优化项目

  • 摘要: SakanaAI是一个Github上的AI趋势项目,专注于利用进化算法优化模型合并策略。该项目使用Python语言编写,旨在通过自动化搜索最佳合并方案,提高模型性能。
http://www.lryc.cn/news/324913.html

相关文章:

  • Android kotlin全局悬浮窗全屏功能和锁屏页面全屏悬浮窗功能一
  • 图像识别在安防领域的应用
  • 前端面试集中复习 - http篇
  • C++ - 类和对象(上)
  • mysql基础4sql优化
  • 实现Spring Web MVC中的文件上传功能,并处理大文件和多文件上传
  • 搭建vite项目
  • Docker 安装mysql 主从复制
  • GPT每日面试题—如何实现二分查找
  • 机器学习神经网络由哪些构成?
  • 代码随想录算法训练营day19 | 二叉树阶段性总结
  • 数据库引论:3、中级SQL
  • 毕业设计:日志记录编写(3/17起更新中)
  • (一)基于IDEA的JAVA基础7
  • MySQL数据库概念及MySQL的安装
  • redis实际应用场景及并发问题的解决
  • 考研数学|汤家凤《1800》基础部分什么时候做完?
  • JS的设计模式(23种)
  • [自研开源] MyData v0.7.5 更新日志
  • 3月份的倒数第二个周末有感
  • Java 变得越来越像 Rust
  • 通过git bash 或命令行ssh访问服务器 sftp上传下载文件
  • 27 OpenCV 凸包
  • 【GPT概念04】仅解码器(only decode)模型的解码策略
  • 蔚来-安全开发一面/二面
  • Redis Cluster集群模式容器化部署
  • 网络原理(6)——IP协议
  • 淘宝商品详情API接口:快速获取商品信息的高效工具
  • 一分钟学习Markdown语法
  • Power Apps 学习笔记 -- OrganizationRequestCollection