当前位置: 首页 > news >正文

景联文科技打造高质量图文推理问答数据集,赋能大语言模型提升推理能力

大语言模型在处理推理任务时,不同于人类能够反思错误并修正思维路径,当它遇到自身知识盲区时,缺乏自我校正机制,往往导致输出结果不仅无法改善,反而可能变得更不准确。

需要依赖外部的知识库和推理能力来克服其在理解和生成信息时可能出现的幻觉问题,从而提供更为准确和连贯的输出。

景联文科技是一家专业的大语言模型数据服务商,打造图文推理问答数据集,致力于为不同训练阶段的算法精准匹配高质量数据资源。

1000万条图文问答推理描述数据

数据详情:数据集包含1000万张高清带版权图片和对应的1000万条相应的2轮简单的问答推理(一问一答为一轮)。

图片规格:1080P及以上

数据分类:人物、动物、风景、食物、物品、城市、艺术、植物

数据格式:图片数据格式为jpg,标注文件格式为json

数据规模:

  1. 1000万1080p及以上高清图片,1000万条相应的2轮简单的问答推理(一问一答为一轮)。
  2. 所有图片类目及其对应在json文档中的类目,每张图片对应一个json,分布统计如下所示(单位:张)

人物 150万

动物 150万

风景 150万

食物 150万

物品 140万

城市 120万

艺术 70万

植物 70万

图像格式:jpg

标注文档格式:json

标注内容

  1. 图片分类
    对图片进行分类标注,一级类别、二级类别
    2)图片标签
    对图片中存在的元素进行词组描述
    3)图片描述
    对图片的内容呈现进行细化描述

样例

图片:

Json:

{

"分类":"自然景观",

"标签":"山脉,公路,阳光,蓝天,云朵,山谷",

"图片描述":"一条蜿蜒的公路如同一条银色的丝带,在郁郁葱葱的山谷间穿行。两旁的山峦巍峨,

顶部覆盖着稀疏的积雪,山脚下的植被在春日阳光的照耀下渐渐苏醒。天空是一片澄清的蔚蓝,

几朵洁白的云朵悠然地漂浮。阳光透过云层的缝隙,洒在蜿蜒的道路上,仿佛是大自然的指引,邀请旅者进入这个秘境探索。”

}

在数据安全与合规方面,景联文科技已通过ISO9001质量、ISO27001信息安全、ISO27701国际隐私安全管理认证,积极参与8项国家数据交换格式和数据安全标准制定,牢固构筑数据保护的基石。

获取样例请登录景联文科技官网咨询客服。https://www.jinglianwen.com/ai/

或直接发送需求至邮箱:lx@jinglianwen.com

景联文科技|数据采集|数据标注|大语言模型数据集

助力人工智能技术,赋能传统产业智能化转型升级

文章图文著作权归景联文科技所有,商业转载请联系景联文科技获得授权,非商业转载请注明出处。

http://www.lryc.cn/news/394569.html

相关文章:

  • 用网络编程完成windows和linux跨平台之间的通信(服务器)
  • 力扣3148.矩阵中的最大得分
  • 解决数据库PGSQL,在Mybatis中创建临时表报错TODO IDENTIFIER,连接池用的Druid。更换最新版本Druid仍然报错解决
  • 【WPF】桌面程序开发之xaml页面基础布局方式详解
  • 第十五章 Nest Pipe(内置及自定义)
  • 实战篇(八):使用Processing创建动态图形:诡异八爪鱼
  • 大模型成为软件和数据工程师
  • 【鸿蒙学习笔记】页面布局
  • GIT 使用相关技巧记录
  • 1-认识网络爬虫
  • ROS2使用Python开发动作通信
  • Bug记录:【com.fasterxml.jackson.databind.exc.InvalidDefinitionException】
  • Mongodb索引的删除
  • 科研绘图系列:R语言径向柱状图(Radial Bar Chart)
  • 鸿蒙开发管理:【@ohos.account.distributedAccount (分布式帐号管理)】
  • 【图书推荐】《HTML5+CSS3 Web前端开发与实例教程(微课视频版)》
  • 【04】微服务通信组件Feign
  • 为什么要设计DTO类
  • 流批一体计算引擎-11-[Flink]实战使用DataStream对接kafka
  • 数据仓库面试题
  • SQL 创建一个actor表,包含如下列信息
  • STM32+ESP8266连接阿里云
  • shark云原生-日志体系-ECK
  • 第二次作业
  • Java8 新特性stream、forEach常用方法总结
  • C语言4 运算符
  • 【数据分析】Pandas_DataFrame读写详解:案例解析(第24天)
  • quill编辑器使用总结
  • 快手矩阵管理系统:引领短视频运营新潮流
  • 文心一言:探索AI写作的新境界