当前位置: 首页 > news >正文

GPT法律领域

法律领域

LaWGPT

Github: https://github.com/pengxiao-song/LaWGPT

  • 简介:基于中文法律知识的大语言模型。

  • 数据:基于中文裁判文书网公开法律文书数据、司法考试数据等数据集展开,利用Stanford_alpaca、self-instruct方式生成对话问答数据,利用知识引导的数据生成,引入ChatGPT清洗数据,辅助构造高质量数据集。

  • 训练方法:(1)Legal-Base-7B模型:法律基座模型,使用50w中文裁判文书数据二次预训练。(2)LaWGPT-7B-beta1.0模型:法律对话模型,构造30w高质量法律问答数据集基于Legal-Base-7B指令精调。(3)LaWGPT-7B-alpha模型:在Chinese-LLaMA-7B的基础上直接构造30w法律问答数据集指令精调。(4)LaWGPT-7B-beta1.1模型:法律对话模型,构造35w高质量法律问答数据集基于Chinese-alpaca-plus-7B指令精调。

ChatLaw

Github: https://github.com/PKU-YuanGroup/ChatLaw

  • 简介:中文法律大模型

  • 数据:主要由论坛、新闻、法条、司法解释、法律咨询、法考题、判决文书组成,随后经过清洗、数据增强等来构造对话数据。

  • 训练方法:(1)ChatLaw-13B:基于姜子牙Ziya-LLaMA-13B-v1模型采用Lora方式训练而来。(2)ChatLaw-33B:基于Anima-33B采用Lora方式训练而来。

LexiLaw

Github: https://github.com/CSHaitao/LexiLaw

  • 简介:中文法律大模型

  • 数据:BELLE-1.5M通用数据、LawGPT项目中52k单轮问答数据和92k带有法律依据的情景问答数据、Lawyer LLaMA项目中法考数据和法律指令微调数据、华律网20k高质量问答数据、百度知道收集的36k条法律问答数据、法律法规、法律参考书籍、法律文书。

  • 训练方法:基于ChatGLM-6B模型,采用Freeze、Lora、P-Tuning-V2三种方法进行模型训练。

LAW-GPT

Github: https://github.com/LiuHC0428/LAW-GPT

  • 简介:中文法律大模型(獬豸)

  • 数据:现有的法律问答数据集和基于法条和真实案例指导的self-Instruct构建的高质量法律文本问答数据。

  • 训练方法:基于ChatGLM-6B,采用Lora&16bit方法进行模型训练。

lawyer-llama

Github: https://github.com/AndrewZhe/lawyer-llama

  • 简介:中文法律LLaMA

  • 数据:法考数据7k、法律咨询数据14k

  • 训练方法:以Chinese-LLaMA-13B为底座,未经过法律语料continual training,使用通用instruction和法律instruction进行SFT。

http://www.lryc.cn/news/127069.html

相关文章:

  • 【C++11保姆级教程】Type aliases(类型别名)、alignof and alignas(类型对齐))
  • 地址解析协议-ARP
  • Java线程
  • C语言如何实现DES加密与解密
  • 【笔记】优先队列(priority_queue/set)
  • 看看安森美深力科NSI45090JDT4G 是如何点亮汽车内外照明系统解决方案
  • Linux进阶之Shell-sed
  • 前端高频面试题 Day02
  • MYSQL完全卸载、安装与账号创建、权限控制
  • get与post如何拼接url与数据的灵活处理,循环的重要性。
  • Remote Sensing,2023 | 基于SBL的分布式毫米波相干雷达成像的高效实现
  • Android学习之路(5) UI控件之Button (按钮)与 ImageButton (图像按钮)
  • Day 31 C++ STL常用算法(下)
  • 【Android Studio】 win11 安装配置 jdk17 超详细
  • IDEA下方工具栏SideBar没有Services解决方法 IDEA配合微服务学习多端口管理打开Services栏方法
  • [Vue warn]: Error in render: “SyntaxError: “undefined“ is not valid JSON“
  • ui设计师工作总结及计划范文模板
  • 【Kafka】2.在SpringBoot中使用官方原生java版Kafka客户端
  • 使用腾讯云轻量服务器Matomo应用模板建网站流量统计系统
  • clickhouse-监控配置
  • C++11并发与多线程笔记(5)互斥量概念、用法、死锁演示及解决详解
  • 华为云classroom赋能--Devstar使应用开发无需从零开始
  • 软件的数据回滚
  • git clone使用https协议报错OpenSSL SSL_read: Connection was reset, errno 10054
  • 化繁为简,使用Hibernate Validator实现参数校验
  • 【Qt】多线程
  • 腾讯云GPU服务器GN7实例NVIDIA T4 GPU卡
  • 3. 爬取自己CSDN博客列表(自动方式)(分页查询)(网站反爬虫策略,需要在代码中添加合适的请求头User-Agent,否则response返回空)
  • 利用HTTP代理实现请求路由
  • 深度学习(36)—— 图神经网络GNN(1)