当前位置: 首页 > news >正文

Data-Centric Financial Large Language Models

本文是LLM系列文章,针对《Data-Centric Financial Large Language Models》的翻译。

以数据为中心的大语言金融模型

  • 摘要
  • 1 引言
  • 2 背景
  • 3 方法
  • 4 实验
  • 5 结论和未来工作

摘要

大型语言模型(LLM)有望用于自然语言任务,但在直接应用于金融等复杂领域时却举步维艰。LLM很难对所有相关信息进行推理和整合。我们提出了一种以数据为中心的方法,使LLM能够更好地处理财务任务。我们的关键见解是,与其一次用所有内容重载LLM,不如对数据进行预处理和预理解。我们使用基于多任务提示的微调创建了一个财务LLM(FLLM),以实现数据预处理和预理解。然而,每个任务的标记数据很少。为了克服手动注释成本,我们使用溯因增强推理(AAR)通过修改FLLM自己输出的伪标签来自动生成训练数据。实验表明,我们的以数据为中心的带有AAR的FLLM大大优于为原始文本设计的基线财务LLM,在财务分析和解释任务方面达到了最先进的水平。我们还开源了一个新的财务分析和解释基准。我们的方法为释放LLM在复杂现实世界领域的潜力提供了一条很有前途的途径。

1 引言

2 背景

3 方法

4 实验

5 结论和未来工作

本文提出了一种基于FLLM的以数据为中心的方法,以提高LLM在财务分析任务中的能力。为了克服标记数据的稀缺性,他们采用溯因增强推理来自动生成训练数据。实验表明,他们以数据为中心的金融LLM和溯因增强推理大大优于基线LLM,实现了最先进的金融分析和解释基准。以数据为中心的方法为释放LLM在复杂现实世界领域的潜力提供了一个很有前途的方向。采用新的财务分析和解释基准也是一项宝贵的贡献。此外,未来工作的一个有趣方向是将以数据为中心的方法与其他方法相结合,如金融文本的提示和自我监督预训练。整合财务报告、财报电话和股价等多模式数据也可以实现更细致的财务分析。

http://www.lryc.cn/news/215584.html

相关文章:

  • 【HarmonyOS】服务卡片 API6 JSUI跳转不同页面并携带参数
  • SQL server数据库端口访问法
  • 深孔枪钻厂家,科研管理系统思路
  • 【论文阅读笔记】GLM-130B: AN OPEN BILINGUAL PRE-TRAINEDMODEL
  • Object常用方法
  • 【VR开发】【Unity】【VRTK】2-关于VR的基础知识
  • jeecg-uniapp 转成小程序的过程 以及报错 uniapp点击事件
  • Django的静态文件目录(路径)如何配置?
  • 函数应用(MySQL)
  • 数据分析过程中,发现数值缺失,怎么办?
  • Vue3.0 toRef toRefs :VCA模式
  • VS Code提取扩展时出错。XHR failed
  • 大模型需要哪类服务器
  • Java进阶(List)——面试时List常见问题解读 结合源码分析
  • 0基础学习PyFlink——个数滑动窗口(Sliding Count Windows)
  • vue3+ts 提取公共方法
  • C++ ->
  • VR全景在医院的应用:缓和医患矛盾、提升医院形象
  • 【python基础】format格式化函数的使用
  • Java web(三):Http、Tomcat、Servlet
  • Java实现Hive UDF详细步骤 (Hive 3.x版本,IDEA开发)
  • Vue进阶(幺陆肆)Apache的Access.log分析总结
  • Apple 苹果发布 M3、M3 Pro 和 M3 Max 芯片
  • Linux常用命令及主流服务部署大全
  • list-watch集群调度
  • 深度强化学习中的神经网络部分的作用是什么?一般如何选择合适的神经网络呢?
  • 若依系统的数据导入功能设置
  • vue页面父组件与子组件相互调用方法和传递参数值
  • vim使用
  • 人工智能基础_机器学习014_BGD批量梯度下降公式更新_进一步推导_SGD随机梯度下降和MBGD小批量梯度下降公式进一步推导---人工智能工作笔记0054