当前位置: 首页 > news >正文

langchain 加载 csv,json

csv

from langchain_community.document_loaders.csv_loader import CSVLoaderloader = CSVLoader(file_path='data/专业描述.csv', csv_args={'delimiter': ',','quotechar': '"','fieldnames': ['专业', '描述']
}, encoding='utf8', source_column='专业')data = loader.load()
print(data)
  • 'quotechar': '"': 设置了引用字符为双引号(")。在CSV文件中,如果某个字段值本身包含逗号或其他特殊字符,或者整个字段需要被视为一个不可分割的整体,通常会使用双引号将其包围起来。这里的设定告诉解析器如何正确识别和处理被引号包裹的字段值。

  • 'fieldnames': ['专业', '描述']: 提供了列名列表。如果CSV文件的第一行没有列名(或者不希望使用第一行作为列名),可以在这里显式指定列名。在这个例子中,列名分别为“专业”和“描述”,对应到CSV文件中两列数据的实际含义。

  • source_column'专业' 指定了一个特定的列名。这个参数的意义可能依赖于CSVLoader的具体实现细节。在某些上下文中,它可能用于指定作为后续处理主键或关键属性的列,在回溯某一行的时候可能有用

json

from langchain_community.document_loaders import JSONLoader
import json
from pathlib import Path
from pprint import pprintfile_path = 'data/json_str.json'
data = json.loads(Path(file_path).read_text(encoding='utf8'))
pprint(data)

json分割

import json
import requestsjson_data = requests.get("https://api.smith.langchain.com/openapi.json").json()from langchain_text_splitters import RecursiveJsonSplitter
splitter = RecursiveJsonSplitter(max_chunk_size=300)# 最好的选择
json_chunks = splitter.split_json(json_data=json_data)  # json_data 为字典# 把 json 当字符串了,不是最优方法
docs = splitter.create_documents(texts=[json_data])# 也把 json 当字符串了,但结果跟 split_json 一样
texts = splitter.split_text(json_data=json_data)
print(texts[0])
print(texts[1])

http://www.lryc.cn/news/338510.html

相关文章:

  • Java-常见面试题收集(十三)
  • 第二证券策略:股指预计维持震荡格局 关注汽车、工程机械等板块
  • hcia datacom课程学习(6):路由与路由表基础
  • AI PC元年,华为的一张航海图、一艘渡轮和一张船票
  • NAT技术
  • 新能源汽车“价格战”之后,充电桩主板市场将会怎样?
  • appium driver install uiautomator2 安装失败
  • 学浪已购买视频怎么下载到本地?
  • k8s-pod设置执行优先级
  • const修饰指针
  • php关于序列化r的指向
  • 从0到1实现RPC | 11 丰富测试案例
  • 在前端开发中用到了哪些设计模式?
  • ES6 的解构赋值
  • 蓝桥杯物联网竞赛_STM32L071KBU6_全部工程及国赛省赛真题及代码
  • 关于UCG游戏平台的一些思考
  • 一起学习python——基础篇(20)
  • 云服务器安装Mysql、MariaDB、Redis、tomcat
  • Android笔记--MediaCodec(二)
  • 【Java探索之旅】方法重载 递归
  • 多输入多输出 | Matlab实现XGboost多输入多输出预测
  • 【设计模式】3、builder 建造者模式
  • 使用ROCm的HIP API向量加法程序
  • Vue3---基础7(Props)
  • 第一节:什么是操作系统
  • Day:007(1) | Python爬虫:高效数据抓取的编程技术(scrapy框架使用)
  • Echarts使用dataTool写可自定义横坐标的盒须图(箱线图)
  • SpringBoot编写一个SpringTask定时任务的方法
  • 【Qt编译】ARM环境 Qt5.14.2-QtWebEngine库编译 (完整版)
  • vue简单使用二(循环)