当前位置: 首页 > news >正文

pandas的文本与序列化

文章目录


1.pandas的文本与序列化

result_data = pd.DataFrame(json_data_list)with open(jsonl_file_path, 'w', encoding='utf-8') as jsonl_file:result_data.to_json(orient='records', lines=True, force_ascii=False, path_or_buf=jsonl_file)
数据不换行
df.at[i, column_name_transcript] = df.at[i, column_name_transcript].split('\n')

pandas转序列化数据

data_dicts = df.to_dict(orient='records')with open(jsonl_file_path, 'w', encoding='utf-8') as jsonl_file:for data in data_dicts:# 将字典转换为JSON字符串,ensure_ascii=False参数确保中文字符不会被转义# 写入文件时,每个JSON对象后面跟着一个换行符jsonl_file.write(json.dumps(data, ensure_ascii=False) + '\n')

pandas元素序列化

df['column_01'] = df['column_01'].apply(lambda x: json.dumps(x, ensure_ascii=False) if isinstance(x, str) else '')
 # 对"answer"列中的每个字符串元素去除空白并分割成单词列表df['question'] = df['question'].apply(lambda x: x.strip().split())df['answer'] = df['answer'].apply(lambda x: x.strip().split())# 序列化"answer"列中的每个元素为JSON格式的字符串df['question'] = df['question'].apply(lambda x: json.dumps(x, ensure_ascii=False) if isinstance(x, list) else x)df['answer'] = df['answer'].apply(lambda x: json.dumps(x, ensure_ascii=False) if isinstance(x, list) else x)
http://www.lryc.cn/news/417263.html

相关文章:

  • 在企业级环境中部署Java程序:Docker命令实用指南
  • LabVIEW远程开发
  • 工作随记:我在OL8.8部署oracle rac遇到的问题
  • C++:vector容器
  • 深入理解 AWS CodePipeline
  • Qt:自定义钟表组件
  • 前端性能优化-web资源加载优先级
  • Docker-数据卷指令
  • Elasticsearch VS Typesense! Elasticsearch未来会被其它搜索引擎取代吗?
  • usb摄像头 按钮 静止按钮
  • SAP MM学习笔记 - 豆知识03 - 安全在库和最小安全在库,扩张物料的保管场所的几种方法,定义生产订单的默认入库保管场所,受注票中设定禁止贩卖某个物料
  • 激光导航AGV叉车那么多,究竟该怎么选?一篇文章讲明白~
  • redis面试(七)初识lua加锁脚本
  • 企元数智百年营销史的精粹:借鉴历史创造未来商机
  • Java @SpringBootTest注解用法
  • 构建智能招聘平台:人才招聘系统源码开发指南
  • Docker + Nacos + Spring Cloud Gateway 实现简单的动态路由配置修改和动态路由发现
  • Linux中多线程压缩软件 | Mingz
  • 【JavaEE精炼宝库】网络原理基础——UDP详解
  • 【回眸】周中WLB-个人
  • 基于Spring boot + Vue的灾难救援系统
  • C#进阶:轻量级ORM框架Dapper详解
  • 【python015】常见成熟AI-图像识别场景算法清单(已更新)
  • 删除有序数组中的重复项(LeetCode)
  • 【算法 03】雇佣问题
  • vue3+axios请求导出excel文件
  • LLM与NLP
  • js 判断是否为回文串
  • 多重背包c++
  • kernel input事件测试程序