当前位置: 首页 > news >正文

Sql进阶:字段中包含CSV,如何通过Sql解析CSV成多行多列?

Sql进阶

  • 一、问题描述
  • 二、解决思路
    • <一>、拆成多行
    • <二>、拆成多列
  • 三、代码实现

一、问题描述

Oracle数据库中某个字段value是CLOB类型,存的是csv格式的数据,如下所示

classnovalue
1name,age,sex,… ‘李世民’,20,‘M’,…’ ‘李治’,18,‘M’,… ‘武则天’,16,‘F’,… ‘李隆基’,14,‘M’,…
2

需要把上述clob类型的csv字段用Sql的方式展开,如上述csv字段有四行三列,就需要把上述字段转成实际的四行三列,如下所示

classnonameagesex
1李世民20M
1李治18M
1武则天16F
1李隆基14M
2

二、解决思路

<一>、拆成多行

  • 按照换行符拆分一个个的列表,上述换行符是\n,按照\n进行拆分比较难写,考虑先把\n替换成其它符号,如分号
换行符在oracle中用chr(10)表示
select replace(value,chr(10),';') as value from table
  • 按照换行符进行拆分字符串
select to_char(regexp_substr(value,'[^;]+',1,level) as split_valuefrom table
connect by level <= regexp_count(value,'[^;]+',1)and prior class_no = class_noand prior sys_guid() is not null

regexp_substr()函数为拆分字符串,若没有connect by语句,只是

select to_char(regexp_substr(value'[^;]+',1) as split_valuefrom table

则不会循环进行拆分,只会拆分第一段,比如我那个例子,只会获取到

classnovalue
1‘李世民’,20,‘M’
2

CONNECT BY是Oracle SQL中的一个子句,用于定义层次结构或递归关系,从而进行层次结构数据的查询。
LEVEL是Oracle SQL中的一个伪列,用于在层次结构或递归查询中获取当前行的级别。
REGEXP_COUNT 用于计算字符串中正则表达式匹配的次数

上述level <= regexp_count(value,‘[^;]+’,1)就是递归停止的条件

prior条件指的是当前递归在哪个层级下运行,比如上述例子一个csv字段描述的是一个班级的事情,递归是在这个班级下运行,所以prior条件要加上prior class_no = classno,不然会造成数据重复
需要注意prior后接的条件需要能够限制某个递归层级,不然可能会造成数据不断的循环
若是有多个prior条件,可以
and prior col1 = col1
and prior col2 = col2
而不是
and prior col1 = col1 and col2 = col2

经过上述处理之后,得到的结果应该是

classnovalue
1name,age,sex,…
1‘李世民’,20,‘M’,…
1’ ‘李治’,18,‘M’,…
1‘武则天’,16,‘F’,…
1‘李隆基’,14,‘M’,
2

已经拆成多行了,剩下的是拆成多列

<二>、拆成多列

  • 根据列的分隔符来拆分,以逗号为例
select regexp_substr(split_value,'[^,]+',1,1) as name,regexp_substr(split_value,'[^,]+',1,2) as age,regexp_substr(split_value,'[^,]+',1,3) as sexfrom table
  • 还是用regexp_substr函数来拆分,只不过不进行递归查询,

三、代码实现

with tmp as (select classno,replace(value,chr(10),';') as valuefrom table
),tmp1 as (select to_char(regexp_substr(value,'[^;]+',1,level)) as split_value,classnofrom tmpconnect by level <= regexp_count(value,'[^;]+',1)and prior classno = classnoand prior sys_guid() is not null
),tmp2 as (select classno,regexp_substr(value,'[^,]+',1,1) as name,regexp_substr(value,'[^,]+',1,2) as age,regexp_substr(value,'[^,]+',1,3) as sexfrom tmp1
)select classno,name,age,sexfrom tmp2 where name != 'name'
http://www.lryc.cn/news/486713.html

相关文章:

  • linux之调度管理(5)-实时调度器
  • mybatis-plus: mapper-locations: “classpath*:/mapper/**/*.xml“配置!!!解释
  • nacos-operator在k8s集群上部署nacos-server2.4.3版本踩坑实录
  • 面试篇-项目管理
  • 数仓建设之Oracle常见语法学习
  • 物联网智能技术的深入探讨与案例分析
  • python语言基础-5 进阶语法-5.2 装饰器-5.2.2 简单装饰器
  • TransFormer--解码器:带掩码的多头注意力层
  • 【ArcGIS微课1000例】0130:图层组详解与使用
  • Linux中配置ntp服务
  • 微服务day10-Redis面试篇
  • STL序列式容器之list
  • docker:基于Dockerfile镜像制作完整案例
  • 微信小程序自定义顶部导航栏(适配各种机型)
  • sslSocketFactory not supported on JDK 9+
  • [Codesys]常用功能块应用分享-BMOV功能块功能介绍及其使用实例说明
  • 大语言模型通用能力排行榜(2024年11月8日更新)
  • 信息技术引领未来:大数据治理的实践与挑战
  • Git 分⽀规范 Git Flow 模型
  • 基于YOLOv8深度学习的公共卫生防护口罩佩戴检测系统(PyQt5界面+数据集+训练代码)
  • Nature Communications 基于触觉手套的深度学习驱动视触觉动态重建方案
  • 构建SSH僵尸网络
  • WPF中MVVM工具包 CommunityToolkit.Mvvm
  • 学习空闲任务函数
  • Hyper-v中ubuntu与windows文件共享
  • 【软件工程】一篇入门UML建模图(类图)
  • Windows 安装Docker For Desktop概要
  • 解决循环依赖报错问题
  • 代码随想录第46期 单调栈
  • 中仕公考怎么样?事业编面试不去有影响吗?