当前位置: 首页 > news >正文

UMLS数据下载及访问

UMLS数据申请

这个直接在官网上申请即可,记得把地址填全,基本都会拿到lisence。

UMLS数据访问

UMLS的数据访问分为网页访问,API访问以及数据下载后的本地访问,网页访问,API访问按照官网的指示即可,这里主要讲一下本地访问的注意事项。

UMLS 本地访问

本地访问是指可以下载数据文件并在本地数据库例如mysql里查看及处理。UMLS提供的可下载数据文件主要分为三类,第一类是UMLS Metathesaurus Precomputed Subsets ,只有元数据库的数据;第二类是Full UMLS Release Files包含了元数据库,语义网络以及专业术语;第三类是Metathesaurus History Files主要是历史的元数据。

UMLS Metathesaurus Precomputed Subsets数据导入

  • step1: 找到安装文件。在.\umls-2024AB-metathesaurus-full\2024AB\META 路径下,找到populate_mysql_db.bat(根据数据库和系统型号选择合适的安装文件即可。e.g. 对于mysql,Windows安装选populate_mysql_db.bat, linux 安装选populate_mysql_db.sh)
  • step2:修改自定义内容。使用windows自带的Nodepad打开populate_mysql_db.bat,将如下信息配置成自己的个性化信息。
    set MYSQL_HOME=<path to MYSQL_HOME>
    set user=<username>
    set password=<password>
    set db_name=<db_name>
    
  • step3:安装,看log解决其他报错。

Full UMLS Release Files数据导入

这个比上个部分(metathesaurus precomputed subsets部分的步骤多了一步将mmsys解压并自定义subset的过程,后续向mysql的导入操作与上个部分一致)

mmsys解压并自定义subset:UMLS - MetamorphoSys Help

(mysql安装教程可参考reference2)

可能出现的bug

1. 要注意一下metathesaurus precomputed subsets这个版本的mysql_tables.sql会报MySQL ERROR 1064 (42000)的错误,需要修改一下load data的语句。

原始sql:

load data local infile 'MRCONSO.RRF' 
into table MRCONSO 
fields terminated by '|' 
ESCAPED BY '' 
lines terminated by @LINE_TERMINATION@

修改建议:

将 @LINE_TERMINATION@ 替换为有效字符串

  • '\n' (Unix/Linux)
  • '\r\n' (Windows)

2. 如果提前已经在环境变量中配置好mysql的路径,则populate_mysql_db.bat需要修改一下。将命令行语句的%MYSQL_HOME%\bin\mysql直接修改为mysql即可。

REFERENCE

UMLS - Load Scripts

Windows 安装并配置 MySQL 5.6_mysql 5.6 安装-CSDN博客

http://www.lryc.cn/news/540919.html

相关文章:

  • 23种设计模式 - 空对象模式
  • Redis三剑客解决方案
  • 大学本科教务系统设计方案,涵盖需求分析、架构设计、核心模块和技术实现要点
  • Docker Mysql 数据迁移
  • ubuntu22.04离线安装K8S
  • 微信小程序中将图片截图为正方形(自动居中)
  • 传统的自动化行业的触摸屏和上位机,PLC是否会被取代?
  • 【论文精读】VLM-AD:通过视觉-语言模型监督实现端到端自动驾驶
  • 2024年数字政府服务能力优秀创新案例汇编(附下载)
  • Ollama Docker 镜像部署
  • [深度学习][python]yolov12+bytetrack+pyqt5实现目标追踪
  • 【深度学习】矩阵的理解与应用
  • 我是如何从 0 到 1 找到 Web3 工作的?
  • 《Keras 3 :使用 Vision Transformers 进行物体检测》:此文为AI自动翻译
  • java(spring boot)实现向deepseek/GPT等模型的api发送请求/多轮对话(附源码)
  • module ‘cv2.dnn‘ has no attribute ‘DictValue‘解决办法
  • 将RocketMQ集成到了Spring Boot项目中,实现站内信功能
  • Deepseek 怼CHATGPT实况
  • 基础篇11-图像分割(上)--阈值的方法
  • [特殊字符] LeetCode 62. 不同路径 | 动态规划+递归优化详解
  • 常用的 JVM 参数:配置与优化指南
  • 【JavaWeb学习Day17】
  • DeepSeek 提示词:定义、作用、分类与设计原则
  • 前端大文件上传
  • JDK源码系列(一)Object
  • 【Python 打造高效文件分类工具】
  • 大数据组件(四)快速入门实时数据湖存储系统Apache Paimon(1)
  • 边缘安全加速(Edge Security Acceleration)
  • C/C++高性能Web开发框架全解析:2025技术选型指南
  • fedora 安装 ffmpeg 过程记录