当前位置: 首页 > news >正文

2024妈妈杯数学建模B题思路-甲骨文智能识别中原始拓片单字自动分割与识别研究

# 1 赛题
B 题 甲骨文智能识别中原始拓片单字自动分割与识别研究
甲骨文是我国目前已知的最早成熟的文字系统,它是一种刻在龟甲或 兽骨上的古老文字。甲骨文具有极其重要的研究价值,不仅对中国文明的 起源具有重要意义,也对世界文明的研究有着深远影响。 在我国政府的大 力推动下,甲骨文研究已经进入一个全新的发展阶段。 人工智能和大数据 技术被应用于甲骨文全息性研究及数字化工程建设,成为甲骨文信息处理领域的研究热点[1]。

甲骨文拓片图像分割是甲骨文数字化工程的基础问题,其目的是利用 数字图像处理和计算机视觉技术, 在甲骨文原始拓片图像的复杂背景中提 取出特征分明且互不交叠的独立文字区域。它是甲骨文字修复、 字形复原 与建模、文字识别、拓片缀合等处理的技术基础[2]。然而,甲骨拓片图像 分割往往受到点状噪声、人工纹理和固有纹理三类干扰元素的严重影响[3]。 且甲骨文图像来源广泛,包括拓片、拍照、扫描、临摹等,不同的图像来 源,其干扰元素的影响是不同的。由于缺乏对甲骨文字及其干扰元素的形 态先验特征的特殊考量,通用的代表性图像分割方法目前尚不能对甲骨文 原始拓片图像中的文字目标和点状噪声、人工纹理、固有纹理进行有效判 别,其误分割率较高,在处理甲骨拓片图像时均有一定局限性。如何从干 扰众多的复杂背景中准确地分割出独立文字区域,仍然是一个重待解决的具有挑战性的问题。

图 1 为一张甲骨文原始拓片的图像分割示例,左图为一整张甲骨文原始拓片, 右图即为利用图像分割算法[4]实现的拓片图像上甲骨文的单字分 割。甲骨文的同一个字会有很多异体字,这无疑增加了甲骨文识别的难度,图 2 展示了甲骨文中“人 ”字的不同异体字。
在这里插入图片描述
在这里插入图片描述
现希望通过对已标记的甲骨文图像进行分析、特征提取和建模,从而 实现对一张新的甲骨文图像进行单个文字的自动分割和识别。具体任务如下:

问题 1:对于附件 1(Pre_test 文件夹) 给定的三张甲骨文原始拓片图 片进行图像预处理,提取图像特征,建立甲骨文图像预处理模型,实现对甲骨文图像干扰元素的初步判别和处理。
问题 2:对甲骨文原始拓片图像进行分析,建立一个快速准确的甲骨 文图像分割模型,实现对不同的甲骨文原始拓片图像进行自动单字分割, 并从不同维度进行模型评估。其中附件 2(Train 文件夹) 为已标注分割的数据集。
问题 3:利用建立的甲骨文图像分割模型对附件 3(Test 文件夹) 中的 200 张甲骨文原始拓片图像进行自动单字分割, 并将分割结果放在“Test_results.xlsx ”中,此文件单独上传至竞赛平台。
问题 4:基于前三问对甲骨文原始拓片图像的单字分割研究, 请采用 合适的方法进行甲骨文原始拓片的文字识别, 附件 4(Recognize 文件夹) 中给出了部分已标注的甲骨文字形(不限于此训练集,可自行查找其他资 料,如使用外部资料需在论文中注明来源),请对测试集中的50 张甲骨文原始拓片图像进行文字自动识别, 并以适当结果呈现。

2 解题思路

B题实际上非常简单,熟悉CV的同学看到这道题肯定眼熟的不行,其实这个题目跟我们CV做烂的车牌识别的套路是一样的,还要不少大大聪明在不断的找甲骨文识别资料,太搞笑了。

预处理部分做滤波和形态学操作就行。

第二问,常用的字符分割方法包括基于阈值的方法、基于连通域的方法、投影法、边缘检测等。

第四问简直和车牌识别中的字符识别一模一样,而且数据集题目还给整理好了,直接VGG16训练就完了。

思路已出

在这里插入图片描述

🥇 最新思路更新(看最新发布的文章即可):
https://blog.csdn.net/dc_sinor?type=blog

3 选题分析

A题属于目标优化问题,还结合了动态规划问题,别看题目描述的复杂,只要构建好目标函数就能轻松解决

B题这种类型的题目这几年出的还不少呀,就是机器学习或深度学习的图像目标检测

C题是一个典型的运筹学问题,涉及到预测模型的建立和优化排班策略的制定。解决这个问题需要综合运用统计学、机器学习、优化算法等多学科知识。

D题该问题是一个典型的优化问题,需要综合考虑多个因素,如设备性能、矿山条件、成本和风险等

本次建模题目难度(由高到低) B>A>D>C

!!!A君会先出C题思路!!!

4 最新思路更新

🥇 最新思路更新(看最新发布的文章即可):
https://blog.csdn.net/dc_sinor?type=blog

http://www.lryc.cn/news/337081.html

相关文章:

  • sql 之 索引
  • 创建基于Node的WebSocket服务
  • Flask快速搭建文件上传服务与接口
  • AI算力报告:算力大时代,AI算力产业链全景梳理
  • 点击上传文件
  • 文件上传【2】--靶场通关
  • uniapp请求后端接口
  • 第十三章 OpenGL ES-RGB、HSV、HSL模型介绍
  • 微软卡内基梅隆大学:无外部干预,GPT4等大语言模型难以自主探索
  • 探索设计模式的魅力:简单工厂模式
  • 【数据结构】-----双链表(小白必看!!!)
  • 【数据结构】考研真题攻克与重点知识点剖析 - 第 8 篇:排序
  • 数字乡村可视化大数据-DIY拖拽式设计
  • 数据集学习
  • 【解决】npm run dev Syntax Error: TypeError: eslint.CLIEngine is not a constructor
  • Android 如何通过屏幕大小来适配不同大小的图片
  • 【面试题】细说mysql中的各种锁
  • TMS320F280049 EPWM模块--TZ子模块(6)
  • 数字乡村创新实践探索农业现代化路径:科技赋能农业产业升级、提升乡村治理效能与农民幸福感
  • linux中rpm包与deb包的区别及使用
  • Linux中安装seata
  • 预印本仓库ArXiv——防止论文录用前被别人剽窃
  • LNMP 架构
  • 谈谈Python中的单元测试和集成测试
  • 【2024】Prometheus通过node_exporter都监控了什么
  • Centos7配置秘钥实现集群免密登录
  • Android匿名共享内存(Ashmem)
  • MySOL之旅--------MySQL数据库基础( 3 )
  • 阿药陪你学Java(第零讲)
  • 华院计算参编《金融业人工智能平台技术要求》标准