当前位置: 首页 > news >正文

【华为OD机试真题2023CD卷 JAVAJS】中文分词模拟器

华为OD2023(C&D卷)机试题库全覆盖,刷题指南点这里

中文分词模拟器

知识点图字符串

时间限制:5s 空间限制:256MB 限定语言:不限

题目描述:

给定一个连续不包含空格字符串,该字符串仅包含英文小写字母及英文文标点符号(逗号、分号、句号),同时给定词库,对该字符串进行精确分词。
说明:
1.精确分词: 字符串分词后,不会出现重叠。即“ilovechina” ,不同词库可分割为 “i,love,china” “ilove,china”,不能分割出现重叠的"i,ilove,china",i重叠出现
2.标点符号不成词,仅用于断句
3.词库:根据外部知识库统计出来的常用词汇例:dictionary=["i","love","china","lovechina","ilove"], 
4.分词原则:采用分词顺序优先且最长匹配原则
“ilovechina”,假设分词结果  [ i,ilove,lo,love,ch,china,lovechina ] 则输出 [ilove,china] 
 错误输出:[i,lovechina],     
http://www.lryc.cn/news/277619.html

相关文章:

  • 基于YOLOv8-pose的画笔关键点(bic_markers)检测
  • 【实用技巧】Windows 电脑向iPhone或iPad传输视频方法1:无线传输
  • 爬虫实战 - 微博评论数据可视化
  • python装饰器嵌套基础
  • C语言之三子棋小游戏的应用
  • 优雅处理并发:Java CompletableFuture最佳实践
  • 熟悉HDFS常用操作
  • Adobe XD是什么?探索这款创新的用户体验设计工具
  • java常用应用程序编程接口(API)——ArrayList概述及使用案例
  • 2024年了,Layui再战三年有问题不?
  • 消息队列-RocketMQ-概览与搭建
  • Vue3技术解析(小册子)
  • 即将消失的五种编程语言?
  • c++学习:STL库(框架)+字符串模板类string+vector容器+list链表
  • 2023年全国职业院校技能大赛(高职组)“云计算应用”赛项赛卷④
  • 使用Scikit Learn 进行识别手写数字
  • GB/T 15036-2018 实木地板检测
  • 基于ElementUI封装的下拉树选择可搜索单选多选清空功能
  • 计算机网络-各层协议
  • LeetCode 84:柱状图中的最大矩形
  • 老生重谈:大模型的「幻觉」问题
  • golang实现skiplist 跳表
  • 尝试OmniverseFarm的最基础操作
  • 第28关 k8s监控实战之Prometheus(二)
  • 基于 SpringBoot + magic-api + Vue3 + Element Plus + amis3.0 快速开发管理系统
  • Kafka(四)Broker
  • 代码随想录第五十二天——最长递增子序列,最长连续递增序列,最长重复子数组
  • 【大数据架构】OLAP实时分析引擎选型
  • 代码随想录刷题题Day29
  • CVE-2023-51385 OpenSSH ProxyCommand命令注入漏洞