当前位置: 首页 > news >正文

统计单词数

统计单词数

题目描述

一般的文本编辑器都有查找单词的功能,该功能可以快速定位特定单词在文章中的位置,有的还能统计出特定单词在文章中出现的次数。

现在,请你编程实现这一功能,具体要求是:给定一个单词,请你输出它在给定的文章中出现的次数和第一次出现的位置。注意:匹配单词时,不区分大小写,但要求完全匹配,即给定单词必须与文章中的某一独立单词在不区分大小写的情况下完全相同(参见样例 1),如果给定单词仅是文章中某一单词的一部分则不算匹配(参见样例 2)。

输入格式

共 2行。

第 1 行为一个字符串,其中只含字母,表示给定单词;

第 2 行为一个字符串,其中只可能包含字母和空格,表示给定的文章。

输出格式

一行,如果在文章中找到给定单词则输出两个整数,两个整数之间用一个空格隔开,分别是单词在文章中出现的次数和第一次出现的位置(即在文章中第一次出现时,单词首字母在文章中的位置,位置从 0 开始);如果单词在文章中没有出现,则直接输出一个整数 −1。

注意:空格占一个字母位

输入输出样例

输入 #1

To
to be or not to be is a question

输出 #1

2 0

输入 #2

to
Did the Ottoman Empire lose its power at that time

输出 #2

-1

说明/提示

数据范围

1≤ 第一行单词长度 ≤10。

1≤ 文章长度 ≤10^6。

这道题我先说一下错误思路,算是提供一下反例吧,

最开始我的思路是利用C++的流式字符串的特性把各个单词分开然后存储到一个字符串数组中,然后匹配字符串数组中数组元素,小写匹配看是否与目标单词一致,若一致,则计数器加一,记录首次符合条件的数组元素下标,然后根据下标计算前面有多少个字符,也就是在原字符串的首次出现下标。

这里面其实有个关键问题,就是我们并不能确定每个单词之间相隔多少个空格

这就导致了我们在流式操作后,无法计算得到正确的首次出现的下标位置


没办法,这种操作是行不通的,那么只能传统的使用滑动窗口的方式了,

设置滑动窗口大小为目标单词长度,再均变为小写字母后遍历字符串的对应窗口,看窗口内字符是否与目标单词匹配。这里面要注意循环时的结束条件,应为字符串长度-滑动窗口长度+1

当然,还有之后还有一步判断,就是保证成功匹配的是一个独立的单词而不是某单词的前缀,

这要求若滑动窗口不在首尾,前后一定是空格

若上述条件均满足,计数器加一,记录首次出现的位置即可

#include<bits/stdc++.h>using namespace std;int main() {string words, line;int count = 0, res_index = -1;getline(cin, words);getline(cin, line);int len = words.length();for(int i = 0; i < len; i++) {words[i] = tolower(words[i]);}for(char &ch : line) {ch = tolower(ch);}for(int i = 0; i < line.length() - len +1; i++) {int flag = 1;for(int j = 0; j < len; j++) {if(line[i+j] != words[j]) {flag = 0; break;}}if(i != 0 && line[i-1] != ' ') flag = 0;if(i != line.length() - len && line[i+len] != ' ') flag = 0;if(flag == 1) {count++;if(res_index == -1) res_index = i;}}if(res_index == -1) cout << -1 << endl;else {cout << count << " " << res_index << endl;}return 0;
}
http://www.lryc.cn/news/323341.html

相关文章:

  • c++pair的用法
  • 石油炼化5G智能制造工厂数字孪生可视化平台,推进行业数字化转型
  • IP代理技术革新:探索数据采集的新路径
  • 流畅的 Python 第二版(GPT 重译)(一)
  • Vue+jquery+jquery.maphilight实现图片热区高亮以及点击效果
  • 靠谱!朋友圈一键转发和自动转发好友朋友圈
  • 线性顺序表算法库
  • java分割等和子集(力扣Leetcode416)
  • 383. 赎金信
  • 【二】【单片机】有关独立按键的实验
  • AJAX踩坑指南(知识点补充)
  • 备战蓝桥杯Day29 - 拼接最大数字问题
  • 基于springboot的mysql实现读写分离
  • Python爬虫之Scrapy框架系列(24)——分布式爬虫scrapy_redis完整实战【XXTop250完整爬取】
  • 提升效率,稳定可靠:亚信安慧AntDB的企业价值
  • 洛谷入门——P1567 统计天数
  • C++概述
  • Linux学习笔记16 - 系统命令
  • 读书笔记--阅读华为数据治理之旅有感
  • 网络安全协议基本问题
  • 面试(一)
  • libVLC windows开发环境搭建
  • 【Netty】Netty的使用和常用组件详解
  • Legacy|电脑Windows系统如何迁移到新安装的硬盘?系统迁移详细教程!
  • Windows 11 安装 Scoop
  • 新能源汽车小三电系统
  • 面试问答示范
  • 嵌入式3-22
  • JAVA Synchronized对象锁和类锁区别(牛逼)
  • 力扣算法题之好数对的数目