王清欢Randy 王清欢Randy
首页
  • 编程语言

    • C/C++ 学习笔记
    • Golang 学习笔记
  • 算法分析

    • LeetCode 刷题笔记
  • 操作系统

    • Linux 基础
    • Vim 实用技巧
    • Shell 脚本编程
    • GDB 学习笔记
  • 开发工具

    • Git 学习笔记
  • 分布式理论

    • 共识算法
    • 分布式事务
  • 数据库内核

    • PostgreSQL
    • Postgres-XL
  • hidb
  • pgproxy
  • 实用技巧
  • 学习方法
  • 资源分享
GitHub (opens new window)
首页
  • 编程语言

    • C/C++ 学习笔记
    • Golang 学习笔记
  • 算法分析

    • LeetCode 刷题笔记
  • 操作系统

    • Linux 基础
    • Vim 实用技巧
    • Shell 脚本编程
    • GDB 学习笔记
  • 开发工具

    • Git 学习笔记
  • 分布式理论

    • 共识算法
    • 分布式事务
  • 数据库内核

    • PostgreSQL
    • Postgres-XL
  • hidb
  • pgproxy
  • 实用技巧
  • 学习方法
  • 资源分享
GitHub (opens new window)
  • 基础算法

    • 双指针

      • 双指针基础
      • 碰撞指针
      • 快慢指针
      • 滑动窗口
    • 二分查找

      • 基础应用
      • 边界收缩
      • 局部有序
    • 排序算法

      • 01八大排序
      • 02快速排序
      • 03归并排序
      • 04桶排序
      • 05堆排序
    • 优先搜索

      • 01递归
      • 02网格结构深度优先搜索
      • 03树结构深度优先搜索
      • 04图结构深度优先搜索
      • 05网格结构广度优先搜索
      • 06树结构广度优先搜索
      • 07图结构广度优先搜索
    • 回溯算法

      • 01递归
      • 02 子集问题
      • 03 全排列问题
      • 04 组合问题
      • 05 回溯搜索问题
  • 基础数据结构

    • 线性表与哈希表

      • 01数组
      • 02栈和队列
      • 03单调栈
      • 04优先队列
      • 05双端队列
      • 06哈希表
      • 07多重集合
      • 08前缀和
      • 09数据结构设计
    • 字符串

      • 01字符串比较
      • 02回文字符串
      • 03字符串匹配
        • 03 字符串匹配
          • 28 实现 strStr()
      • 04字符串算术表达式
    • 单链表

      • 01链表基础操作
      • 02链表遍历
    • 二叉树

      • 01二叉树的属性
      • 02二叉树的操作
      • 03层次遍历
      • 04前中后序遍历
      • 05二叉搜索树的属性
      • 06二叉搜索树的操作
      • 07字典树
      • 08二叉搜索树BST
    • 图

      • 01二分图
      • 02拓扑排序
      • 03并查集
      • 04最小生成树
      • 05最短路径
  • 进阶算法

    • 贪心算法

      • 01跳跃游戏
      • 02分配问题
      • 03区间问题
    • 分治策略

    • 动态规划

      • 01一维动态规划
      • 02二维动态规划
      • 03分割型动态规划
      • 04子序列问题
      • 05背包问题
      • 06字符串编辑问题
      • 07股票交易问题
  • 其他内容

    • 数学问题

      • 01公倍数与公因数
      • 02质数问题
      • 03进制转换问题
      • 04数字字符串求和问题
      • 05众数问题
      • 06中位数问题
      • 07数字处理问题
      • 08随机数问题
    • 位运算

      • 01位运算基础
      • 02妙用异或运算
      • 03二进制特性
  • LeetCode刷题笔记
  • 基础数据结构
  • 字符串
王清欢
2023-03-24
目录

03字符串匹配

# 03 字符串匹配

# 28 实现 strStr() (opens new window)

判断一个字符串是不是另一个字符串的子字符串,并返回其位置。

输入一个母字符串和一个子字符串,输出一个整数,表示子字符串在母字符串的位置,若不存在则返回-1。

输入:haystack = "hello", needle = "ll"
输出:2

解析:

​ 解决本题一种简单的思路是暴力匹配:首先将子串和母串左端对齐;然后逐个比较对应的字符,如果发现不匹配则将子串开始匹配位置相对于母串后移动一位,同时将比较指针回溯到子串头部;重复匹配过程,直到找到对应子串,不存在则返回 -1。

class Solution {
public:
    int strStr(string haystack, string needle) {
        int m = haystack.length(), n = needle.length();
        for(int i=0;i+n<=m;++i){
            bool flag = true;
            for(int j=0;j<n;++j){
                if(haystack[j+i]!=needle[j]){
                    flag = false;
                    break;
                }
            }
            if(flag){
                return i;
            }
        }
        return -1;
    }
};

​ 上述方法的比较指针不断回溯的过程会增加时间复杂度,一种优化方法就是 KMP 算法。KMP 算法的核心思想就是通过寻找已匹配部分子串中的相同前后缀,在遇到字符不匹配的情况时,直接将子串从前缀部分移动到后缀,避免比较指针直接回溯到子串头部。

​ 如下例所示,母串和子串在第 8 个字符出现不匹配,下一步匹配操作:如果使用暴力匹配则是将匹配指针回溯到子串头部并往后移动一位再次寻找与母串左端对齐;如果使用KMP算法,可以看到子串已经匹配的相同最长前后缀为ABC,直接将整个子串从前缀位置移动到后缀,一次性移动四位,避免比较指针从头再开始匹配。

原串 暴力匹配 KMP 算法
ABCFABCFABCA ABCFABCFABCA ABCFABCFABCA
ABCFABCA 0ABCFABCA 0000ABCFABCA

​ KMP 算法的关键是在子串中找到最长前后缀,这里可以采用动态规划的思想:

​ 设置状态:构建一个数组 next[i]表示子串中对应位置 i 之前的部分串中最长前后缀的长度。

​ 状态转移方程:对于位置 i,如果下一位前后缀相同,更新相同最大前后缀的长度;如果下一位不同,则将向前回溯。

​ 初始情况:如果仅有一个字符不存在前后缀,next[0]=-1 。前缀指针从 -1 位置开始,后缀指针从 1 位置开始遍历子串。

// 计算前缀表 next
void getNext(string needle, vector<int>& next){
    int head = -1;
    next[0] = -1;
    for(int tail = 1; tail<needle.length();++tail){
        // 如果下一位不同,往前回溯,回溯到没有前缀为止(head=-1)
        while(head>-1 && needle[head+1]!=needle[tail]){
            head = next[head];
        }
        // 如果下一位相同,更新相同的最大前缀和最大后缀长,同时移动前缀指针
        if(needle[head+1]==needle[tail]){
            ++head;
        }
        next[head] = head;
    }
}

​ 一个上述计算ABCFABCA前缀表的例子:

next 索引 部分子串 最长前缀最后一个元素的位置 next[i]
0 A -1
1 AB -1
2 ABC -1
3 ABCF -1
4 ABCFA 0
5 ABCFAB 1
6 ABCFABC 2
7 ABCFABCA 2
class Solution {
public:
	// 计算前缀表 next
    void getNext(string needle, vector<int>& next){
        int head = -1;
        next[0] = -1;
        for(int tail=1;tail<needle.length();++tail){
            // 如果下一位不同,往前回溯,回溯到没有前缀为止(head=-1)
            while(head>-1 && needle[head+1]!=needle[tail]){
                head = next[head];
            }
            if(needle[head+1]==needle[tail]){
                ++head;
            }
            next[tail] = head;
        }
    }

    int strStr(string haystack, string needle) {
        int cur = -1;
        int m = haystack.size(), n = needle.size();
        // 子串为空返回 0 
        if(n==0) return 0;
        // 获取前缀表
        vector<int> next(n,-1);
        getNext(needle,next);
        for(int i=0;i<m;++i){
            while(cur>-1 && haystack[i]!=needle[cur+1]){
                cur = next[cur];
            }
            if(haystack[i]==needle[cur+1]){
                ++cur;
            }
            // 说明=cur移动到needle的最末端,此时i也指向母串中匹配子串的最后一个位置,返回此时匹配子串最左端的位置
            if(cur == n-1){
                return i - cur;
            }
        }
        return -1;
    }
};
上次更新: 2023/11/19, 12:55:48
02回文字符串
04字符串算术表达式

← 02回文字符串 04字符串算术表达式→

Theme by Vdoing | Copyright © 2023-2024 Wang Qinghuan | MIT License
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式