leetcode
leetcode 1 ~ 50
正则表达式匹配

正则表达式匹配

难度:

标签:

题目描述

给你一个字符串 s 和一个字符规律 p,请你来实现一个支持 '.' 和 '*' 的正则表达式匹配。

  • '.' 匹配任意单个字符
  • '*' 匹配零个或多个前面的那一个元素

所谓匹配,是要涵盖 整个 字符串 s的,而不是部分字符串。

 

示例 1:

输入:s = "aa", p = "a"
输出:false
解释:"a" 无法匹配 "aa" 整个字符串。

示例 2:

输入:s = "aa", p = "a*"
输出:true
解释:因为 '*' 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 'a'。因此,字符串 "aa" 可被视为 'a' 重复了一次。

示例 3:

输入:s = "ab", p = ".*"
输出:true
解释:".*" 表示可匹配零个或多个('*')任意字符('.')。

 

提示:

  • 1 <= s.length <= 20
  • 1 <= p.length <= 20
  • s 只包含从 a-z 的小写字母。
  • p 只包含从 a-z 的小写字母,以及字符 . 和 *
  • 保证每次出现字符 * 时,前面都匹配到有效的字符

代码结果

运行时间: 40 ms, 内存: 15.3 MB


/*
题目思路:
1. 使用 Stream 来简化代码,仍然使用 dp 数组来记录匹配情况。
2. 使用两个嵌套的 Stream.iterate 代替 for 循环。
3. 通过遍历字符串 s 和模式 p 来动态更新 dp 数组。
4. 最终返回 dp 数组的最后一个值。
*/
 
import java.util.stream.Stream;
 
public class Solution {
    public boolean isMatch(String s, String p) {
        int m = s.length();
        int n = p.length();
        boolean[][] dp = new boolean[m + 1][n + 1];
        dp[0][0] = true;
 
        Stream.iterate(0, i -> i + 1).limit(m + 1).forEach(i -> {
            Stream.iterate(1, j -> j + 1).limit(n + 1).forEach(j -> {
                if (p.charAt(j - 1) == '*') {
                    dp[i][j] = dp[i][j - 2];
                    if (i > 0 && (s.charAt(i - 1) == p.charAt(j - 2) || p.charAt(j - 2) == '.')) {
                        dp[i][j] |= dp[i - 1][j];
                    }
                } else if (i > 0 && (s.charAt(i - 1) == p.charAt(j - 1) || p.charAt(j - 1) == '.')) {
                    dp[i][j] = dp[i - 1][j - 1];
                }
            });
        });
 
        return dp[m][n];
    }
}

解释

方法:

这个题解采用递归和记忆化搜索的方法来解决正则表达式匹配问题。递归函数dp(i, j)表示字符串s的前i个字符和模式串p的前j个字符是否匹配。首先处理一些边界情况,如模式串p匹配完毕或字符串s匹配完毕。然后利用记忆化搜索避免重复计算子问题。接着根据当前字符是否匹配以及模式串的下一个字符是否为'*'来分情况递归,最终返回是否匹配的结果。

时间复杂度:

O(m*n)

空间复杂度:

O(m*n)

代码细节讲解

🦆
你是如何处理正则表达式中的`*`和`.`字符的,它们在递归中的作用是什么?
'.'字符可以匹配任意单个字符,'*'字符可以匹配零个或多个前面的那一个元素。在递归中,'.'用于匹配当前字符,'*'用于处理匹配多个字符或跳过'*'的情况。
🦆
在处理字符串s匹配完毕的情况时,为什么需要检查模式串p的剩余部分是否合法?
即使字符串s已经匹配完毕,但模式串p可能还有剩余部分。需要检查剩余部分是否能够匹配空字符串,以确保整个模式串p都能被合法匹配。
🦆
递归函数dp(i, j)中,当s[i] == p[j]或p[j] == '.'时,为什么要考虑p[j+1] == '*'的情况?
因为'*'可以匹配零个或多个前面的元素,所以即使当前字符匹配成功,也需要考虑'*'的情况,以处理匹配多个字符或跳过'*'的可能性。
🦆
在记忆化搜索中,你是如何避免重复计算子问题的?具体是通过哪种数据结构实现的?
通过使用一个字典(或哈希表)来存储已经计算过的子问题的结果,从而避免重复计算。这种方法称为记忆化搜索。
🦆
时间复杂度和空间复杂度是如何计算的,能否详细解释一下?
时间复杂度是通过分析算法执行的时间随输入数据规模增长的变化趋势来计算的。空间复杂度是通过分析算法在执行过程中占用的内存空间随输入数据规模增长的变化趋势来计算的。在这个题解中,时间复杂度和空间复杂度都是O(m*n),其中m和n分别是字符串s和模式串p的长度。

相关问题

通配符匹配

给你一个输入字符串 (s) 和一个字符模式 (p) ,请你实现一个支持 '?''*' 匹配规则的通配符匹配:
  • '?' 可以匹配任何单个字符。
  • '*' 可以匹配任意字符序列(包括空字符序列)。

判定匹配成功的充要条件是:字符模式必须能够 完全匹配 输入字符串(而不是部分匹配)。

 

示例 1:

输入:s = "aa", p = "a"
输出:false
解释:"a" 无法匹配 "aa" 整个字符串。

示例 2:

输入:s = "aa", p = "*"
输出:true
解释:'*' 可以匹配任意字符串。

示例 3:

输入:s = "cb", p = "?a"
输出:false
解释:'?' 可以匹配 'c', 但第二个 'a' 无法匹配 'b'。

 

提示:

  • 0 <= s.length, p.length <= 2000
  • s 仅由小写英文字母组成
  • p 仅由小写英文字母、'?''*' 组成