扰乱字符串

难度:

标签:

题目描述

使用下面描述的算法可以扰乱字符串 s 得到字符串 t ：

如果字符串的长度为 1 ，算法停止
如果字符串的长度 > 1 ，执行下述步骤：
- 在一个随机下标处将字符串分割成两个非空的子字符串。即，如果已知字符串 s ，则可以将其分成两个子字符串 x 和 y ，且满足 s = x + y 。
- 随机决定是要「交换两个子字符串」还是要「保持这两个子字符串的顺序不变」。即，在执行这一步骤之后，s 可能是 s = x + y 或者 s = y + x 。
- 在 x 和 y 这两个子字符串上继续从步骤 1 开始递归执行此算法。

给你两个 长度相等 的字符串 s1 和 s2，判断 s2 是否是 s1 的扰乱字符串。如果是，返回 true ；否则，返回 false 。

示例 1：

输入：s1 = "great", s2 = "rgeat"
输出：true
解释：s1 上可能发生的一种情形是：
"great" --> "gr/eat" // 在一个随机下标处分割得到两个子字符串
"gr/eat" --> "gr/eat" // 随机决定：「保持这两个子字符串的顺序不变」
"gr/eat" --> "g/r / e/at" // 在子字符串上递归执行此算法。两个子字符串分别在随机下标处进行一轮分割
"g/r / e/at" --> "r/g / e/at" // 随机决定：第一组「交换两个子字符串」，第二组「保持这两个子字符串的顺序不变」
"r/g / e/at" --> "r/g / e/ a/t" // 继续递归执行此算法，将 "at" 分割得到 "a/t"
"r/g / e/ a/t" --> "r/g / e/ a/t" // 随机决定：「保持这两个子字符串的顺序不变」
算法终止，结果字符串和 s2 相同，都是 "rgeat"
这是一种能够扰乱 s1 得到 s2 的情形，可以认为 s2 是 s1 的扰乱字符串，返回 true

示例 2：

输入：s1 = "abcde", s2 = "caebd"
输出：false

示例 3：

输入：s1 = "a", s2 = "a"
输出：true

提示：

s1.length == s2.length
1 <= s1.length <= 30
s1 和 s2 由小写英文字母组成

代码结果

运行时间: 32 ms, 内存: 16.2 MB

/*
 * 使用 Java Stream API 判断字符串 s2 是否是 s1 的扰乱字符串
 * 主要是简化字符频率的检查过程
 */
import java.util.stream.IntStream;
import java.util.stream.Stream;
 
public class SolutionStream {
    public boolean isScramble(String s1, String s2) {
        if (s1.equals(s2)) return true;
        if (s1.length() != s2.length()) return false;
 
        int n = s1.length();
        int[] count = new int[26];
 
        IntStream.range(0, n).forEach(i -> {
            count[s1.charAt(i) - 'a']++;
            count[s2.charAt(i) - 'a']--;
        });
 
        if (IntStream.of(count).anyMatch(c -> c != 0)) return false;
 
        return IntStream.range(1, n).anyMatch(i ->
            (isScramble(s1.substring(0, i), s2.substring(0, i)) && isScramble(s1.substring(i), s2.substring(i))) ||
            (isScramble(s1.substring(0, i), s2.substring(n - i)) && isScramble(s1.substring(i), s2.substring(0, n - i)))
        );
    }
}

解释

方法:

这个题解使用了记忆化搜索的方法。首先判断两个字符串是否相等，如果相等直接返回True。然后通过check函数找出所有可能的分割点，即两个字符串在该位置之前的部分所包含的字符相同。接着对于每个分割点，递归判断两个字符串分割后的左右两部分是否分别满足扰乱字符串的定义。在递归过程中，使用一个字典self.compare存储已经计算过的子问题的结果，避免重复计算。如果按顺序分割的情况不满足，就再尝试将s2反转后再进行分割判断。最后如果所有分割点都无法满足条件，则返回False。

时间复杂度:

O(n^3)，但实际运行时间低于O(n^3)

空间复杂度:

O(n^2)

代码细节讲解

🦆

在函数`check`中，你是如何决定哪些位置可以作为分割点的？

▷

在`check`函数中，通过逐个比较`s1`和`s2`中对应位置的字符，并维护两个列表`in_s1_notin_s2`和`in_s2_notin_s1`来记录当前位置前`s1`中有而`s2`中没有的字符，以及`s2`中有而`s1`中没有的字符。每次当这两个列表都为空时，说明到当前位置为止，`s1`和`s2`包含相同的字符集合，因此这个位置就可以作为一个潜在的分割点。分割点的选择是基于两个字符串在该位置之前的部分包含相同的字符。

🦆

为什么在决定无法通过当前分割点继续判断后，需要将`s2`反转再进行一次检查？

▷

因为扰乱字符串的定义允许在任何位置将一个字符串分成两部分并交换这两部分的顺序。所以，即使按原始顺序的分割未能证明两个字符串是扰乱字符串，交换`s2`的任意两部分后的新顺序可能会满足条件。因此，当按顺序分割的所有可能都被尝试且失败后，我们将`s2`反转，这相当于在递归过程中尝试了另一种分割方式，即交换了`s2`的左右两部分，然后再次使用`check`函数寻找新的分割点进行判断。

🦆

记忆化搜索中使用的字典`self.compare`的键值对是如何构建的？键和值分别代表什么？

▷

记忆化搜索中使用的字典`self.compare`的键是由`s1`和`s2`两个字符串通过下划线连接构成的字符串（例如`s1_s2`），代表一个特定的子问题。值是一个布尔值，表示这个子问题的结果，即字符串`s1`是否可以通过扰乱字符串的规则转换成字符串`s2`。这种方式存储每个子问题的结果可以避免重复计算相同的问题，提高算法效率。

🦆

如果`s1`和`s2`的长度为1时，为什么直接比较它们是否相等就足够了？

▷

当`s1`和`s2`的长度为1时，两个字符串都只包含一个字符。由于扰乱字符串的定义涉及字符的重新排列，如果两个字符串只有一个字符，那么唯一的排列方式就是字符本身。因此，这种情况下，直接比较这两个字符是否相等即可确定它们是否是扰乱字符串的关系。这是最基本的边界条件，为递归提供了停止点。

扰乱字符串

题目描述

代码结果

解释

代码细节讲解

相关问题