压缩字符串

难度:

标签:

题目描述

给你一个字符数组 chars ，请使用下述算法压缩：

从一个空字符串 s 开始。对于 chars 中的每组 连续重复字符 ：

如果这一组长度为 1 ，则将字符追加到 s 中。
否则，需要向 s 追加字符，后跟这一组的长度。

压缩后得到的字符串 s 不应该直接返回 ，需要转储到字符数组 chars 中。需要注意的是，如果组长度为 10 或 10 以上，则在 chars 数组中会被拆分为多个字符。

请在 修改完输入数组后 ，返回该数组的新长度。

你必须设计并实现一个只使用常量额外空间的算法来解决此问题。

示例 1：

输入：chars = ["a","a","b","b","c","c","c"]
输出：返回 6 ，输入数组的前 6 个字符应该是：["a","2","b","2","c","3"]
解释："aa" 被 "a2" 替代。"bb" 被 "b2" 替代。"ccc" 被 "c3" 替代。

示例 2：

输入：chars = ["a"]
输出：返回 1 ，输入数组的前 1 个字符应该是：["a"]
解释：唯一的组是“a”，它保持未压缩，因为它是一个字符。

示例 3：

输入：chars = ["a","b","b","b","b","b","b","b","b","b","b","b","b"]
输出：返回 4 ，输入数组的前 4 个字符应该是：["a","b","1","2"]。
解释：由于字符 "a" 不重复，所以不会被压缩。"bbbbbbbbbbbb" 被 “b12” 替代。

提示：

1 <= chars.length <= 2000
chars[i] 可以是小写英文字母、大写英文字母、数字或符号

代码结果

运行时间: 19 ms, 内存: 16.1 MB

/*
 * 思路：
 * 使用Java Stream的方式处理输入数组。
 * 首先将数组转化为流，然后按相邻相等字符进行分组，并统计数量。
 * 最后根据统计结果构建新的字符数组并返回长度。
 */
 
import java.util.*;
import java.util.stream.*;
 
public class Solution {
    public int compress(char[] chars) {
        List<Character> result = new ArrayList<>();
 
        IntStream.range(0, chars.length)
            .mapToObj(i -> chars[i])
            .collect(Collectors.groupingByConcurrent(c -> c, LinkedHashMap::new, Collectors.counting()))
            .forEach((k, v) -> {
                result.add(k);
                if (v > 1) {
                    for (char c : v.toString().toCharArray()) {
                        result.add(c);
                    }
                }
            });
 
        for (int i = 0; i < result.size(); i++) {
            chars[i] = result.get(i);
        }
 
        return result.size();
    }
}

解释

方法:

该题解使用了一种单趟扫描的方法来压缩字符串。整体思路是维护一个写指针`write`和一个计数器`cnt`来跟踪连续字符的个数。遍历输入字符数组`chars`，对于每个字符，如果它与前一个字符相同，则增加计数器`cnt`。如果不同或到达数组末尾，就将前一个字符和它的计数（如果`cnt`大于1）写入数组。这种方法确保了在不需要额外数组的情况下，直接在原数组上操作，从而满足空间复杂度的要求。

时间复杂度:

O(n)

空间复杂度:

O(1)

代码细节讲解

🦆

在压缩过程中，如果字符数组的最后一个字符也是一组连续字符的一部分，该算法是如何确保这组字符得到正确处理的？

▷

该算法通过在循环中包含一个虚拟的数组结束位置来处理最后一组连续字符。循环的条件是 `i` 小于 `len(chars) + 1`。当 `i` 等于 `len(chars)` 时，表示已经到达数组的虚拟结束位置，此时前一个字符是数组的最后一个字符。算法会检查并处理这最后一组字符，确保它们被正确统计并写入。这样可以保证最后一组连续字符，无论它们的长度如何，都能被正确处理和记录。

🦆

该算法中提到的`写指针write`具体有什么作用，它是如何在不使用额外空间的情况下直接修改输入数组的？

▷

写指针 `write` 在算法中用于指示当前应该写入压缩数据的位置。它从数组的起始位置开始，并随着字符的写入逐渐向右移动。每次遇到一组连续字符结束时，算法使用 `write` 指针在 `chars` 数组中直接写入该字符及其计数（如果计数大于1）。这种方式允许算法在原地修改数组，避免了使用额外的空间来存储压缩后的结果，从而实现了空间复杂度为 O(1) 的要求。

🦆

在处理计数超过1的字符组时，算法是如何处理10或更大数字的？例如，如果一个字符重复了25次，如何确保数字'25'被正确分解并存储到数组中？

▷

当字符的重复次数为10或更多时，算法通过将数字转换为字符串，然后逐个字符地将其写入 `chars` 数组中来处理这种情况。例如，如果一个字符重复了25次，算法首先将25转换为字符串 '25'，然后将 '2' 和 '5' 分别写入 `chars` 数组中 `write` 指针指示的位置。这个过程确保了无论数字的位数如何，都能被正确地分解并逐个字符地存储。

相关问题

外观数列

给定一个正整数 n ，输出外观数列的第 n 项。

「外观数列」是一个整数序列，从数字 1 开始，序列中的每一项都是对前一项的描述。

你可以将其视作是由递归公式定义的数字字符串序列：

countAndSay(1) = "1"
countAndSay(n) 是对 countAndSay(n-1) 的描述，然后转换成另一个数字字符串。

前五项如下：

1.     1
2.     11
3.     21
4.     1211
5.     111221
第一项是数字 1 
描述前一项，这个数是 1 即 “ 一 个 1 ”，记作 "11"
描述前一项，这个数是 11 即 “ 二 个 1 ” ，记作 "21"
描述前一项，这个数是 21 即 “ 一 个 2 + 一 个 1 ” ，记作 "1211"
描述前一项，这个数是 1211 即 “ 一 个 1 + 一 个 2 + 二 个 1 ” ，记作 "111221"

要描述一个数字字符串，首先要将字符串分割为最小数量的组，每个组都由连续的最多 相同字符 组成。然后对于每个组，先描述字符的数量，然后描述字符，形成一个描述组。要将描述转换为数字字符串，先将每组中的字符数量用数字替换，再将所有描述组连接起来。

例如，数字字符串 "3322251" 的描述如下图：

示例 1：

输入：n = 1
输出："1"
解释：这是一个基本样例。

示例 2：

输入：n = 4
输出："1211"
解释：
countAndSay(1) = "1"
countAndSay(2) = 读 "1" = 一 个 1 = "11"
countAndSay(3) = 读 "11" = 二 个 1 = "21"
countAndSay(4) = 读 "21" = 一 个 2 + 一 个 1 = "12" + "11" = "1211"

提示：

1 <= n <= 30

字符串的编码与解码

迭代压缩字符串

数组中重复的数据序列重建