统计子串中的唯一字符

难度:

标签:

题目描述

Let's define a function countUniqueChars(s) that returns the number of unique characters in s.

For example, calling countUniqueChars(s) if s = "LEETCODE" then "L", "T", "C", "O", "D" are the unique characters since they appear only once in s, therefore countUniqueChars(s) = 5.

Given a string s, return the sum of countUniqueChars(t) where t is a substring of s. The test cases are generated such that the answer fits in a 32-bit integer.

Notice that some substrings can be repeated so in this case you have to count the repeated ones too.

Example 1:

Input: s = "ABC"
Output: 10
Explanation: All possible substrings are: "A","B","C","AB","BC" and "ABC".
Every substring is composed with only unique letters.
Sum of lengths of all substring is 1 + 1 + 1 + 2 + 2 + 3 = 10

Example 2:

Input: s = "ABA"
Output: 8
Explanation: The same as example 1, except countUniqueChars("ABA") = 1.

Example 3:

Input: s = "LEETCODE"
Output: 92

Constraints:

1 <= s.length <= 10⁵
s consists of uppercase English letters only.

代码结果

运行时间: 142 ms, 内存: 20.6 MB

解释

方法:

本题解使用了哈希表（字典）来统计字符串中每个字符的所有出现索引。对于每个字符，我们将字符在字符串中的所有索引存储在一个列表中，并额外在每个列表的末尾添加字符串长度作为边界。接着，针对每个字符的索引列表，计算每个字符在其每个出现位置的唯一性对于子字符串的贡献。具体方法是，对于列表中的每个索引，计算该索引与前一个索引之间的差值，并乘以该索引与下一个索引之间的差值。这样计算的结果即为该字符对所有子字符串中的唯一字符数的总贡献。

时间复杂度:

O(n)

空间复杂度:

O(n)

代码细节讲解

🦆

为什么在每个字符的索引列表末尾添加字符串长度作为边界，这一操作有什么特别的含义或作用？

▷

在每个字符的索引列表末尾添加字符串长度作为边界，是为了方便计算字符串尾部字符对应的子字符串的数量。具体来说，对于字符串中的最后一个字符或任何字符的最后一个出现位置，我们需要一个边界值来标示从此位置到字符串结尾的子串范围。添加字符串长度作为边界，可以使得计算逻辑统一，避免在循环中进行特殊判断，简化了代码的复杂性。

🦆

在计算每个字符对子字符串唯一性的贡献时，`(c - l + 1) * (r - c)` 这个计算公式是如何得出的？请问这里的每个变量代表什么意义？

▷

在此计算公式中，`l`、`c`和`r`分别表示当前考虑的字符的前一个索引、当前索引和下一个索引。公式`(c - l + 1) * (r - c)`计算的是以当前字符`c`为唯一字符的所有可能的子字符串的数量。其中`(c - l + 1)`代表从位置`l+1`到位置`c`（包括c）之间的子串数量，`(r - c)`表示从位置`c`到位置`r-1`之间的子串数量。因此，乘积`(c - l + 1) * (r - c)`给出的是以当前位置字符为唯一字符的子字符串的总数。

🦆

算法中提到的`遍历字符串并构建字符的索引列表`的过程能否详细解释一下，尤其是如何处理字符重复出现的情况？

▷

在遍历字符串并构建字符的索引列表的过程中，我们使用一个哈希表（字典）来记录每个字符及其出现的所有索引。遍历字符串的每个字符时，我们查看该字符是否已经在字典中有对应的索引列表，如果有，则将当前的索引添加到该列表中；如果没有，则在字典中为这个字符创建一个新的列表，并添加当前索引。这样，每个字符的所有出现位置就会被顺序存储在列表中。通过这种方式，我们可以轻松处理字符的重复出现情况，并且能够快速访问任何字符的所有出现索引。

统计子串中的唯一字符

题目描述

代码结果

解释

代码细节讲解

相关问题