账户合并

难度:

标签:

题目描述

代码结果

运行时间: 55 ms, 内存: 18.5 MB

/*
  思路：
  1. 使用Java Stream进行数据处理。
  2. 主要逻辑和上面类似，但使用Stream API来简化代码。
  3. 通过stream进行email到根节点的映射，然后使用stream收集最终结果。
*/
import java.util.*;
import java.util.stream.Collectors;
 
public class SolutionStream {
    private Map<String, String> parent = new HashMap<>();
    private Map<String, String> emailToName = new HashMap<>();
 
    public List<List<String>> accountsMerge(List<List<String>> accounts) {
        accounts.forEach(account -> {
            String name = account.get(0);
            account.stream().skip(1).forEach(email -> {
                parent.putIfAbsent(email, email);
                emailToName.putIfAbsent(email, name);
                union(account.get(1), email);
            });
        });
 
        Map<String, TreeSet<String>> unions = parent.keySet().stream().collect(Collectors.groupingBy(this::find, Collectors.toCollection(TreeSet::new)));
 
        return unions.values().stream()
                .map(emails -> {
                    List<String> account = new ArrayList<>(emails);
                    account.add(0, emailToName.get(account.get(0)));
                    return account;
                })
                .collect(Collectors.toList());
    }
 
    private String find(String email) {
        return parent.get(email).equals(email) ? email : find(parent.get(email));
    }
 
    private void union(String email1, String email2) {
        String root1 = find(email1);
        String root2 = find(email2);
        if (!root1.equals(root2)) {
            parent.put(root1, root2);
        }
    }
}

解释

方法:

这个题解使用了并查集的思路来解决账户合并问题。首先，为每个账户分配一个唯一的编号，然后遍历所有账户的邮箱地址，将具有相同邮箱地址的账户合并到一个集合中。最后，遍历并查集，将属于同一个集合的邮箱地址合并到一起，并按照字典序排序，与账户名一起作为结果返回。

时间复杂度:

O(nmlogm)，其中 n 为账户数量，m 为每个账户邮箱地址数量的上限。

空间复杂度:

O(nm)，其中 n 为账户数量，m 为每个账户邮箱地址数量的上限。

代码细节讲解

🦆

在账户合并的问题中，为什么选择使用并查集而不是其他数据结构如哈希表或图？

▷

并查集是一种特别适用于处理动态连通性问题的数据结构，能够高效地合并集合并快速确定元素的归属关系。账户合并问题本质上是一个动态连通性问题，因为我们需要将拥有共同邮箱的账户组合在一起。虽然使用哈希表或图也可以解决这个问题，但并查集在这种特定场景下更加高效与直接。使用哈希表或图通常需要额外的数据结构或算法（如DFS或BFS）来遍历和合并节点，这在实现和效率上可能不如并查集直接。并查集通过简单的路径压缩和秩合并策略，提供了更快的合并和查找操作，特别适合处理大量元素和动态连接问题。

🦆

并查集在执行路径压缩时如何确保不会破坏已有的集合结构，特别是当存在多个邮箱共享时？

▷

路径压缩是并查集优化策略之一，其主要目的是加快后续查找操作的速度。在路径压缩过程中，我们将查找路径上的每个节点直接链接到根节点，这样能够减少后续操作的路径长度。路径压缩虽然改变了节点间的直接连接关系，但并不会改变集合的成员关系。即使多个邮箱共享，路径压缩只是改变了内部结构以提高效率，但集合中包含的元素和它们的归属关系保持不变。因此，路径压缩能够在不破坏集合结构的前提下，提高并查集的操作效率。

🦆

在构建emailToAcc映射时，如果两个不同的账户有相同的邮箱，如何处理这种冲突以保证正确的账户合并？

▷

在构建emailToAcc映射时，如果遇到两个不同的账户共享同一个邮箱地址，我们使用并查集的union操作将这两个账户的节点合并。具体来说，当一个邮箱地址在映射中已存在时，我们通过并查集将当前遍历到的账户与该邮箱已映射的账户合并。这样，即使多个账户通过共享邮箱间接地连接，它们也会被正确地归入一个集合。并查集的union操作确保了所有共享同一邮箱的账户最终都属于同一个集合，从而实现正确的账户合并。

🦆

合并过程中，如何保证最终输出的账户名称是正确的，尤其是当多个账户因为共享邮箱而合并时？

▷

在最终输出合并账户的过程中，我们选择集合代表（即根节点）的账户名作为合并后账户的名称。这是因为在并查集中，每个集合的代表节点是稳定确定的，而我们在遍历邮箱和账户时，将每个邮箱映射到了最初遍历到的账户（即根节点的账户）。因此，当我们从并查集中取出一个集合所有的邮箱地址时，我们可以直接使用这个集合的代表节点，也就是根节点对应的账户名，作为最终合并账户的名称。这样确保了即使多个账户因为共享邮箱而合并，输出的账户名称依然是正确和一致的。

账户合并

题目描述

代码结果

解释

代码细节讲解

相关问题

冗余连接

句子相似性

句子相似性 II