找到处理最多请求的服务器

难度:

标签:

题目描述

你有 k 个服务器，编号为 0 到 k-1 ，它们可以同时处理多个请求组。每个服务器有无穷的计算能力但是 不能同时处理超过一个请求 。请求分配到服务器的规则如下：

第 i （序号从 0 开始）个请求到达。
如果所有服务器都已被占据，那么该请求被舍弃（完全不处理）。
如果第 (i % k) 个服务器空闲，那么对应服务器会处理该请求。
否则，将请求安排给下一个空闲的服务器（服务器构成一个环，必要的话可能从第 0 个服务器开始继续找下一个空闲的服务器）。比方说，如果第 i 个服务器在忙，那么会查看第 (i+1) 个服务器，第 (i+2) 个服务器等等。

给你一个 严格递增 的正整数数组 arrival ，表示第 i 个任务的到达时间，和另一个数组 load ，其中 load[i] 表示第 i 个请求的工作量（也就是服务器完成它所需要的时间）。你的任务是找到 最繁忙的服务器 。最繁忙定义为一个服务器处理的请求数是所有服务器里最多的。

请你返回包含所有 最繁忙服务器 序号的列表，你可以以任意顺序返回这个列表。

示例 1：

输入：k = 3, arrival = [1,2,3,4,5], load = [5,2,3,3,3] 
输出：[1] 
解释：
所有服务器一开始都是空闲的。
前 3 个请求分别由前 3 台服务器依次处理。
请求 3 进来的时候，服务器 0 被占据，所以它被安排到下一台空闲的服务器，也就是服务器 1 。
请求 4 进来的时候，由于所有服务器都被占据，该请求被舍弃。
服务器 0 和 2 分别都处理了一个请求，服务器 1 处理了两个请求。所以服务器 1 是最忙的服务器。

示例 2：

输入：k = 3, arrival = [1,2,3,4], load = [1,2,1,2]
输出：[0]
解释：
前 3 个请求分别被前 3 个服务器处理。
请求 3 进来，由于服务器 0 空闲，它被服务器 0 处理。
服务器 0 处理了两个请求，服务器 1 和 2 分别处理了一个请求。所以服务器 0 是最忙的服务器。

示例 3：

输入：k = 3, arrival = [1,2,3], load = [10,12,11]
输出：[0,1,2]
解释：每个服务器分别处理了一个请求，所以它们都是最忙的服务器。

示例 4：

输入：k = 3, arrival = [1,2,3,4,8,9,10], load = [5,2,10,3,1,2,2]
输出：[1]

示例 5：

输入：k = 1, arrival = [1], load = [1]
输出：[0]

提示：

1 <= k <= 10⁵
1 <= arrival.length, load.length <= 10⁵
arrival.length == load.length
1 <= arrival[i], load[i] <= 10⁹
arrival 保证 严格递增 。

代码结果

运行时间: 322 ms, 内存: 38.0 MB

import java.util.*;
import java.util.stream.Collectors;
import java.util.stream.IntStream;

/**
 * 使用Java Stream实现的题解：
 * 1. 使用一个优先队列（min-heap）来管理服务器的空闲时间。
 * 2. 使用一个数组来计数每个服务器处理的请求数量。
 * 3. 遍历每个请求，根据规则分配请求给相应的服务器。
 * 4. 最后找出处理请求数量最多的服务器。
 */
public class BusiestServersStream {
    public List<Integer> busiestServers(int k, int[] arrival, int[] load) {
        int[] count = new int[k];
        PriorityQueue<int[]> busy = new PriorityQueue<>(Comparator.comparingInt(a -> a[0]));
        TreeSet<Integer> available = IntStream.range(0, k).boxed().collect(Collectors.toCollection(TreeSet::new));
        for (int i = 0; i < arrival.length; i++) {
            while (!busy.isEmpty() && busy.peek()[0] <= arrival[i]) {
                available.add(busy.poll()[1]);
            }
            if (available.isEmpty()) continue;
            Integer server = available.ceiling(i % k);
            if (server == null) server = available.ceiling(0);
            busy.add(new int[]{arrival[i] + load[i], server});
            available.remove(server);
            count[server]++;
        }
        int maxCount = Arrays.stream(count).max().orElse(0);
        return IntStream.range(0, k).filter(i -> count[i] == maxCount).boxed().collect(Collectors.toList());
    }
}

解释

方法:

该题解采用了两个堆结构，一个表示可用服务器的堆（available），另一个表示忙碌服务器的堆（busy）。首先，所有服务器都是空闲的，因此将它们的索引加入到可用服务器堆中。对于每个请求，首先检查忙碌堆中是否有已经完成任务的服务器，如果有，则将其从忙碌堆中移除，并重新加入到可用堆中。之后，从可用堆中取出一个服务器处理当前请求，并将其加入到忙碌堆中。如果可用堆为空，则当前请求被丢弃。最后，统计每个服务器处理的请求数量，返回处理最多请求的服务器。

时间复杂度:

O(n log k)

空间复杂度:

O(k)

代码细节讲解

🦆

为什么在处理完忙碌的服务器后，将其重新加入到可用堆时使用的索引计算方式是`i + (id - i) % k`？这样计算的目的和原理是什么？

▷

这种索引计算方式是为了保持服务器处理请求的循环性。在这个场景中，服务器是以循环的方式处理请求的，即第 i 个请求应该由第 (i % k) 号服务器处理。当服务器从忙碌堆释放并重新加入到可用堆时，我们需要确保它在正确的位置上以保持处理请求的顺序。计算 `i + (id - i) % k` 实际上是为了计算下一个请求编号，该编号对应服务器 id 应当重新开始处理的位置。这样可以确保每个服务器都有机会按顺序处理接下来的请求。

🦆

在忙碌堆中，元组的第一个元素是`start + t`，这代表了什么？为什么这样设置是合理的？

▷

`start + t` 表示服务器完成当前请求的具体时间点。当我们将服务器及其完成时间（`start + t`）添加到忙碌堆时，这使我们能够按照服务器变为空闲的时间顺序来管理它们。使用最小堆结构，我们可以快速地从堆中得到最先完成任务的服务器，从而在该服务器变为可用时及时将其重新加入到可用堆中，提高服务器的利用率。

🦆

如果在检查忙碌堆并尝试释放服务器时，忙碌堆为空但可用堆也为空，这种情况会如何处理？请求是否被丢弃？

▷

这种情况下，由于没有任何服务器可用（无论是因为它们都处于忙碌状态，或者已经被分配出去），请求将不得不被丢弃。这种设计确保了只有在所有服务器都正忙且无法处理新请求时，请求才会被丢弃，从而尽可能地利用服务器资源。

🦆

题解中提到，如果可用堆为空，则请求被舍弃。这种设计是否意味着在某些极端情况下服务器的利用率会很低？

▷

是的，这种设计确实可能导致在某些极端情况下，如请求到达的频率极高或服务器处理请求的时间较长时，服务器的利用率会很低，因为新的请求可能会因为没有可用服务器而被丢弃。这一点突显了在设计服务器负载均衡策略时，需要根据实际的请求到达率和服务器处理能力来优化参数和策略，以提高服务器的整体利用率和响应能力。

找到处理最多请求的服务器

题目描述

代码结果

解释

代码细节讲解

相关问题