leetcode
leetcode 1451 ~ 1500
找到处理最多请求的服务器

找到处理最多请求的服务器

难度:

标签:

题目描述

你有 k 个服务器,编号为 0 到 k-1 ,它们可以同时处理多个请求组。每个服务器有无穷的计算能力但是 不能同时处理超过一个请求 。请求分配到服务器的规则如下:

  • 第 i (序号从 0 开始)个请求到达。
  • 如果所有服务器都已被占据,那么该请求被舍弃(完全不处理)。
  • 如果第 (i % k) 个服务器空闲,那么对应服务器会处理该请求。
  • 否则,将请求安排给下一个空闲的服务器(服务器构成一个环,必要的话可能从第 0 个服务器开始继续找下一个空闲的服务器)。比方说,如果第 i 个服务器在忙,那么会查看第 (i+1) 个服务器,第 (i+2) 个服务器等等。

给你一个 严格递增 的正整数数组 arrival ,表示第 i 个任务的到达时间,和另一个数组 load ,其中 load[i] 表示第 i 个请求的工作量(也就是服务器完成它所需要的时间)。你的任务是找到 最繁忙的服务器 。最繁忙定义为一个服务器处理的请求数是所有服务器里最多的。

请你返回包含所有 最繁忙服务器 序号的列表,你可以以任意顺序返回这个列表。

 

示例 1:

输入:k = 3, arrival = [1,2,3,4,5], load = [5,2,3,3,3] 
输出:[1] 
解释:
所有服务器一开始都是空闲的。
前 3 个请求分别由前 3 台服务器依次处理。
请求 3 进来的时候,服务器 0 被占据,所以它被安排到下一台空闲的服务器,也就是服务器 1 。
请求 4 进来的时候,由于所有服务器都被占据,该请求被舍弃。
服务器 0 和 2 分别都处理了一个请求,服务器 1 处理了两个请求。所以服务器 1 是最忙的服务器。

示例 2:

输入:k = 3, arrival = [1,2,3,4], load = [1,2,1,2]
输出:[0]
解释:
前 3 个请求分别被前 3 个服务器处理。
请求 3 进来,由于服务器 0 空闲,它被服务器 0 处理。
服务器 0 处理了两个请求,服务器 1 和 2 分别处理了一个请求。所以服务器 0 是最忙的服务器。

示例 3:

输入:k = 3, arrival = [1,2,3], load = [10,12,11]
输出:[0,1,2]
解释:每个服务器分别处理了一个请求,所以它们都是最忙的服务器。

示例 4:

输入:k = 3, arrival = [1,2,3,4,8,9,10], load = [5,2,10,3,1,2,2]
输出:[1]

示例 5:

输入:k = 1, arrival = [1], load = [1]
输出:[0]

 

提示:

  • 1 <= k <= 105
  • 1 <= arrival.length, load.length <= 105
  • arrival.length == load.length
  • 1 <= arrival[i], load[i] <= 109
  • arrival 保证 严格递增 。

代码结果

运行时间: 322 ms, 内存: 38.0 MB


import java.util.*;
import java.util.stream.Collectors;
import java.util.stream.IntStream;

/**
 * 使用Java Stream实现的题解:
 * 1. 使用一个优先队列(min-heap)来管理服务器的空闲时间。
 * 2. 使用一个数组来计数每个服务器处理的请求数量。
 * 3. 遍历每个请求,根据规则分配请求给相应的服务器。
 * 4. 最后找出处理请求数量最多的服务器。
 */
public class BusiestServersStream {
    public List<Integer> busiestServers(int k, int[] arrival, int[] load) {
        int[] count = new int[k];
        PriorityQueue<int[]> busy = new PriorityQueue<>(Comparator.comparingInt(a -> a[0]));
        TreeSet<Integer> available = IntStream.range(0, k).boxed().collect(Collectors.toCollection(TreeSet::new));
        for (int i = 0; i < arrival.length; i++) {
            while (!busy.isEmpty() && busy.peek()[0] <= arrival[i]) {
                available.add(busy.poll()[1]);
            }
            if (available.isEmpty()) continue;
            Integer server = available.ceiling(i % k);
            if (server == null) server = available.ceiling(0);
            busy.add(new int[]{arrival[i] + load[i], server});
            available.remove(server);
            count[server]++;
        }
        int maxCount = Arrays.stream(count).max().orElse(0);
        return IntStream.range(0, k).filter(i -> count[i] == maxCount).boxed().collect(Collectors.toList());
    }
}

解释

方法:

该题解采用了两个堆结构,一个表示可用服务器的堆(available),另一个表示忙碌服务器的堆(busy)。首先,所有服务器都是空闲的,因此将它们的索引加入到可用服务器堆中。对于每个请求,首先检查忙碌堆中是否有已经完成任务的服务器,如果有,则将其从忙碌堆中移除,并重新加入到可用堆中。之后,从可用堆中取出一个服务器处理当前请求,并将其加入到忙碌堆中。如果可用堆为空,则当前请求被丢弃。最后,统计每个服务器处理的请求数量,返回处理最多请求的服务器。

时间复杂度:

O(n log k)

空间复杂度:

O(k)

代码细节讲解

🦆
为什么在处理完忙碌的服务器后,将其重新加入到可用堆时使用的索引计算方式是`i + (id - i) % k`?这样计算的目的和原理是什么?
这种索引计算方式是为了保持服务器处理请求的循环性。在这个场景中,服务器是以循环的方式处理请求的,即第 i 个请求应该由第 (i % k) 号服务器处理。当服务器从忙碌堆释放并重新加入到可用堆时,我们需要确保它在正确的位置上以保持处理请求的顺序。计算 `i + (id - i) % k` 实际上是为了计算下一个请求编号,该编号对应服务器 id 应当重新开始处理的位置。这样可以确保每个服务器都有机会按顺序处理接下来的请求。
🦆
在忙碌堆中,元组的第一个元素是`start + t`,这代表了什么?为什么这样设置是合理的?
`start + t` 表示服务器完成当前请求的具体时间点。当我们将服务器及其完成时间(`start + t`)添加到忙碌堆时,这使我们能够按照服务器变为空闲的时间顺序来管理它们。使用最小堆结构,我们可以快速地从堆中得到最先完成任务的服务器,从而在该服务器变为可用时及时将其重新加入到可用堆中,提高服务器的利用率。
🦆
如果在检查忙碌堆并尝试释放服务器时,忙碌堆为空但可用堆也为空,这种情况会如何处理?请求是否被丢弃?
这种情况下,由于没有任何服务器可用(无论是因为它们都处于忙碌状态,或者已经被分配出去),请求将不得不被丢弃。这种设计确保了只有在所有服务器都正忙且无法处理新请求时,请求才会被丢弃,从而尽可能地利用服务器资源。
🦆
题解中提到,如果可用堆为空,则请求被舍弃。这种设计是否意味着在某些极端情况下服务器的利用率会很低?
是的,这种设计确实可能导致在某些极端情况下,如请求到达的频率极高或服务器处理请求的时间较长时,服务器的利用率会很低,因为新的请求可能会因为没有可用服务器而被丢弃。这一点突显了在设计服务器负载均衡策略时,需要根据实际的请求到达率和服务器处理能力来优化参数和策略,以提高服务器的整体利用率和响应能力。

相关问题