H 指数 II

难度:

标签:

题目描述

给你一个整数数组 citations ，其中 citations[i] 表示研究者的第 i 篇论文被引用的次数，citations 已经按照 升序排列 。计算并返回该研究者的 h 指数。

h 指数的定义：h 代表“高引用次数”（high citations），一名科研人员的 h 指数是指他（她）的（n 篇论文中）至少有 h 篇论文分别被引用了至少 h 次。

请你设计并实现对数时间复杂度的算法解决此问题。

示例 1：

输入：citations = [0,1,3,5,6]
输出：3
解释：给定数组表示研究者总共有 5 篇论文，每篇论文相应的被引用了 0, 1, 3, 5, 6 次。
     由于研究者有3篇论文每篇 至少 被引用了 3 次，其余两篇论文每篇被引用 不多于 3 次，所以她的 h 指数是 3 。

示例 2：

输入：citations = [1,2,100]
输出：2

提示：

n == citations.length
1 <= n <= 10⁵
0 <= citations[i] <= 1000
citations 按 升序排列

代码结果

运行时间: 22 ms, 内存: 21.2 MB

/*
 * 思路：
 * 使用 Java Stream 可以实现简化版本，但由于二分查找的特性，还是需要手动控制循环。
 * 结合 IntStream 和二分查找算法来实现。
 */
 
import java.util.stream.IntStream;
 
public class Solution {
    public int hIndex(int[] citations) {
        int n = citations.length;
        return IntStream.range(0, n)
                .map(i -> citations[n - 1 - i] >= i + 1 ? 1 : 0)
                .reduce((acc, cur) -> acc + cur)
                .orElse(0);
    }
}

解释

方法:

该题解使用了二分查找的方法。由于数组 citations 已经按照升序排列，我们可以二分搜索数组，寻找最大的 h 指数。我们维护左右指针 l 和 r，每次取中间位置 mid，如果 citations[-mid] >= mid，说明至少有 mid 篇论文的引用数 >= mid，满足 h 指数的定义，我们将左指针 l 更新为 mid；否则说明 mid 值偏大，将右指针 r 更新为 mid-1。最终左右指针相遇时的位置即为最大的 h 指数。

时间复杂度:

O(log n)

空间复杂度:

O(1)

代码细节讲解

🦆

为什么在二分查找中使用`citations[-mid] >= mid`作为条件来判断是否满足h指数的要求？

▷

在这个问题中，`citations[-mid]`表示数组中从后向前数的第`mid`个元素，即从前向后的第`len(citations) - mid`个元素。因为数组是升序排列的，我们需要找到一个最大的`h`，使得至少有`h`篇论文的引用数不少于`h`。使用`citations[-mid] >= mid`作为条件，我们实际上是在确认从数组末端开始的`mid`个元素是否每个都至少有`mid`次引用。这样可以保证存在一个满足h指数定义的最大`h`。

🦆

在二分搜索过程中，为什么选择将左指针更新为`mid`而不是`mid+1`当`citations[-mid] >= mid`条件满足时？

▷

通常，在二分查找中，当找到一个满足条件的值时，为了继续寻找可能存在的更大的值，我们会将左指针更新为`mid+1`。然而，在这个特定的算法实现中，左指针被更新为`mid`而不是`mid+1`，是因为更新的条件是`citations[-mid] >= mid`，这表明当前的`mid`可能是有效的h指数。为了不跳过这个有效的h指数，我们让左指针保持在当前的`mid`位置上，确保不错过任何可能的h指数值。

🦆

如何理解题解中提到的`左右指针相遇时的位置即为最大的 h 指数`，具体是如何保证这一点的？

▷

二分查找通过逐步缩小查找范围来定位最大的h指数。在每一步，根据`citations[-mid] >= mid`的判断，我们不断调整左右指针。当`citations[-mid] >= mid`为真时，左指针向右移动以探索更大的可能h值；当为假时，右指针向左移动以减少不可能的h值。最终，当左右指针相遇时，它们指向的就是满足条件的最大h指数，因为这是最后一个被认为可能是h指数的位置。

🦆

如果数组`citations`中所有值都为0，二分查找的逻辑是否仍然正确，并能正确返回h指数为0？

▷

是的，即使所有引用数都为0，这种二分查找方法仍然有效。在这种情况下，`citations[-mid] >= mid`的条件从未满足，因为所有的`citations[-mid]`值都为0，不会大于任何正的`mid`值。因此，右指针会不断左移，最终与左指针在起始位置相遇，也就是0的位置，正确返回h指数为0。

H 指数 II

题目描述

代码结果

解释

代码细节讲解

相关问题

H 指数