274. H指数

题目描述

给定一位研究者论文被引用次数的数组（被引用次数是非负整数）。编写一个方法，计算出研究者的 h 指数。

h 指数的定义: “h 代表“高引用次数”（high citations），一名科研人员的 h 指数是指他（她）的（N 篇论文中）至多有 h 篇论文分别被引用了至少 h 次。（其余的 N – h 篇论文每篇被引用次数不多于 h 次。）”

示例:

输入: citations = [3,0,6,1,5]
输出: 3 
解释: 给定数组表示研究者总共有 5 篇论文，每篇论文相应的被引用了 3, 0, 6, 1, 5 次。
     由于研究者有 3 篇论文每篇至少被引用了 3 次，其余两篇论文每篇被引用不多于 3 次，所以她的 h 指数是 3。

说明: 如果 h 有多种可能的值，h 指数是其中最大的那个。

https://leetcode-cn.com/problems/h-index/

解法1

解法1首先对数组排序，从大到小枚举hIndex，然后检测是否符合条件。

以“3,0,6,1,5”为例，共有5篇文章，排序后为“0,1,3,5,6”。我们假设hIndex=5，那么就要求第一篇文章的引用量就要达到5（这样从第一篇往后的文章引用量肯定都达到5），然而第一篇文章的引用量为0，我们减小hIndex。我们假设hIndex=4，那么要求第二篇文章的引用量达到4（这样第2，3，4，5篇文章的引用量都能达到4），然而并没有。我们假设hIndex=3，那么就要求第三篇的引用量达到3。发现达到了，那么就返回3作为hIndex。

全部代码如下，时间复杂度O(nlogn), 空间复杂度O

class Solution {
    public int hIndex(int[] citations) {
        Arrays.sort(citations);

        for (int hIndex = citations.length; hIndex > 0; hIndex--) {
            if (citations[citations.length - hIndex] >= hIndex)
                return hIndex;
        }

        return 0;
    }
}

解法2

解法2使用计数排序的思想，有n篇文章，我们就创建n个桶，编号为0,1,…,n。按照文章的引用次数放入对应编号的桶中，如果引用次数大于n，那么就放入第n个桶中。

我们以“3,0,6,1,5”为例，创建编号为0-5的桶。

桶编号：0 1 2 3 4 5
文章数：1 1 0 1 0 2

然后逆序枚举hIndex（也是桶编号），计算sum = sum + bucket[hIndex]，那么每一次循环sum的含义就代表引用次数在5次及以上的有2篇，在4次及以上有2篇，在3次及以上有3篇，在2次及以上有2篇，在1次及以上有4篇，在0次及以上有5篇。

若要取hIndex为5，则引用次数大于等于5的文章数量至少为5篇。若要取hIndex为4，则引用次数大于等于4的文章至少有4篇，若要取hIndex为3，则引用次数大于等于3的文章至少有3篇。根据上面的分析，我们能推断出若要取最大的hIndex，则判断条件应该为sum >= hIndex。

下面是代码，时间复杂度O(n)，空间复杂度O(n)。

class Solution {
    public int hIndex(int[] citations) {
        int[] bucket = new int[citations.length + 1];

        for (int ctNum : citations) {
            bucket[Math.min(citations.length, ctNum)]++;
        }

        int sum = 0;

        // sum存放了引用数大于等于hIndex的文章数量
        // 若要取到hIndex，sum要大于等于hIndex。
        for (int hIndex = citations.length; hIndex > 0; hIndex--) {
            sum += bucket[hIndex];

            if (sum >= hIndex)
                return hIndex;
        }
        return 0;
    }
}

题目描述

解法1

解法2

Leave a Reply Cancel reply