题目描述
给定一位研究者论文被引用次数的数组(被引用次数是非负整数)。编写一个方法,计算出研究者的 h 指数。
h 指数的定义: “h 代表“高引用次数”(high citations),一名科研人员的 h 指数是指他(她)的 (N 篇论文中)至多有 h 篇论文分别被引用了至少 h 次。(其余的 N – h 篇论文每篇被引用次数不多于 h 次。)”
示例:
输入:citations = [3,0,6,1,5]输出: 3 解释: 给定数组表示研究者总共有5篇论文,每篇论文相应的被引用了3, 0, 6, 1, 5次。 由于研究者有3篇论文每篇至少被引用了3次,其余两篇论文每篇被引用不多于3次,所以她的 h 指数是3。
说明: 如果 h 有多种可能的值,h 指数是其中最大的那个。
https://leetcode-cn.com/problems/h-index/
解法1
解法1首先对数组排序,从大到小枚举hIndex,然后检测是否符合条件。
以“3,0,6,1,5”为例,共有5篇文章,排序后为“0,1,3,5,6”。我们假设hIndex=5,那么就要求第一篇文章的引用量就要达到5(这样从第一篇往后的文章引用量肯定都达到5),然而第一篇文章的引用量为0,我们减小hIndex。我们假设hIndex=4,那么要求第二篇文章的引用量达到4(这样第2,3,4,5篇文章的引用量都能达到4),然而并没有。我们假设hIndex=3,那么就要求第三篇的引用量达到3。发现达到了,那么就返回3作为hIndex。
全部代码如下,时间复杂度O(nlogn), 空间复杂度O
class Solution {
public int hIndex(int[] citations) {
Arrays.sort(citations);
for (int hIndex = citations.length; hIndex > 0; hIndex--) {
if (citations[citations.length - hIndex] >= hIndex)
return hIndex;
}
return 0;
}
}
解法2
解法2使用计数排序的思想,有n篇文章,我们就创建n个桶,编号为0,1,…,n。按照文章的引用次数放入对应编号的桶中,如果引用次数大于n,那么就放入第n个桶中。
我们以“3,0,6,1,5”为例,创建编号为0-5的桶。
桶编号:0 1 2 3 4 5
文章数:1 1 0 1 0 2
然后逆序枚举hIndex(也是桶编号),计算sum = sum + bucket[hIndex],那么每一次循环sum的含义就代表引用次数在5次及以上的有2篇,在4次及以上有2篇,在3次及以上有3篇,在2次及以上有2篇,在1次及以上有4篇,在0次及以上有5篇。
若要取hIndex为5,则引用次数大于等于5的文章数量至少为5篇。若要取hIndex为4,则引用次数大于等于4的文章至少有4篇,若要取hIndex为3,则引用次数大于等于3的文章至少有3篇。根据上面的分析,我们能推断出若要取最大的hIndex,则判断条件应该为sum >= hIndex。
下面是代码,时间复杂度O(n),空间复杂度O(n)。
class Solution {
public int hIndex(int[] citations) {
int[] bucket = new int[citations.length + 1];
for (int ctNum : citations) {
bucket[Math.min(citations.length, ctNum)]++;
}
int sum = 0;
// sum存放了引用数大于等于hIndex的文章数量
// 若要取到hIndex,sum要大于等于hIndex。
for (int hIndex = citations.length; hIndex > 0; hIndex--) {
sum += bucket[hIndex];
if (sum >= hIndex)
return hIndex;
}
return 0;
}
}