获取数组中出现次数最多的元素


85

我正在寻找一种优雅的方法来确定JavaScript数组中哪个元素的出现次数最多(mode)。

例如,在

['pear', 'apple', 'orange', 'apple']

'apple'元素是最常见的元素。


您可以根据这个Stackoverflow问题改编一些想法。stackoverflow.com/questions/840781/...
Nosredna

我没有仔细阅读过这些解决方案,但是它们中的任何一个是否都包含以下细微差别(优化?),其根据仅仅是确定哪个元素出现次数最多而不是多少出现次数最多的要求。并且细微之处在于,随着数组的循环,当最高和第二高的事件之间的差小于剩余的要循环的元素数量时,计数可以停止,循环可以停止,当前最高的将是最高的
Dexygen

1
同样,这些解决方案似乎没有考虑到联系。
Dexygen 2010年

1
如果您正在寻找另一种解决方案(稍小一点)stackoverflow.com/questions/40410470/…–
daanvanham

Answers:


94

这只是模式。这是一个快速的,未优化的解决方案。它应该是O(n)。

function mode(array)
{
    if(array.length == 0)
        return null;
    var modeMap = {};
    var maxEl = array[0], maxCount = 1;
    for(var i = 0; i < array.length; i++)
    {
        var el = array[i];
        if(modeMap[el] == null)
            modeMap[el] = 1;
        else
            modeMap[el]++;  
        if(modeMap[el] > maxCount)
        {
            maxEl = el;
            maxCount = modeMap[el];
        }
    }
    return maxEl;
}

1
很好...但是它仅适用于字符串-不一定是限制,而是要考虑的事项。
詹姆斯

非常感谢,我没想到完整的解决方案。只需一次传递即可在字符串和数字上使用,这非常不错。
老虎钳于2009年

1
我添加了该算法的一个版本来处理联系。
samandmoore,2010年

3
我必须用if(!modeMap [el])替换`f(modeMap [el] == null),因为它在传递[2,3,3]时会跳进我更奇怪的数字,因为modeMap [el]未定义而不是null。
纳兹2014年

1
我认为拥有决胜局是合理的,在这种情况下,决胜局是数组中最先出现的元素。但是您可以轻松地更改此算法,以使每个人最多。
Wylliam Judd

62

自2009年以来,javascript有了一些发展-我想我会添加另一个选项。在真正成为问题之前,我不太关心效率,因此我对“优雅”代码的定义(由OP规定)有利于可读性-这当然是主观的...

function mode(arr){
    return arr.sort((a,b) =>
          arr.filter(v => v===a).length
        - arr.filter(v => v===b).length
    ).pop();
}

mode(['pear', 'apple', 'orange', 'apple']); // apple

在此特定示例中,如果集合中的两个或多个元素具有相同的出现次数,则将返回数组中最新出现的那个元素。还值得指出的是,它将修改您的原始数组-如果您希望Array.slice事先调用,可以避免这种情况 。


编辑:因为2015年发生了,所以用一些ES6粗 箭头更新了示例,我认为它们看起来很漂亮...如果您担心向后兼容,则可以在修订历史记录中找到。


这很棒!现在,如果数组中有多个项目与另一个项目相同,您将如何返回多个答案?
2015年

天真地假设模式是唯一的,如果您要求它返回一个以上的模式,那么您需要跟踪看起来不太漂亮的每个项目的总计数……您可以尝试这样的方法,这很简单,因为它仅适用于原始值(但您可以根据需要进一步调整它)。
2015年

14
如果这不是优雅的代码,我不知道这是什么。就像功能编程的广告一样。
Sam H.

1
@GoranJakovljevic您能更具体一点吗?我可以想象这是ES6箭头功能-您是否尝试过修订历史记录中的向后兼容示例
Emissary

您是正确的,它的箭头功能。是的,向后工作也很好。
Goran Jakovljevic

37

根据George Jempty's要求让算法解决关系的要求,我提出了Matthew Flaschen's算法的修改版本。

function modeString(array) {
  if (array.length == 0) return null;

  var modeMap = {},
    maxEl = array[0],
    maxCount = 1;

  for (var i = 0; i < array.length; i++) {
    var el = array[i];

    if (modeMap[el] == null) modeMap[el] = 1;
    else modeMap[el]++;

    if (modeMap[el] > maxCount) {
      maxEl = el;
      maxCount = modeMap[el];
    } else if (modeMap[el] == maxCount) {
      maxEl += "&" + el;
      maxCount = modeMap[el];
    }
  }
  return maxEl;
}

现在,这将返回一个模式&符号由符号分隔的字符串。收到结果后,可以在该&元素上拆分它,并且您可以使用自己的模式。

另一个选择是返回一个模式元素数组,如下所示:

function modeArray(array) {
  if (array.length == 0) return null;
  var modeMap = {},
    maxCount = 1,
    modes = [];

  for (var i = 0; i < array.length; i++) {
    var el = array[i];

    if (modeMap[el] == null) modeMap[el] = 1;
    else modeMap[el]++;

    if (modeMap[el] > maxCount) {
      modes = [el];
      maxCount = modeMap[el];
    } else if (modeMap[el] == maxCount) {
      modes.push(el);
      maxCount = modeMap[el];
    }
  }
  return modes;
}

在上面的示例中,您将能够将函数的结果作为模式数组进行处理。


1
在第二个示例(数组一个)中;你不需要设定modes[array[0]]初始值。这样可以确保您在中有重复项modes。这应该可以解决问题var modes = []
vdclouis

1
这很棒!但是,当我对具有两个不同值的数组进行测试时,它将两次返回数组中的第一项。不知道为什么会这样...
Crystal

@xgrioux进行了vdclouis建议纠正此错误的更改。即将[array [0]]更改为[]。
Dave Haigh

建议改变实例=====执行严格的平等
莱恩约瑟夫

16

基于Emissary的ES6 +答案,您可以Array.prototype.reduce用来进行比较(而不是对数组进行排序,弹出和可能的变异),我认为这比较流畅。

const mode = (myArray) =>
  myArray.reduce(
    (a,b,i,arr)=>
     (arr.filter(v=>v===a).length>=arr.filter(v=>v===b).length?a:b),
    null)

我默认为null,如果null是您要过滤的可能选项,它可能不会总是给您真实的答复,也许这可能是第二个可选参数

与其他各种解决方案一样,不利的一面是它不处理“绘制状态”,但是仍然可以通过稍微复杂一些的reduce函数来实现。


14
a=['pear', 'apple', 'orange', 'apple'];
b={};
max='', maxi=0;
for(let k of a) {
  if(b[k]) b[k]++; else b[k]=1;
  if(maxi < b[k]) { max=k; maxi=b[k] }
}

它仍然是O(n),但不必要使用两次。
马修·弗拉申(Marath Flaschen)2009年

2
由于传输了JavaScript,因此看到小型解决方案总是很有趣。
Nosredna

大声笑2减去正确的解决方案;]我不必要地纠正了两遍,使其很快,但仍然有效,仍然是最短的解决方案。
思想家

每次访问b至少需要log(len(b)),因此O(n)可能会有些乐观
Nicolas78

nicolas78:如果数组很小,那没关系。因此,这取决于您的项目。
思想家2010年

7

当我将此功能用作面试官的测验时,我发布了我的解决方案:

const highest = arr => (arr || []).reduce( ( acc, el ) => {
  acc.k[el] = acc.k[el] ? acc.k[el] + 1 : 1
  acc.max = acc.max ? acc.max < acc.k[el] ? el : acc.max : el
  return acc  
}, { k:{} }).max

const test = [0,1,2,3,4,2,3,1,0,3,2,2,2,3,3,2]
console.log(highest(test))

5

在这里尝试声明式方法。该解决方案构建了一个对象来计算每个单词的出现次数。然后,通过将每个单词的总出现次数与对象中找到的最大值进行比较,将对象过滤为一个数组。

const arr = ['hello', 'world', 'hello', 'again'];

const tally = (acc, x) => { 

  if (! acc[x]) { 
    acc[x] = 1;
    return acc;
  } 

  acc[x] += 1;
  return acc;
};

const totals = arr.reduce(tally, {});

const keys = Object.keys(totals);

const values = keys.map(x => totals[x]);

const results = keys.filter(x => totals[x] === Math.max(...values));

请解释您的答案
Haris

我将避免在过滤器循环中计算最大值,并删除键值映射图语句。虽然此答案不是最有效的方法,但它不如在reducer中进行过滤那样糟糕,并且是很好的可读性恕我直言。const maxValue = Math.max(... Object.values(totals)); const结果= keys.filter(x => totals [x] === maxValue);
milesaron

3

时间到另一个解决方案:

function getMaxOccurrence(arr) {
    var o = {}, maxCount = 0, maxValue, m;
    for (var i=0, iLen=arr.length; i<iLen; i++) {
        m = arr[i];

        if (!o.hasOwnProperty(m)) {
            o[m] = 0;
        }
        ++o[m];

        if (o[m] > maxCount) {
            maxCount = o[m];
            maxValue = m;
        }
    }
    return maxValue;
}

如果简短很重要(无关紧要),则:

function getMaxOccurrence(a) {
    var o = {}, mC = 0, mV, m;
    for (var i=0, iL=a.length; i<iL; i++) {
        m = a[i];
        o.hasOwnProperty(m)? ++o[m] : o[m] = 1;
        if (o[m] > mC) mC = o[m], mV = m;
    }
    return mV;
}

如果要避免不存在的成员(例如,稀疏数组),则需要额外的hasOwnProperty测试:

function getMaxOccurrence(a) {
    var o = {}, mC = 0, mV, m;
    for (var i=0, iL=a.length; i<iL; i++) {
        if (a.hasOwnProperty(i)) {
            m = a[i];
            o.hasOwnProperty(m)? ++o[m] : o[m] = 1;
            if (o[m] > mC) mC = o[m], mV = m;
        }
    }
    return mV;
}

getMaxOccurrence([,,,,,1,1]); // 1

此处的其他答案将返回undefined


@Jonah-简单来说,简洁是没有意义的,通常会使代码难以阅读和维护。当然,更多冗长的代码不一定只是为了更长的时间而更好。但是,这些标准本身却被更重要的指标(例如清晰度和可维护性)所淘汰。
RobG

显然,密密麻麻的简洁绝不是目标。但是通常,给定相同代码的两个版本且密度大致相等,较短的版本通常更清晰,更好。我并不是说这是规则,但是相关性很强。实际上,我想说的是,没有其他单一指标与可读性高度相关。这就是每个程序员都喜欢删除代码的原因。这就是为什么Code Review中的大多数重写都比原始版本短的原因。
乔纳2015年

3

来自以下网址的另一个JS解决方案:https : //www.w3resource.com/javascript-exercises/javascript-array-exercise-8.php

也可以尝试以下方法:

let arr =['pear', 'apple', 'orange', 'apple'];

function findMostFrequent(arr) {
  let mf = 1;
  let m = 0;
  let item;

  for (let i = 0; i < arr.length; i++) {
    for (let j = i; j < arr.length; j++) {
      if (arr[i] == arr[j]) {
        m++;
        if (m > mf) {
          mf = m;
          item = arr[i];
        }
      }
    }
    m = 0;
  }

  return item;
}

findMostFrequent(arr); // apple

3

这是使用O(n)复杂度的另一种ES6方法

const result = Object.entries(
    ['pear', 'apple', 'orange', 'apple'].reduce((previous, current) => {
        if (previous[current] === undefined) previous[current] = 1;
        else previous[current]++;
        return previous;
    }, {})).reduce((previous, current) => (current[1] >= previous[1] ? current : previous))[0];
console.log("Max value : " + result);

2
function mode(arr){
  return arr.reduce(function(counts,key){
    var curCount = (counts[key+''] || 0) + 1;
    counts[key+''] = curCount;
    if (curCount > counts.max) { counts.max = curCount; counts.mode = key; }
    return counts;
  }, {max:0, mode: null}).mode
}

此解决方案的问题在于,“ max”和“ mode”一词将不会计入地图中的逻辑……
Pablo

2

这是我针对此问题的解决方案,但有数字并使用了新的“设置”功能。它的性能不是很好,但是我写这个肯定很有趣,它确实支持多个最大值。

const mode = (arr) => [...new Set(arr)]
  .map((value) => [value, arr.filter((v) => v === value).length])
  .sort((a,b) => a[1]-b[1])
  .reverse()
  .filter((value, i, a) => a.indexOf(value) === i)
  .filter((v, i, a) => v[1] === a[0][1])
  .map((v) => v[0])

mode([1,2,3,3]) // [3]
mode([1,1,1,1,2,2,2,2,3,3,3]) // [1,2]

顺便说一下,不要在生产中使用它,这只是说明如何仅使用ES6和Array函数即可解决该问题。


2

这是我的解决方案:

function frequent(number){
    var count = 0;
    var sortedNumber = number.sort();
    var start = number[0], item;
    for(var i = 0 ;  i < sortedNumber.length; i++){
      if(start === sortedNumber[i] || sortedNumber[i] === sortedNumber[i+1]){
         item = sortedNumber[i]
      }
    }
    return item
  
}

   console.log( frequent(['pear', 'apple', 'orange', 'apple']))


2

为了真正易于阅读,可维护的代码,我分享了这一点:

function getMaxOcurrences(arr = []) {
  let item = arr[0];
  let ocurrencesMap = {};

  for (let i in arr) {
    const current = arr[i];

    if (ocurrencesMap[current]) ocurrencesMap[current]++;
    else ocurrencesMap[current] = 1;

    if (ocurrencesMap[item] < ocurrencesMap[current]) item = current;
  }

  return { 
    item: item, 
    ocurrences: ocurrencesMap[item]
  };
}

希望它可以帮助某人;)!


2

如果出现平局,此解决方案可以返回数组的多个元素。例如,一个数组

arr = [ 3, 4, 3, 6, 4, ];

有两个模式值:36

这是解决方案。

function find_mode(arr) {
    var max = 0;
    var maxarr = [];
    var counter = [];
    var maxarr = [];

    arr.forEach(function(){
       counter.push(0);
    });

    for(var i = 0;i<arr.length;i++){
       for(var j=0;j<arr.length;j++){
            if(arr[i]==arr[j])counter[i]++; 
       }
    } 


    max=this.arrayMax(counter);   
  
    for(var i = 0;i<arr.length;i++){
         if(counter[i]==max)maxarr.push(arr[i]);
    }

    var unique = maxarr.filter( this.onlyUnique );
    return unique;

  };


function arrayMax(arr) {
      var len = arr.length, max = -Infinity;
      while (len--) {
              if (arr[len] > max) {
              max = arr[len];
              }
      }
  return max;
 };

 function onlyUnique(value, index, self) {
       return self.indexOf(value) === index;
 }

1
var mode = 0;
var c = 0;
var num = new Array();
var value = 0;
var greatest = 0;
var ct = 0;

注意:ct是数组的长度。

function getMode()
{
    for (var i = 0; i < ct; i++)
    {
        value = num[i];
        if (i != ct)
        {
            while (value == num[i + 1])
            {
                c = c + 1;
                i = i + 1;
            }
        }
        if (c > greatest)
        {
            greatest = c;
            mode = value;
        }
        c = 0;
    }
}

1
const mode = (str) => {
  return str
    .split(' ')
    .reduce((data, key) => {
      let counter = data.map[key] + 1 || 1
      data.map[key] = counter

      if (counter > data.counter) {
        data.counter = counter
        data.mode = key
      }

      return data
    }, {
      counter: 0,
      mode: null,
      map: {}
    })
    .mode
}

console.log(mode('the t-rex is the greatest of them all'))

1
function mode(array){
    var set = Array.from(new Set(array));
    var counts = set.map(a=>array.filter(b=>b==a).length);
    var indices = counts.map((a,b)=>Math.max(...counts)===a?b:0).filter(b=>b!==0);
    var mode = indices.map(a=>set[a]);
    return mode;
}

1

也尝试一下,这不会考虑浏览器版本。

function mode(arr){
var a = [],b = 0,occurrence;
    for(var i = 0; i < arr.length;i++){
    if(a[arr[i]] != undefined){
        a[arr[i]]++;
    }else{
        a[arr[i]] = 1;
    }
    }
    for(var key in a){
    if(a[key] > b){
        b = a[key];
        occurrence = key;
    }
    }
return occurrence;
}
alert(mode(['segunda','terça','terca','segunda','terça','segunda']));

请注意,当2个或多个条目出现相同的次数时,此函数将返回数组中的最新出现!


1
// O(n)
var arr = [1, 2, 3, 2, 3, 3, 5, 6];
var duplicates = {};
max = '';
maxi = 0;
arr.forEach((el) => {
    duplicates[el] = duplicates[el] + 1 || 1;
  if (maxi < duplicates[el]) {
    max = el;
    maxi = duplicates[el];
  }
});
console.log(max);

1

这是使用内置映射的现代版本(因此,它不仅可以转换为唯一字符串,还可以处理更多的工作):

'use strict';

const histogram = iterable => {
    const result = new Map();

    for (const x of iterable) {
        result.set(x, (result.get(x) || 0) + 1);
    }

    return result;
};

const mostCommon = iterable => {
    let maxCount = 0;
    let maxKey;

    for (const [key, count] of histogram(iterable)) {
        if (count > maxCount) {
            maxCount = count;
            maxKey = key;
        }
    }

    return maxKey;
};

console.log(mostCommon(['pear', 'apple', 'orange', 'apple']));


0

我想您有两种方法。两者都有优点。

然后进行排序或遍历,并使用哈希表为您进行计数。

哈希表很不错,因为一旦完成处理,您还将拥有所有不同的元素。如果您有数百万个项目,那么在重复率较低的情况下,哈希表可能会占用大量内存。排序然后计数的方法将具有更多可控制的内存空间。


0
var array = [1, 3, 6, 6, 6, 6, 7, 7, 12, 12, 17],
    c = {}, // counters
    s = []; // sortable array

for (var i=0; i<array.length; i++) {
    c[array[i]] = c[array[i]] || 0; // initialize
    c[array[i]]++;
} // count occurrences

for (var key in c) {
    s.push([key, c[key]])
} // build sortable array from counters

s.sort(function(a, b) {return b[1]-a[1];});

var firstMode = s[0][0];
console.log(firstMode);

0

您可以尝试以下方法:

 // using splice()   
 // get the element with the highest occurence in an array
    function mc(a) {
      var us = [], l;
      // find all the unique elements in the array
      a.forEach(function (v) {
        if (us.indexOf(v) === -1) {
          us.push(v);
        }
      });
      l = us.length;
      while (true) {
        for (var i = 0; i < l; i ++) {
          if (a.indexOf(us[i]) === -1) {
            continue;
          } else if (a.indexOf(us[i]) != -1 && a.length > 1) {
            // just delete it once at a time
            a.splice(a.indexOf(us[i]), 1);
          } else {
            // default to last one
            return a[0];
          }
        }
      }
    }

// using string.match method
function su(a) {
    var s = a.join(),
            uelms = [],
            r = {},
            l,
            i,
            m;

    a.forEach(function (v) {
        if (uelms.indexOf(v) === -1) {
            uelms.push(v);
        }
    });

    l = uelms.length;

    // use match to calculate occurance times
    for (i = 0; i < l; i ++) {
        r[uelms[i]] = s.match(new RegExp(uelms[i], 'g')).length;
    }

    m = uelms[0];
    for (var p in r) {
        if (r[p] > r[m]) {
            m = p;
        } else {
            continue;
        }
    }

    return m;
}

0

您可以解决O(n)的复杂性

var arr = [1,3,54,56,6,6,1,6];
var obj = {};

/* first convert the array in to object with unique elements and number of times each element is repeated */
for(var i = 0; i < arr.length; i++)
{
   var x = arr[i];
   if(!obj[x])
     obj[x] = 1;
   else 
     obj[x]++;
}

console.log(obj);//just for reference

/* now traverse the object to get the element */
var index = 0;
var max = 0;

for(var obIndex in obj)
{
  if(obj[obIndex] > max)
  {
    max = obj[obIndex];
    index = obIndex;
  }
}
console.log(index+" got maximum time repeated, with "+ max +" times" );

只需复制并粘贴到chrome控制台中即可运行上述代码。


0

此功能是每种信息类型的通用功能。它计算元素的出现,然后返回出现的元素最多的数组。

function mode () {
  var arr = [].slice.call(arguments);
  if ((args.length == 1) && (typeof args[0] === "object")) {
    args = args[0].mode();
  }

  var obj = {};
  for(var i = 0; i < arr.length; i++) {
    if(obj[arr[i]] === undefined) obj[arr[i]] = 1;
    else obj[arr[i]]++;
  }

  var max = 0;
  for (w in obj) {
    if (obj[w] > max) max = obj[w];
  }

  ret_val = [];
  for (w in obj) {
    if (obj[w] == max) ret_val.push(w);
  }

  return ret_val;
}

0
function mode(){
  var input = $("input").val().split(",");
  var mode = [];
  var m = [];
  var p = [];
    for(var x = 0;x< input.length;x++){
      if(m.indexOf(input[x])==-1){
        m[m.length]=input[x];
    }}
  for(var x = 0; x< m.length;x++){
    p[x]=0;
    for(var y = 0; y<input.length;y++){
      if(input[y]==m[x]){
      p[x]++; 
 }}}
 for(var x = 0;x< p.length;x++){
   if(p[x] ==(Math.max.apply(null, p))){
     mode.push(m[x]);
 }} 
$("#output").text(mode);}

0

这是我的方式。我尝试将数据拳头分组。

const _ = require("underscore")

var test  = [ 1, 1, 2, 1 ];
var groupResult = _.groupBy(test, (e)=> e);

groupResult应该是

{
  1: [1, 1, 1]
  2: [2] 
}

然后找到数组最长的属性

function findMax(groupResult){
   var maxArr = []
   var max;
   for(var item in groupResult){
     if(!max) { 
        max = { value:item, count: groupResult[item].length } ; 
        maxArr.push(max); 
        continue;
     }
     if(max.count < groupResult[item].length){ 
        maxArr = [];
        max = { value:item, count: groupResult[item].length }
        maxArr.push(max)
     } else if(max === groupResult[item].length)
        maxArr.push({ value:item, count: groupResult[item].length })
   }
   return maxArr;
}

完整的代码如下所示

const _ = require("underscore")

var test  = [ 1, 1, 2, 1 ];
var groupResult= _.groupBy(test, (e)=> e);
console.log(findMax(groupResult)[0].value);

function findMax(groupResult){
   var maxArr = []
   var max;
   for(var item in groupResult){
     if(!max) { 
        max = { value:item, count: groupResult[item].length } ; 
        maxArr.push(max); 
        continue;
     }
     if(max.count < groupResult[item].length){ 
        maxArr = [];
        max = { value:item, count: groupResult[item].length }
        maxArr.push(max)
     } else if(max === groupResult[item].length)
        maxArr.push({ value:item, count: groupResult[item].length })
   }
   return maxArr;
}

0
var cats = ['Tom','Fluffy','Tom','Bella','Chloe','Tom','Chloe'];
var counts = {};
var compare = 0;
var mostFrequent;
(function(array){
   for(var i = 0, len = array.length; i < len; i++){
       var word = array[i];

       if(counts[word] === undefined){
           counts[word] = 1;
       }else{
           counts[word] = counts[word] + 1;
       }
       if(counts[word] > compare){
             compare = counts[word];
             mostFrequent = cats[i];
       }
    }
  return mostFrequent;
})(cats);

0

使用ES6,您可以像这样链接方法:

    function findMostFrequent(arr) {
      return arr
        .reduce((acc, cur, ind, arr) => {
          if (arr.indexOf(cur) === ind) {
            return [...acc, [cur, 1]];
          } else {
            acc[acc.indexOf(acc.find(e => e[0] === cur))] = [
              cur,
              acc[acc.indexOf(acc.find(e => e[0] === cur))][1] + 1
            ];
            return acc;
          }
        }, [])
        .sort((a, b) => b[1] - a[1])
        .filter((cur, ind, arr) => cur[1] === arr[0][1])
        .map(cur => cur[0]);
    }
    
    console.log(findMostFrequent(['pear', 'apple', 'orange', 'apple']));
    console.log(findMostFrequent(['pear', 'apple', 'orange', 'apple', 'pear']));

如果两个元素出现相同,它将返回它们两个。它适用于任何类型的元素。


您不应arr在已经将该变量定义为参数的范围内使用该变量。这可能会导致错误,具体取决于所使用的浏览器。
mesqueeb

arr指的是哪个arr.indexOf(cur)?top参数,还是reduce里面的那个?
mesqueeb
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.