设A
和B
为两组。我正在寻找一种非常快速或优雅的方法来计算它们之间的设置差异(A - B
或A \B
,取决于您的偏好)。如标题所示,这两组存储和存储为Javascript数组。
笔记:
- 壁虎特技可以
- 我宁愿坚持使用本机函数(但如果速度更快,我可以使用轻量级库)
- 我已经看到但尚未测试JS.Set(请参阅上一点)
编辑:我注意到有关包含重复元素的集合的评论。当我说“ set”时,是指数学定义,这意味着(除其他外)它们不包含重复的元素。
indexOf
实施过程。
设A
和B
为两组。我正在寻找一种非常快速或优雅的方法来计算它们之间的设置差异(A - B
或A \B
,取决于您的偏好)。如标题所示,这两组存储和存储为Javascript数组。
笔记:
编辑:我注意到有关包含重复元素的集合的评论。当我说“ set”时,是指数学定义,这意味着(除其他外)它们不包含重复的元素。
indexOf
实施过程。
Answers:
如果不知道这是否最有效,但可能最短
A = [1, 2, 3, 4];
B = [1, 3, 4, 7];
diff = A.filter(function(x) { return B.indexOf(x) < 0 })
console.log(diff);
更新到ES6:
A = [1, 2, 3, 4];
B = [1, 3, 4, 7];
diff = A.filter(x => !B.includes(x) );
console.log(diff);
!B.includes(x)
代替B.indexOf(x) < 0
:)
好吧,七年后,有了ES6的Set对象,它非常简单(但仍然不如python的 紧凑A - B
),并且据报道比indexOf
大型数组要快:
console.clear();
let a = new Set([1, 2, 3, 4]);
let b = new Set([5, 4, 3, 2]);
let a_minus_b = new Set([...a].filter(x => !b.has(x)));
let b_minus_a = new Set([...b].filter(x => !a.has(x)));
let a_intersect_b = new Set([...a].filter(x => b.has(x)));
console.log([...a_minus_b]) // {1}
console.log([...b_minus_a]) // {5}
console.log([...a_intersect_b]) // {2,3,4}
您可以使用一个对象作为地图,以避免线性扫描B
每个元素的A
作为user187291的回答:
function setMinus(A, B) {
var map = {}, C = [];
for(var i = B.length; i--; )
map[B[i].toSource()] = null; // any other value would do
for(var i = A.length; i--; ) {
if(!map.hasOwnProperty(A[i].toSource()))
C.push(A[i]);
}
return C;
}
非标准toSource()
方法用于获取唯一的属性名称。如果所有元素都已经具有唯一的字符串表示形式(与数字一样),则可以通过删除toSource()
调用来加快代码的速度。
使用jQuery最短的是:
var A = [1, 2, 3, 4];
var B = [1, 3, 4, 7];
var diff = $(A).not(B);
console.log(diff.toArray());
<script src="https://ajax.googleapis.com/ajax/libs/jquery/2.1.1/jquery.min.js"></script>
not
从3.0.0-rc1开始,jQuery 不再与通用对象一起使用。见github.com/jquery/jquery/issues/3147
我会哈希数组B,然后保留数组B中不存在的值:
function getHash(array){
// Hash an array into a set of properties
//
// params:
// array - (array) (!nil) the array to hash
//
// return: (object)
// hash object with one property set to true for each value in the array
var hash = {};
for (var i=0; i<array.length; i++){
hash[ array[i] ] = true;
}
return hash;
}
function getDifference(a, b){
// compute the difference a\b
//
// params:
// a - (array) (!nil) first array as a set of values (no duplicates)
// b - (array) (!nil) second array as a set of values (no duplicates)
//
// return: (array)
// the set of values (no duplicates) in array a and not in b,
// listed in the same order as in array a.
var hash = getHash(b);
var diff = [];
for (var i=0; i<a.length; i++){
var value = a[i];
if ( !hash[value]){
diff.push(value);
}
}
return diff;
}
getDifference(a, b, hashOfB)
,如果不通过它将被计算,否则将按原样重用。
结合Christoph的想法,并假设在数组和对象/哈希(each
以及朋友)上使用了几种非标准的迭代方法,我们可以在大约20行的线性时间内获得集合差,并集和交集:
var setOPs = {
minusAB : function (a, b) {
var h = {};
b.each(function (v) { h[v] = true; });
return a.filter(function (v) { return !h.hasOwnProperty(v); });
},
unionAB : function (a, b) {
var h = {}, f = function (v) { h[v] = true; };
a.each(f);
b.each(f);
return myUtils.keys(h);
},
intersectAB : function (a, b) {
var h = {};
a.each(function (v) { h[v] = 1; });
b.each(function (v) { h[v] = (h[v] || 0) + 1; });
var fnSel = function (v, count) { return count > 1; };
var fnVal = function (v, c) { return v; };
return myUtils.select(h, fnSel, fnVal);
}
};
这假设each
并且filter
为数组定义了,并且我们有两个实用程序方法:
myUtils.keys(hash)
:返回带有哈希键的数组
myUtils.select(hash, fnSelector,
fnEvaluator)
:返回一个数组,该数组具有调用fnEvaluator
键/值对的结果,对于该键/值对
fnSelector
返回true。
将select()
松散的Common Lisp的启发,只是filter()
和map()
集于一身。(最好在上定义它们Object.prototype
,但是这样做会对jQuery造成严重破坏,因此我选择了静态实用程序方法。)
性能:测试
var a = [], b = [];
for (var i = 100000; i--; ) {
if (i % 2 !== 0) a.push(i);
if (i % 3 !== 0) b.push(i);
}
给出了两个包含50,000和66,666元素的集合。使用这些值,AB大约需要75毫秒,而联合和相交每个大约需要150毫秒。(Mac Safari 4.0,使用Javascript日期作为计时。)
我认为这是20行代码的丰厚回报。
hasOwnProperty()
即使元素是数字:否则,Object.prototype[42] = true;
均值之类的东西42
就永远不会出现在结果集中
使用Underscore.js(实用JS库)
>>> var foo = [1,2,3]
>>> var bar = [1,2,4]
>>> _.difference(foo, bar);
[4]
一些简单的功能,借鉴@milan的答案:
const setDifference = (a, b) => new Set([...a].filter(x => !b.has(x)));
const setIntersection = (a, b) => new Set([...a].filter(x => b.has(x)));
const setUnion = (a, b) => new Set([...a, ...b]);
用法:
const a = new Set([1, 2]);
const b = new Set([2, 3]);
setDifference(a, b); // Set { 1 }
setIntersection(a, b); // Set { 2 }
setUnion(a, b); // Set { 1, 2, 3 }
至于禁食的方法,这不是很优雅,但是我已经进行了一些测试来确定。将一个数组作为对象加载要更快地进行大量处理:
var t, a, b, c, objA;
// Fill some arrays to compare
a = Array(30000).fill(0).map(function(v,i) {
return i.toFixed();
});
b = Array(20000).fill(0).map(function(v,i) {
return (i*2).toFixed();
});
// Simple indexOf inside filter
t = Date.now();
c = b.filter(function(v) { return a.indexOf(v) < 0; });
console.log('completed indexOf in %j ms with result %j length', Date.now() - t, c.length);
// Load `a` as Object `A` first to avoid indexOf in filter
t = Date.now();
objA = {};
a.forEach(function(v) { objA[v] = true; });
c = b.filter(function(v) { return !objA[v]; });
console.log('completed Object in %j ms with result %j length', Date.now() - t, c.length);
结果:
completed indexOf in 1219 ms with result 5000 length
completed Object in 8 ms with result 5000 length
但是,这仅适用于字符串。如果您打算比较编号的集合,则需要使用parseFloat映射结果。
b.filter(function(v) { return !A[v]; });
在第二个函数中不是c = 吗?
这行得通,但我认为另一个更短,更优雅
A = [1, 'a', 'b', 12];
B = ['a', 3, 4, 'b'];
diff_set = {
ar : {},
diff : Array(),
remove_set : function(a) { ar = a; return this; },
remove: function (el) {
if(ar.indexOf(el)<0) this.diff.push(el);
}
}
A.forEach(diff_set.remove_set(B).remove,diff_set);
C = diff_set.diff;