es6 Map and Set 复杂度,v8 实现

IT技术 javascript ecmascript-6 set complexity-theory v8
2021-02-08 08:32:25

在 v8 实现中检索/查找是 O(1) 是一个公平的假设吗?

(我知道标准并不能保证)

5个回答

在 v8 实现中检索/查找是 O(1) 是一个公平的假设吗?

是的。V8 使用哈希表的变体,O(1)这些变体通常对这些操作具有复杂性。

有关详细信息,您可能想查看https://codereview.chromium.org/220293002/,其中OrderedHashTable基于https://wiki.mozilla.org/User:Jorend/Deterministic_hash_tables实现

@DiegoPino:谢谢。我以某种方式认为OrderedHashTable实现仍然是最新的,因为我在后备箱中找到了它......
2021-03-21 08:32:25
为了进一步扩展,V8 中的 Map 和 Set 最近在 JavaScript 中重新实现codereview.chromium.org/947683002这在 V8 中很常见,在 JavaScript 中实现新功能让 JIT(Crankshaft/Turbofan)优化运行时代码。
2021-03-27 08:32:25
如实现看起来以来,从移动src/collections.jssrc/builtins/builtins-collections-gen.cc github.com/v8/v8/blob/master/src/builtins/...
2021-03-29 08:32:25

对于不想把兔子洞挖得太深的人:

1:我们可以假设好的哈希表实现实际上具有 O(1) 时间复杂度。
2:这是张贴V8团队博客中解释了一些内存优化是如何在其完成的散列表实施方案MapSetWeakSet,和WeakMap优化哈希表:隐藏的哈希码

基于1和2:V8的设置和地图的getsetaddhas时间复杂度几乎为O(1)。

let map = new Map();
let obj = {};

const benchMarkMapSet = size => {
console.time("benchMarkMapSet");
for (let i = 0; i < size; i++) {
    map.set(i, i);
}
console.timeEnd("benchMarkMapSet");
};

const benchMarkMapGet = size => {
console.time("benchMarkMapGet");
for (let i = 0; i < size; i++) {
    let x = map.get(i);
}
console.timeEnd("benchMarkMapGet");
};

const benchMarkObjSet = size => {
console.time("benchMarkObjSet");
for (let i = 0; i < size; i++) {
    obj[i] = i;
}
console.timeEnd("benchMarkObjSet");
};

const benchMarkObjGet = size => {
console.time("benchMarkObjGet");
for (let i = 0; i < size; i++) {
    let x = obj[i];
}
console.timeEnd("benchMarkObjGet");
};

let size = 2e6;

benchMarkMapSet(size);
benchMarkObjSet(size);
benchMarkMapGet(size);
benchMarkObjGet(size);

benchMarkMapSet: 382.935ms benchMarkObjSet: 76.077ms benchMarkMapGet: 125.478ms benchMarkObjGet: 2.764ms

benchMarkMapSet: 373.172ms benchMarkObjSet: 77.192ms benchMarkMapGet: 123.035ms benchMarkObjGet: 2.638ms

那是因为 Map 类是按插入排序的。
2021-04-05 08:32:25

最初的问题已经得到解答,但是 O(1) 并没有说明实现的效率如何。

首先,我们需要了解 Maps 使用了哈希表的哪些变体。“经典”哈希表不会这样做,因为它们不提供任何迭代顺序保证,而 ES6 规范要求按迭代顺序插入。因此,V8 中的 Map 建立在所谓的确定性哈希表之上这个想法类似于经典算法,但还有另一层用于存储桶的间接层,所有条目都被插入并存储在固定大小的连续数组中。确定性哈希表算法确实保证了基本操作的 O(1) 时间复杂度,例如setget

接下来,我们需要知道哈希表的初始大小、负载因子以及它如何(以及何时)增长/缩小。简短的回答是:初始大小为 4,加载因子为 2,表(即 Map)在达到其容量后立即增长 x2,并在删除超过 1/2 的条目时收缩。

让我们考虑最坏的情况,当表有 N 个条目中的 N 个条目(它已满),所有条目都属于一个桶,并且所需条目位于尾部。在这种情况下,查找需要通过链元素进行 N 次移动。

另一方面,在最好的情况下,当表已满,但每个桶有 2 个条目时,查找最多需要 2 次移动。

众所周知,虽然散列表中的单个操作“便宜”,但重新散列却不是。重新散列的时间复杂度为 O(N),需要在堆上分配新的散列表。此外,在必要时,重新散列作为插入或删除操作的一部分执行。因此,例如,map.set()通话费用可能比您预期的要高。幸运的是,重新散列是一种相对不常见的操作。

除此之外,诸如内存布局或散列函数之类的细节也很重要,但我不会在这里详细介绍这些细节。如果您对 V8 Maps 的工作原理感到好奇,可以在此处找到更多详细信息前段时间我对这个话题很感兴趣,并试图以一种可读的方式分享我的发现。

我们为什么不只是测试。

var size_1 = 1000,
    size_2 = 1000000,
    map_sm = new Map(Array.from({length: size_1}, (_,i) => [++i,i])),
    map_lg = new Map(Array.from({length: size_2}, (_,i) => [++i,i])),
    i      = size_1,
    j      = size_2,
    s;

s = performance.now();
while (i) map_sm.get(i--);
console.log(`Size ${size_1} map returns an item in average ${(performance.now()-s)/size_1}ms`);
s = performance.now();
while (j) map_lg.get(j--);
console.log(`Size ${size_2} map returns an item in average ${(performance.now()-s)/size_2}ms`);

所以对我来说,随着规模的增长,它似乎收敛到 O(1)。那么让我们称之为 O(1) 吧。