JavaScript中Map Object
夏目里绘 人气:0引言
在 JavaScript 中选择 Object 和 Map 的缺失指南
在 JavaScript 中,对象很方便。它们使我们能够轻松地将多条数据组合在一起。在 ES6 之后,我们为该语言添加了一个新功能 - Map
. 在很多方面,它似乎比Object
更强大,但界面有点笨拙。然而,大多数人在需要哈希映射时仍然会使用对象,并且只有在他们意识到键不能只是他们用例的字符串时才切换到使用。因此,在当今的 JavaScript 社区中Map
仍未得到充分利用。
在这篇文章中,我将分解您应该考虑使用Map
more 的所有原因及其性能特征与基准测试。
在 JavaScript 中,Object 是一个相当宽泛的术语。几乎所有东西都可以是一个对象,除了两种底部类型 -null
和undefined
. 在这篇博文中,Object 仅指普通的旧对象,由左大括号{
和右大括号分隔}
。
- 用于
Object
在作者时已知的属性/字段数量固定且有限的记录,例如配置对象。以及一般一次性使用的任何东西。 - 用于
Map
字典或哈希映射,其中条目数量可变,更新频繁,其键在作者时可能未知,例如事件发射器。 - 根据我的基准测试,除非键是小整数字符串,否则在插入、删除和迭代速度
Map
方面确实比Object
键更高效,并且它消耗的内存比Object
相同大小的要少。
为什么 Object 缺少哈希映射
将对象用于哈希映射最明显的缺点可能是对象只允许字符串和符号作为键。任何其他类型都将通过toString
将这些方法隐式转换为字符串。
const foo = [] const bar = {} const obj = {[foo]: 'foo', [bar]: 'bar'} console.log(obj) // {"": 'foo', [object Object]: 'bar'}
更重要的是,将对象用于哈希映射可能会导致混淆和安全隐患。
不需要的继承
在 ES6 之前,获取哈希映射的唯一方法是创建一个空对象。
const hashMap = {}
但是,在创建后,此对象不再为空。虽然hashMap
是用一个空的对象字面量制作的,但它会自动继承自Object.prototype
. 这就是为什么我们可以调用像hasOwnProperty
, toString
, constructor
on这样的方法,hashMap
即使我们从未在对象上明确定义这些方法。
由于原型继承,我们现在混合了两种类型的属性:存在于对象本身中的属性,即它自己的属性,以及存在于原型链中的属性,即继承的属性。因此,我们需要额外的检查(例如hasOwnProperty
)来确保给定的属性确实是用户提供的,而不是从原型继承的。
最重要的是,由于属性解析机制在 JavaScript 中的工作方式 Object.prototype
,运行时的任何更改都会在所有对象中产生连锁反应。 这为原型污染攻击打开了大门,这对于大型 JavaScript 应用程序来说可能是一个严重的安全问题。
幸运的是,我们可以通过使用来解决这个问题Object.create(null)
,这会生成一个不继承任何内容的对象Object.prototype
。
名称冲突
当一个对象自己的属性与其原型上的属性发生名称冲突时,它会破坏预期并因此使您的程序崩溃。
例如,我们有一个foo
接受对象的函数:
function foo(obj) { //... for(const key in obj) { if(obj.hasOwnProperty(key)) { } } }
存在可靠性风险obj.hasOwnProperty(key)
:考虑到属性解析机制在 JavaScript 中的工作方式,如果obj
包含用户提供的同名属性,则会hasOwnProperty
隐藏Object.prototype.hasOwnProperty
. 结果,我们不知道在运行时会准确调用哪个方法。
可以进行一些防御性编程来防止这种情况。例如,我们可以借用hasOwnProperty
来代替: Object.prototype
function foo(obj) { //... for(const key in obj) { if(Object.prototype.hasOwnProperty.call(obj, key)) { // ... } } }
一种更短的方法可能是在对象文字上调用该方法,{}.hasOwnProperty.call(key)
但它仍然很麻烦。这就是为什么有一个新添加的静态方法Object.hasOwn
。
尺寸
Object
没有提供方便的 API 来获取大小,即属性的数量。构成对象大小的因素也有细微差别:
- 如果您只关心字符串、可枚举键,那么您可以将键转换为数组
Object.keys()
并获取其length
. - 如果您想考虑不可枚举的字符串键,那么您必须使用
Object.getOwnPropertyNames
来获取键列表并获取其长度。 - 如果您对符号键感兴趣,可以使用
getOwnPropertySymbols
来显示符号键。或者,您可以使用Reflect.ownKeys
同时获取字符串键和符号键,无论它是否可枚举。
迭代
遍历对象也有类似的复杂性。
我们可以使用良好的旧for...in
循环。但它揭示了继承的可枚举属性:
Object.prototype.foo = 'bar' const obj = {id: 1} for(const key in obj) { console.log(key) // 'id', 'foo' }
我们不能用for...of
与对象一起使用,因为默认情况下它不是可迭代的,除非我们用Symbol.iterator
在其上显式定义方法。
我们可以使用Object.keys
,Object.values
和Object.entries
来获取可枚举的字符串键(或/和值)列表,然后对其进行迭代,这会引入额外的开销步骤。
最后,臭名昭著的插入顺序没有得到充分尊重。在大多数浏览器中,整数键按升序排序并且优先于字符串键,即使字符串键插入到整数键之前也是如此。
const obj = {} obj.foo = 'first' obj[2] = 'second' obj[1] = 'last' console.log(obj) // {1: 'last', 2: 'second', foo: 'first'}
清除
没有简单的方法可以从对象中删除所有属性,您必须使用delete
操作符一个一个地删除每个属性,这在历史上被认为是缓慢的。但是我的基准测试表明,它的性能实际上比不上Map.prototype.delete
检查属性是否存在
最后,我们不能依赖点/括号符号来检查属性是否存在,因为值本身可以设置为undefined
. 相反,我们必须使用Object.prototype.hasOwnProperty
和 Object.hasOwn
。
const obj = {a: undefined} Object.hasOwn(obj, 'a') // true
哈希映射的映射
ES6 带来了 Map。它更适合哈希映射。
首先,与Object
只允许字符串和符号作为键不同,它Map
支持任何数据类型的键。
但是,如果您Map
用于存储对象的元数据,那么您应该使用它WeakMap
来避免内存泄漏。
但更重要的是,Map
它提供了用户定义和内置程序数据之间的清晰分离,但代价是额外的检索条目。
Map
还提供了更好的人体工程学:Map
默认情况下,A 是可迭代的。这意味着您可以使用for...of
轻松迭代地图,并执行诸如使用嵌套解构从地图中提取第一个条目之类的操作。
const [[firstKey, firstValue]] = map
与Object
相比Map
为各种常见任务提供专用 API:
Map.prototype.has
检查给定条目的存在,Object.prototype.hasOwnProperty
/Object.hasOwn
在对象上相比不那么尴尬
Map.prototype.get
返回与提供的键关联的值。人们可能会觉得这比对象上的点表示法或括号表示法更笨拙。然而,它在用户数据和内置方法之间提供了清晰的分离。
Map.prototype.size
返回 a 中的条目数,Map
它显然是获得对象大小所必须执行的操作的赢家。此外,它要快得多。
Map.prototype.clear
删除 a 中的所有条目,Map
它比运算符delete
快得多。
性能
在大多数情况下,JavaScript 社区似乎普遍认为Map
比Object
好. 有些人声称要通过Object
切换到Map
.
我磨练 Leetcode 的经验似乎证实了这个信念:Leetcode 将大量数据作为测试用例提供给您的解决方案,如果您的解决方案耗时过长,它就会超时。像这样的问题只有在你使用Object
时才会超时,而不是在Map
.
但是,我相信只是说“Map
比对象更快”是简化的。一定有一些细微差别是我想自己找出来的。所以。我构建了一个小应用程序来运行一些基准测试。
基准测试实施细节
该应用程序有一个表格,显示在Object
和Map
上测量的插入、迭代和删除速度。
插入和迭代的性能以每秒操作数来衡量。我编写了一个 util 函数measureFor
,它重复运行目标函数,直到达到指定的最小时间阈值(即duration
UI 上的输入字段)。它返回每秒执行此类函数的平均次数。
function measureFor(f, duration) { let iterations = 0; const now = performance.now(); let elapsed = 0; while (elapsed < duration) { f(); elapsed = performance.now() - now; iterations++; } return ((iterations / elapsed) * 1000).toFixed(4); }
至于删除,我只是要测量使用delete
运算符从对象中删除所有属性所需的时间,并将其与 Map.prototype.delete
相同大小的 Map 的时间进行比较。我可以使用Map.prototype.clear
,但它违背了基准测试的目的,因为我确信它会更快。
在这三个操作中,我更加关注插入,因为它往往是我在日常工作中执行的最常见的操作。对于迭代性能,很难提出一个包罗万象的基准,因为我们可以在给定对象上执行许多不同的迭代变体。这里我只测量for ... in
循环。
我在这里使用了三种类型的键:
- 字符串,例如
yekwl7caqejth7aawelo4
. - 整数字符串,例如
123
. - 由 生成的数字字符串
Math.random().toString()
,例如0.4024025689756525
。
所有的键都是随机生成的,所以我们不会碰到 V8 实现的内联缓存。我还显式地将整数和数字键转换为字符串,然后再将它们添加到对象以避免隐式转换的开销。
最后,在基准测试开始之前,还有一个至少 100 毫秒的预热阶段,我们反复创建新的对象和地图,这些新对象和地图会立即被丢弃。
如果你想玩,我把代码放在Codesandbox上。
我从100个属性/条目的Object和Map开始,一直到5000000,让每种类型的操作持续运行10000ms,看看它们彼此之间的表现如何。以下是我的发现……
为什么我们在条目数达到 5000000 时停止?
字符串键
一般来说,当键是(非数字)字符串时,在所有操作上都Map
优于Object
。
但细微差别在于,当条目数量不是很大(低于 100000)时,Map
插入速度是Object
插入速度的两倍,但随着大小增长超过 100000,性能差距开始缩小。
我制作了一些图表来更好地说明我的发现。
上图显示了随着条目数量的增加(x 轴),插入率如何下降(y 轴)。但是因为 X 轴扩展得太宽(从 100 到 1000000),所以很难分辨这两条线之间的差距。
然后我使用对数刻度来处理数据并制作下面的图表。
您可以清楚地看出两条线正在汇合。
我制作了另一个图表,绘制了Map
与Object
插入速度相关的速度。您可以看到Map
开始时比Object
快. 然后随着时间的推移,性能差距开始缩小。Map
随着规模增长到 5000000,最终速度仅快 30%。
但是,我们大多数人在一个对象或映射中永远不会有超过 100 万个条目。具有数百或数千个条目的大小. 因此,我们是否应该把它留在那儿,然后全力以赴开始重构我们的代码库Map
?
绝对不会……或者至少没有期望我们的应用程序会快 2 倍。请记住,我们还没有探索过其他类型的键。让我们看一下整数键。
整数键
我特别想对具有整数键的对象运行基准测试的原因是 V8 在内部优化了整数索引属性并将它们存储在可以线性和连续访问的单独数组中。我找不到任何资源来确认它对Map
采用了相同类型的优化。
让我们首先尝试 [0, 1000] 范围内的整数键。
正如我所料,这次Object
跑赢大盘。 Object
插入速度比Map
快 65%,迭代速度快 16%。
让我们扩大范围,使键中的最大整数为 1200。
现在似乎Map
开始比Object
快一点
现在我们只增加了整数键的范围,而不是和的实际Object
大小Map
。让我们增大尺寸,看看它如何影响性能。
当属性大小为1000时,Object
的插入速度比Object
快70%,迭代速度比Map
慢2倍。
我尝试了许多不同的Object
/Object
大小和整数键范围的组合,但未能想出一个明确的模式。但我看到的总体趋势是,随着大小的增长,使用一些相对较小的整数作为键,Object
在插入方面的性能可以比map
更好,总是与删除大致相同,迭代速度是map
的4到5倍。最大整数键的阈值,即Object
在插入时开始变慢的阈值,将随着Object
的大小而增长。例如,当该Object
只有100个表项时,阈值为1200;当它有10000个条目时,阈值似乎在24000左右。
数字键
最后,我们来看看最后一种键——数字键。
从技术上讲,以前的整数键也是数字的。这里的数字键特指生成的数字字符串Math.random().toString()
。
结果与字符串-键的情况类似:map
开始时比Object
快得多(插入和删除快2倍,迭代快4-5倍),但随着大小的增加,增量越来越小。
嵌套对象/地图呢?
内存使用情况
基准测试的另一个重要方面是内存利用率。
由于我无法控制浏览器环境中的垃圾收集器,因此我决定在 Node.js 中运行基准测试。
我创建了一个小脚本来测量它们各自的内存使用情况,并在每次测量中手动触发完全垃圾收集。运行它,node --expose-gc
我得到以下结果:
{
object: {
'string-key': {
'10000': 3.390625,
'50000': 19.765625,
'100000': 16.265625,
'500000': 71.265625,
'1000000': 142.015625
},
'numeric-key': {
'10000': 1.65625,
'50000': 8.265625,
'100000': 16.765625,
'500000': 72.265625,
'1000000': 143.515625
},
'integer-key': {
'10000': 0.25,
'50000': 2.828125,
'100000': 4.90625,
'500000': 25.734375,
'1000000': 59.203125
}
},
map: {
'string-key': {
'10000': 1.703125,
'50000': 6.765625,
'100000': 14.015625,
'500000': 61.765625,
'1000000': 122.015625
},
'numeric-key': {
'10000': 0.703125,
'50000': 3.765625,
'100000': 7.265625,
'500000': 33.265625,
'1000000': 67.015625
},
'integer-key': {
'10000': 0.484375,
'50000': 1.890625,
'100000': 3.765625,
'500000': 22.515625,
'1000000': 43.515625
}
}
}
很明显,Map
消耗的内存比Object
少20%到50%,这并不奇怪,因为Map
它不存储属性描述符,例如writable
// like 。enumerable``configurable``Object
结论
那么我们能从这一切中得到什么?
-
Map
比Object
更快,除非您有小的整数和数组索引键,而且它的内存效率更高。 - 如果需要经常更新的哈希映射,可以使用
Map
; 如果你想要一个固定的键值集合(例如记录),请使用Object
,并注意原型继承带来的陷阱。
如果您确切了解 V8 如何优化的细节,
Map
或者只是想指出我的基准测试中的缺陷,请联系我。我很乐意根据您的信息更新这篇文章!
浏览器兼容性注意事项
Map
是 ES6 的一个特性。到目前为止,我们大多数人都不应该担心它的兼容性,除非你的目标用户群是一些小众的旧浏览器。“旧”是指比 IE 11 更早,因为即使 IE 11 也支持Map而此时 IE 11已死。我们不应该在默认情况下盲目地转译和添加 polyfill 到目标 ES5,因为它不仅会膨胀你的包大小,而且与现代 JavaScript 相比运行起来很慢。最重要的是,它会惩罚 99.999% 的使用现代浏览器的用户。
另外,我们不必放弃对旧版浏览器的支持——nomodule
通过提供后备包来提供旧版代码,这样我们就可以避免使用现代浏览器降低访问者的体验。
JavaScript 语言在不断发展,平台在优化现代 JavaScript 方面也越来越好。我们不应该以浏览器兼容性为借口忽略所有已做出的改进。
加载全部内容