精华 通过源码解析 Node.js 中 events 模块里的优化小细节
发布于 3 天前 作者 DavidCai1993 680 次浏览 最后一次编辑是 2 天前 来自 分享

之前的文章里有说,在 Node.js 中,流(stream)是许许多多原生对象的父类,角色可谓十分重要。但是,当我们沿着“族谱”往上看时,会发现 EventEmitter 类是流(stream)类的父类,所以可以说,EventEmitter 类是 Node.js 的根基类之一,地位可显一般。虽然 EventEmitter 类暴露的接口并不多而且十分简单,并且是少数纯 JavaScript 实现的模块之一,但因为它的应用实在是太广泛,身份太基础,所以在它的实现里处处闪光着一些优化代码执行效率,和保证极端情况下代码结果正确性的小细节。在了解之后,我们也可以将其使用到我们的日常编码之后,学以致用。

好,现在就让我们跟随 Node.js 项目中的 lib/events.js 中的代码,来逐一了解:

  • 效率更高的 键 / 值 对存储对象的创建。
  • 效率更高的从数组中去除一个元素。
  • 效率更高的不定参数的函数调用。
  • 如果防止在一个事件监听器中监听同一个事件,接而导致死循环?
  • emitter.once 是怎么办到的?

效率更高的 键 / 值 对存储对象的创建

EventEmitter 类中,以 键 / 值 对的方式来存储事件名和对应的监听器。在 Node.js里 ,最简单的 键 / 值 对的存储方式就是直接创建一个空对象:

let store = {}
store.key = 'value'

你可能会说,ES2015 中的 Map 已经在目前版本的 Node.js 中可用了,在语义上它更有优势:

let store = new Map()
store.set('key', 'value')

不过,你可能只需要一个纯粹的 键 / 值 对存储对象,并不需要 ObjectMap 这两个类的原型中的提供的那些多余的方法,所以你直接:

let store = Object.create(null)
store.key = 'value'

好,我们已经做的挺极致了,但这还不是 EventEmitter 中的最终实现,它的办法是使用一个空的构造函数,并且把这个构造的原型事先置空:

function Store () {}
Store.prototype = Object.create(null)

然后:

let store = new Store()
store.key = 'value'

现在让我们来比一比效率,代码:

/* global suite bench */
'use strict'

suite('key / value store', function () {
  function Store () {}
  Store.prototype = Object.create(null)

  bench('let store = {}', function () {
    let store = {}
    store.key = 'value'
  })

  bench('let store = new Map()', function () {
    let store = new Map()
    store.set('key', 'value')
  })

  bench('let store = Object.create(null)', function () {
    let store = Object.create(null)
    store.key = 'value'
  })

  bench('EventEmitter way', function () {
    let store = new Store()
    store.key = 'value'
  })
})

比较结果:

                      key / value store
      83,196,978 op/s » let store = {}
       4,826,143 op/s » let store = new Map()
       7,405,904 op/s » let store = Object.create(null)
     165,608,103 op/s » EventEmitter way

效率更高的从数组中去除一个元素

EventEmitter#removeListener 这个 API 的实现里,需要从存储的监听器数组中除去一个元素,我们首先想到的就是使用 Array#splice 这个 API ,即 arr.splice(i, 1) 。不过这个 API 所提供的功能过于多了,它支持去除自定义数量的元素,还支持向数组中添加自定义的元素。所以,源码中选择自己实现一个最小可用的:

// lib/events.js
// ...

function spliceOne(list, index) {
  for (var i = index, k = i + 1, n = list.length; k < n; i += 1, k += 1)
    list[i] = list[k];
  list.pop();
}

比一比,代码:

/* global suite bench */
'use strict'

suite('Remove one element from an array', function () {
  function spliceOne (list, index) {
    for (var i = index, k = i + 1, n = list.length; k < n; i += 1, k += 1) {
      list[i] = list[k]
    }
    list.pop()
  }

  bench('Array#splice', function () {
    let array = [1, 2, 3]
    array.splice(1, 1)
  })

  bench('EventEmitter way', function () {
    let array = [1, 2, 3]
    spliceOne(array, 1)
  })
})

结果,好吧,秒了:

                      Remove one element from an array
       4,262,168 op/s » Array#splice
      54,829,749 op/s » EventEmitter way

效率更高的不定参数的函数调用

在事件触发时,监听器拥有的参数数量是任意的,所以源码中优化了不定参数的函数调用。

不过好吧,这里使用的是笨办法,即…把不定参数的函数调用转变成固定参数的函数调用,且最多支持到三个参数:

// lib/events.js
// ...

function emitNone(handler, isFn, self) {
  // ...
}
function emitOne(handler, isFn, self, arg1) {
  // ...
}
function emitTwo(handler, isFn, self, arg1, arg2) {
  // ...
}
function emitThree(handler, isFn, self, arg1, arg2, arg3) {
  // ...
}

function emitMany(handler, isFn, self, args) {
  // ...
}

虽然结果不言而喻,我们还是比较下会差多少,以三个参数为例:

/* global suite bench */
'use strict'

suite('calling function with any amount of arguments', function () {
  function nope () {}

  bench('Function#apply', function () {
    function callMany () { nope.apply(null, arguments) }
    callMany(1, 2, 3)
  })

  bench('EventEmitter way', function () {
    function callThree (a, b, c) { nope.call(null, a, b, c) }
    callThree(1, 2, 3)
  })
})

结果显示差了一倍:

                      calling function with any amount of arguments
      11,354,996 op/s » Function#apply
      23,773,458 op/s » EventEmitter way

如果防止在一个事件监听器中监听同一个事件,接而导致死循环?

在注册事件监听器时,你可否曾想到过这种情况:

'use strict'
const EventEmitter = require('events')

let myEventEmitter = new EventEmitter()

myEventEmitter.on('wtf', function wtf () {
  myEventEmitter.on('wtf', wtf)
})

myEventEmitter.emit('wtf')

运行上述代码,是否会直接导致死循环?答案是不会,因为源码中做了处理。

我们先看一下具体的代码:

// lib/events.js
// ...

function emitMany(handler, isFn, self, args) {
  if (isFn)
    handler.apply(self, args);
  else {
    var len = handler.length;
    var listeners = arrayClone(handler, len);
    for (var i = 0; i < len; ++i)
      listeners[i].apply(self, args);
  }
}

// ...
function arrayClone(arr, i) {
  var copy = new Array(i);
  while (i--)
    copy[i] = arr[i];
  return copy;
}

其中的 handler 便是具体的事件监听器数组,不难看出,源码中的解决方案是,使用 arrayClone 方法,拷贝出另一个一模一样的数组,来执行它,这样一来,当我们在监听器内监听同一个事件时,的确给原监听器数组添加了新的函数,但并没有影响到当前这个被拷贝出来的副本数组。

emitter.once 是怎么办到的

这个很简单,使用了闭包:

function _onceWrap(target, type, listener) {
  var fired = false;
  function g() {
    target.removeListener(type, g);
    if (!fired) {
      fired = true;
      listener.apply(target, arguments);
    }
  }
  g.listener = listener;
  return g;
}

你可能会问,我既然已经在 g 函数中的第一行中移除了当前的监听器,为何还要使用 fired 这个 flag ?我个人觉得是因为,在 removeListener 这个同步方法中,会将这个 g 函数暴露出来给 removeListener 事件的监听器,所以该 flag 用来保证 once 注册的函数只会被调用一次。

最后

分析就到这里啦,在了解了这些做法之后,在今后我们写一些有性能要求的底层工具库等东西时,我们便可以用上它们啦。EventEmitter 类的源码并不复杂,并且是纯 JavaScript 实现的,所以也非常推荐大家闲时一读。

参考:

19 回复

不错,第二个删除数组元素很有用

想问一下node的模块有哪些是纯js实现的,有些时候看node源码,一看到c++相关就很恶心,压根不知道根本是怎么实现的

@youth7 简单一点的,可以看 events 。有挑战一点的,可以尝试看看 stream :)

为何

let store = {} //1
let store = Object.create(null) //2

2比1的效率高

这种文章才应该精华 ,顺便问一下这个bunch是什么模块

@captainblue2013 笔误。。。。我就是想问 为何1比2 高 2中没有多余的原型上的方法啊

我既然已经在 g 函数中的第一行中移除了当前的监听器,为何还要使用 fired 这个 flag ?我个人觉得是因为,防止在并发情况下,出现 removeListener 函数还未执行完时,函数再次被调用。

removeListener 是个同步的操作,在 js 单线程的环境中,不会出现你说的函数被两次调用的问题。

这个 .once 的地方,我觉得它就是把【移除事件】跟【只调用一次】作为两个单独的逻辑来处理,而不是通过【移除事件】这一逻辑的副作用来保证只调用一次。

这个地方如果正常使用事件的 emit 的话,我觉得 fired 变量就是不必要的。什么时候这个 fired 是必要的呢?那就是 g 这个函数被单独取出来调用,而非通过 .emit 的方式调用。

【移除事件】更多是为了防止内存泄露,以及切实地清除掉 listeners 里面多余的回调函数。至于它能带来的的【只调用一次】这个附加的作用,可能是没被认真考虑的。

@DavidCai1993 我不确定我这样想对不对,但确实那个地方是没法『并发』进入的呀

eventemitter,表面说起来是各种异步啥啥的,其实里面绝大部分代码都是同步的对吗。。。?

@alsotang 刚才在路上想了想,感觉问题是出在 removeListener 这个方法里,坐下翻看一下文档,果然,这个方法会触发 removeListener 事件,会给监听器暴露两个参数:eventNamelistener ,在上面的场景里,listener 参数就是 g 。在这个 removeListener 监听器再执行 listener 时,可能会先把这个 g 给执行了。所以它的意图是,保证 once 注册的监听器只会执行一次,验证:

'use strict'
const EventEmitter = require('events')

let ee = new EventEmitter()

ee.once('wtf', () => { console.log('wtf') })

ee.on('removeListener', (eventName, listener) => {
  console.log(`eventName: ${eventName}`)
  listener.call(ee)
})

ee.emit('wtf')
// eventName: wtf
// wtf

但是从代码来看,Node.js 还是留了后门的:

'use strict'
const EventEmitter = require('events')

let ee = new EventEmitter()

ee.once('wtf', () => { console.log('wtf') })

ee.on('removeListener', (eventName, listener) => {
  console.log(`eventName: ${eventName}`)
  listener.listener()
})

ee.emit('wtf')
// eventName: wtf
// wtf
// wtf

我觉得是这个原因!你觉得捏?你也觉得的话,我就把文章内容改了。。

@alsotang “eventemitter,表面说起来是各种异步啥啥的,其实里面绝大部分代码都是同步的对吗。。。?” 赞同。

@DavidCai1993 这种用法太 hack 了,我还是认为这段代码在产出时,【移除事件】和【保证只调用一次】是两个分开的逻辑。

这样理解就不用在意为什么事件都移除了,还需要通过一个 flag 去标记。

那段内容本身是很正常的。。。说明 fired 变量的作用就好了。只需要告诉大家它们的 once 通过 fired 变量来标记只运行一次,并且运行时,删除了回调监听。

@alsotang 嗯已修改原文,说明了那个情况~

回到顶部