Web Session浅入浅出
发布于 12 天前 作者 1000copy 320 次浏览 来自 分享

使用过几种Web App开发语言和框架,都会接触到Session的概念。即使是一个简单站点访问计数的功能,也常常使用Session来实现的。其他常用的领域还有购物车,登录用户等。但是,对Session一直是一知半解,知其然而不知其所以然。

在认真的研究了HTTP协议,以及nodejs开发栈的express和express-session后,我终于比较有把握深入浅出的说清楚Session了,也算是满足了多年来开发过程中,常常浮现的对Session的好奇心吧。

本文使用nodejs v9.5.0作为技术验证工具。阅读本文前需要了解基础的HTTP知识和Cookie知识。详细需要参考rfc6265,或者阅读《HTTP小书》的最后一章。

会话的概念

用户在网站的一组相互关联的的请求和响应,就是一次会话。简而言之是这样的:

  1. 会话 = 一组访问
  2. 访问 = 一次请求和响应

比如一个最简单的nodejs HTTP程序:

var http = require('http')
http.createServer(function(req,res){
    res.end('hello')	
}).listen(3000)

每个请求都会进入到此处理函数:function(req,res){res.end('hello') },在此函数内获得请求,处理响应,完成后发给客户端,就是一次访问。通过浏览器的developer tools,可以看到此次会话的请求内容和响应内容。

以站点计数应用为案例来说明的话,就是这些来自于同样访问者的多次访问,都可以获得当前站点的访问计数。

引入会话

我们从一个案例开始引入会话的概念。当我们需要访问站点计数一类的功能时,我们希望用户访问此站点时:

  1. 第一次访问时,显示你的访问次数为1
  2. 以后每次访问时,访问计数加1

此种情况下,我们需要有一个地方存储当前计数,这样才能在同一个客户在此访问时,可以取出当前计数,加一后返回给客户。当然也因此需要识别此用户(浏览器),为每个用户单独计数。就是说,不同的用户访问时,需要去取对应用户的当前计数。

识别客户的问题,常用的方法就是使用Cookie。Cookie是HTTP协议的一部分。HTTP可以通过头字段Set-Cookie为来访客户做一个标记,这个标记常常就是一个ID,下一次访问此站点时,HTTP会通过Cookie头字段,发送此ID到站点,由此站点知道此客户的身份和这个身份关联的状态信息,比如当前访问计数,或者此身份当前的购物车的内容等等。

识别了客户后,就可以在Web服务器内,为此客户建立它的独特的状态信息。

实现一个会话

基于nodejs HTTP模块,我们实现一个极为简单的Session服务。只是为了展示概念,而不是为了实用的目的。此服务可以实现一个共享于同一站点的多次访问的req.session变量,此变量为一个对象,可以在此变量内写入新的成员,或者修改现存的成员变量的值,每次访问后会保存req.session,以便下次访问可以得到当前的值:

var http = require('http')
var sessionkey = "sessionkey3"
http.createServer(function(req,res){
	if (req.url =="/"){
		session(req,res)
		req.session.count = (req.session.count+1) || 1
		res.end('hi'+req.session.count)
	}else
		res.end('')	
}).listen(3000)
console.log('listen on 3000')
function session(req,res){
	if (req.session)
		return
	var answer ,id
	if(isSessionOk(req)){
		id = getCookie(req)
		answer = getSessionById(id)
	}else{
		answer=  {}
		id = createSession(answer)
		setCookie(res,id)
	}
	req.session = answer
	res.on('finish', function() {
		saveSession(id,req.session)
	});
}
function hasCookie(req){
  return (getCookie(req)!='') 
}
function getCookie(req){
  try{
	  var c = req.headers['cookie']
	  var arr = c.split(';')
	  for (var i = 0; i < arr.length; i++) {
	  	var kv = arr[i]
	  	var a = kv.split('=')
	  	if (a[0].trim() == sessionkey)
	  		return a[1]
	  }
  }catch(error){
  	return ''
  }
  return ''
}
function setCookie(res,id){
  res.setHeader("set-cookie",sessionkey +"="+id)
}
var sessions = {}
var sid = 0  
function getSessionById(sid){
	return sessions[sid]
}
function getSessionByReq(req){
	var sid = getCookie(req)
	return sessions[sid]
}
function createSession(session){
	sessions[sid++,session]
	return sid
}
function saveSession(sid,session){
	sessions[sid] = session
}
function isSessionOk(req){
	return hasCookie(req) && getSessionByReq(req) !== undefined
}

程序代码比较简单,读者可以保持它到index.js,然后执行此程序,验证概念:

node index.js 

然后,启动chrome,访问站点localhost:3000,然后多次刷新,你可以看到每次刷新,返回的访问次数逐步累加。在打开另一个浏览器,比如safari,在此访问此站点,你会发现返回的访问计数从1开始,另外计数。因为是两个不同的浏览器内器,这就保证的它们是不同的访问客户,在站点内的代码,会区别两者,分别记录它们的状态信息。

代码使用了HTTP Cookie,基本算法很简单:

  1. 如果Session没有准备好,那么创建一个Session,得到Session的ID,把此ID通过Set-Cookie发送给浏览器。浏览器会在下一次访问此站点时,发送此ID。
  2. 如果Session已经准备好了,也就是说,浏览器通过Cookie发来了ID,并且通过此ID,可以在站点内获取到Session
  3. 把创建或者获取的Session赋值给req对象
  4. 在请求处理函数生命周期内,可以获取和修改Session对象
  5. 在请求处理完后,保存此Session变量

可能大家看到sessionkey这个变量,感觉有些莫名其妙。原因是每次cookie发送,同样的站点可能有多个框架需要使用此cookie头字段,比如php,aspx,jsp等都是需要使用了,为了好像不要冲突,大家各自使用cookie头字段内各自的key/value对即可。比如php的key默认是phpsessid,express-session默认的是connect.sid。

总结

此代码演示了最基础的Session的概念,但是远远不是一个可用的模块,想要真实世界中使用的Session模块,可以考虑express-session。

实现一个真正可以的会话,还需要考虑很多问题:

  1. 本文中使用是Session Id其实就是一个自增的整数。这会导致客户端欺骗,黑客可以猜到SessionID,使用伪造的SessionID获得服务器内对应的状态数据,或者伪造登录从而获得更高权限。真实的产品,一般是创建一个保证唯一的,不易猜测出来的字符串。
  2. 本文中的Session每次end后会必然保存,而不管此Session是否修改。实际的产品,是需要考虑此优化的。同时,也需要考虑到Session的失效期,到了失效期就会销毁,因为有些客户可能来一次两次也后再也不来访问了,没有必要为他们保存状态信息,如果再来了,不妨重新创建会话即可。
  3. 本文的Session保存在内存中,一旦重启,所有会话都会丢失。实际产品中,是需要支持持久化的保存的,比如保存到mysql数据库内,redis内,mongodb内等等。因此需要数据持久化的多提供者的方案。

更多的考量,可以去通过阅读express-session来获得。本文阅读完毕,本身就是可以成为阅读express-session的基础材料的。

回到顶部