一、对多租户的理解
多租户定义:多租户技术或称多重租赁技术,简称SaaS,是一种软件架构技术,是实现如何在多用户环境下(此处的多用户一般是面向企业用户)共用相同的系统或程序组件,并且可确保各用户间数据的隔离性。简单讲:在一台效劳器上运行单个应用实例,它为多个租户(客户)提供效劳。从定义中我们可以理解:多租户是一种架构,目的是为了让多用户环境下使用同一套程序,且保证用户间数据隔离。那么重点就很粗浅易懂了,多租户的重点就是同一套程序下实现多用户数据的隔离。对于实现方式,我们下面会讨论到。
在理解详细一点:在一个多租户的构造下,应用都是运行在同样的或者是一组效劳器下,这种构造被称为“单实例”架构(Single Instance),单实例多租户。多个租户的数据是保管在相同位置,依靠对数据库分区来实现隔离操作。既然用户都在运行相同的应用实例,效劳运行在效劳供给商的效劳器上,用户无法去停止定制化的操作,所以这对于对该产品有特殊需要定制化的客户就无法适用,所以多租户适宜通用类需求的客户。那么缺点来了,多租户下无法实现用户的定制化操作。
在翻阅多租户的资料时,还有一个名词与之相对应,那就是单租户SaaS架构(也被称作多实例架构(Multiple Instance))。单租户架构与多租户的区别在于,单租户是为每个客户单独创建各自的软件应用和支撑环境。单租户SaaS被广泛引用在客户需要支持定制化的应用场所,而这种定制或者是因为地域,抑或是他们需要更高的安全控制。通过单租户的形式,每个客户都有一份分别放在独立的效劳器上的数据库和操作系统,或者使用强的安全措施停止隔离的虚拟网络环境中。因为本篇主要是讨论多租户,所以单租户的相关知识就简单理解一下,不做过多的论述了。
二、多租户数据隔离的三种方案
在当下云计算时代,多租户技术在共用的数据中心以单一系统架构与效劳提供多数客户端相同甚至可定制化的效劳,并且仍可以保证客户的数据隔离。目前各种各样的云计算效劳就是这类技术范畴,例如阿里云数据库效劳(RDS)、阿里云效劳器等等。
多租户在数据存储上存在三种主要的方案,分别是:
1. 独立数据库
这是第一种方案,即一个租户一个数据库,这种方案的用户数据隔离级别最高,安全性最好,但本钱较高。
优点:
为不同的租户提供独立的数据库,有助于简化数据模型的扩展设计,满足不同租户的共同需求;假设呈现故障,恢复数据比较简单。
缺点:
增多了数据库的装置数量,随之带来维护本钱和购置本钱的增加。
这种方案与传统的一个客户、一套数据、一套部署类似,差别只在于软件统一部署在运营商那里。假设面对的是银行、医院等需要非常高数据隔离级别的租户,可以选择这种形式,进步租用的定价。假设定价较低,产品走低价道路,这种方案一般对运营商来说是无法接受的。
2. 共享数据库,独立 Schema
这是第二种方案,即多个或所有租户共享Database,但是每个租户一个Schema(也可叫做一个user)。底层库比如是:DB2、ORACLE等,一个数据库下可以有多个SCHEMA
优点:
为安全性要求较高的租户提供了一定水平的逻辑数据隔离,并不是完全隔离;每个数据库可支持更多的租户数量。
缺点:
假设呈现故障,数据恢复比较困难,因为恢复数据库将牵涉到其他租户的数据;
假设需要跨租户统计数据,存在一定困难。
3. 共享数据库,共享 Schema,共享数据表
这是第三种方案,即租户共享同一个Database、同一个Schema,但在表中增加TenantID多租户的数据字段。这是共享水平最高、隔离级别最低的形式。
即每插入一条数据时都需要有一个客户的标识。这样才干在同一张表中区分出不同客户的数据。
优点:
三种方案比较,第三种方案的维护和购置本钱最低,允许每个数据库支持的租户数量最多。
缺点:
隔离级别最低,安全性最低,需要在设计开发时加大对安全的开发量; 数据备份和恢复最困难,需要逐表逐条备份和复原。
假设希望以最少的效劳器为最多的租户提供效劳,并且租户接受牺牲隔离级别换取降低本钱,这种方案最适宜。
在SaaS施行过程中,有一个显著的考量点,就是如何对应用数据停止设计,以支持多租户,而这种设计的思路,是要在数据的共享、安全隔离和性能间获得平衡。
因为我们用的底层库是MySQL,且要保证数据的完全隔离,所以用的方案属于第一种。独立数据库。因为MySQL下SCHEMA就是他的数据库名。所以每多效劳一个用户,都需要新建一个数据库。假设是DB2或者是ORACLE的话,一个数据库下,可以采用独立的SCHEMA来停止数据隔离,这样会相对节省本钱,且数据隔离的强度高。
三、选择合理的实现形式
衡量三种形式主要考虑的因素是隔离还是共享。
本钱角度因素
隔离性越好,设计和实现的难度和本钱越高,初始本钱越高。共享性越好,同一运营本钱下支持的用户越多,运营本钱越低。
安全因素
要考虑业务和客户的安全方面的要求。安全性要求越高,越要倾向于隔离。
从租户数量上考虑
主要考虑下面一些因素
系统要支持多少租户?上百?上千还是上万?可能的租户越多,越倾向于共享。
平均每个租户要存储数据需要的空间大小。存贮的数据越多,越倾向于隔离。
每个租户的同时访问系统的最终用户数量。需要支持的越多,越倾向于隔离。
是否想针对每一租户提供附加的效劳,例如数据的备份和恢复等。这方面的需求越多, 越倾向于隔离
技术贮藏
共享性越高,对技术的要求越高。 |