小枣君注:数据堆栈、数据商场、数据湖、数据中台、数据飞轮,是这多少年网上比拟罕见的 IT 观点。良多人都搞不清它们跟传统数据库究竟有什么差别。以是,我盘算写多少篇专题文章,实验做一个艰深易懂的解读。明天这篇,先pg电玩官方下载说说数据堆栈。数据堆栈,英文全称 Data Warehouse,简称 DW 或 DWH。数据堆栈跟数据库的名字十分濒临,但两者是完整差别的货色。咱们先从数据堆栈的汗青开端提及吧。█ 数据堆栈的出生数据堆栈并不是一个新观点。现实上,它出生至今,曾经有多少十年的汗青。上世纪 70 年月,关联数据库(也就是传统数据库的重要范例)刚突起的时间,美国康奈尔年夜学博士比尔・恩门(Bill Innmon,也有译为比尔・因蒙)就开端界说跟探讨数据堆栈这一术语。1988 年,IBM 研讨职员巴里・德夫林(Barry Devlin)跟鲍尔・穆尔菲(Paul Murphy),结合宣布了文章《贸易跟信息体系的架构》,此中引入了“贸易数据堆栈”一词。他们还开辟了一种叫做“营业数据堆栈”的体系。多少年后,1990 年,美国迷信家拉尔夫・金博尔(Ralph Kimball)创建了 Red Brick Systems 公司,推出专门用于数据堆栈的数据库治理体系 Red Brick Warehouse。1991 年,又是后面谁人比尔・恩门,创建了 Prism Solutions 公司,推出用于开辟数据堆栈的软件 Prism Warehouse Manager。同年,比尔・恩门正式出书了数据堆栈的经典著述 ——《构建数据库堆栈》,标记着数据堆栈观点的正式建立。厥后,比尔・恩门也被众人誉为“数据堆栈之父”。比尔・恩门█ 数据堆栈的界说跟特点那么,究竟什么是数据堆栈呢?比尔・恩门在《构建数据库堆栈》书中给出了一个界说 ——数据堆栈,是一个面向主题的(Subject Oriented)、集成的(Integrated)、绝对稳固的(Non-Volatile)、反应汗青变更(Time Variant)的数据聚集,用于支撑治理决议(Decision Making Support)。这个界说十分形象、烧脑,但正确归纳综合了数据堆栈的多少个要害特点,值得分析一下。支撑治理决议先说“支撑治理决议”,这是数据堆栈的感化,也是发明它的重要目标。简略来说,传统数据库重要是员工应用,支持某项详细的任务。比方收银体系等。而数据堆栈,重要是治理层应用,用于控制微观情形,以便做出更公道的决议。从前小枣君给各人先容数据库入门的时间,提到过 OLTP 跟 OLAP。OLTP 是联机事件处置(Online Transaction Processing)数据库,呈现较早,也是晚期关联型数据库的重要用处,用于支撑一样平常营业操纵,如订单处置、库存治理跟银行买卖等。它们平日处置大批简略的读写操纵,须要体系可能疾速呼应,且十分牢靠。OLAP 是联机剖析处置(Online Analytical Processing)数据库,呈现较晚,用于支撑庞杂的剖析查问,如数据发掘、趋向剖析跟财政讲演等。它们平日处置大批庞杂的只读查问,对算力请求高,也须要支撑很年夜的数据吞吐量。数据堆栈,很显然就是 OLAP 型。或许也能够说,数据堆栈是 OLAP 数据库场景的延长跟开展。OLAP 类利用,催生了数据堆栈。归纳综合来说,数据堆栈是一个策略级的东西。它平日用于贸易智能(Business Intelligence,简称 BI,征询机构 Gartner 造出来的风行词)跟决议支撑,能够辅助企业从大批数据中取得有代价的信息,增添洞察才能。最终目标,固然是增添收入、晋升效力、下降本钱。