# 数据管理相关概念和术语

# 数据源

数据源(data source)是数据的来源,指的是SuccBI中所使用的数据库或者数据库服务器连接。数据源中存储了所有建立数据库连接的信息,数据源管理即对这些数据库连接进行管理。

# 数据模型

数据模型(data model)也叫模型(model)、模型表(model table),一张模型表可以是一张数据表,可以是一个SQL,也可以是一个数据加工。当讨论到数据建模、星型模型等数据仓库建设和规划的概念时,我们会统称为模型。

关系

# 数据表

数据表(data table)也叫数据库表模型,是指在SuccBI中已经管理好元数据的、可以直接为数据分析和查询使用的“表”,数据表是一个逻辑层的概念,一个数据表总是对应一个物理数据库中的物理表或者视图,或者直接连接业务数据库中的物理表。

# 数据集

数据集(data set)是数据模型的一种,是在数据表、数据加工或者SQL的基础上过滤、排序、选择字段后形成的子集,是一个接近业务化的数据集合。

# 数据库表

数据库表(database table)是指数据库中的物理表。

# 事实表

事实表(fact table)是由度量维度构成的一个数据表。一个事实表通常会存储一些列随时间变化的数据,如销量表、库存变化表、订单表等,事实表内存在多个维度,维键会关联维表形成星型模型

了解更多: http://en.wikipedia.org/wiki/Fact_table (opens new window)

# 维表

维表(dimension table)即我们通常说的“代码表”、“字典表”,与事实表典型区别是,维表通常不存储随时间变化的业务数据,维表通常存储的是一个业务单元的文本数据,如“产品维表”存储的是产品的ID、名称、颜色、尺码等。

了解更多: http://en.wikipedia.org/wiki/Dimension_table (opens new window)

# 字段

一个数据表/数据库表的一列。

# 度量

度量(measure)是事实表中的用于表示数值的字段,度量的数据往往是连续的,并带有单位(如元、户数、吨等),度量往往可以进行汇总或求平均值。

# 维度

维度(dimension key)也叫维键,是事实表中的用于表示数据属性的字段,维键通常会关联外部的一个维表,比如“行政区划”维键会关联“行政区划维表”,有些维键也可能没有关联维表,比如订单号、年份。

# 数据角色

数据角色表示一个字段的“技术类型”,比如日期、经度维度、行政区划……。更多关于数据角色的介绍可以查看文档字段角色

# 数据元

数据元(data element)是元数据管理中的一个概念,通过数据元定义、数据元标识、数据元表示以及数据元允许值等一系列属性描述的数据单元。在特定的语义环境中被认为是不可再分的最小数据单元。

相比于数据角色,数据元是有具体的业务意义的,比如“发货地址”和“收获地址”属于同一个数据角色,但是却不是同一个数据元,一个字段可以关联一个数据元。

了解更多: https://en.wikipedia.org/wiki/Data_element (opens new window)

# 星型模型

星型模型(star schema)是多维的数据关系,它由多个事实表(fact table)和维表(dimension table)组成,一个事实表及其相关联的维表在模型关联关系图上看起来像一个星星(一个事实表周围围着几个维表)所以形象的称之为“星型模型”。星形模型可以认为是雪花模型的一种特例,比雪花模型在查询方面更有效率。

了解更多: http://en.wikipedia.org/wiki/Star_schema (opens new window)

# 雪花模型

雪花模型是在星型模型的基础上,维表又关联有其它的维表,在模型关联关系图上看起来像一个雪花,所以形象的称之为“雪花模型”。星形模型可以认为是雪花模型的一种特例,但比雪花模型在查询方面更有效率。

了解更多: http://en.wikipedia.org/wiki/Snowflake_schema (opens new window)

是否有帮助?
0条评论
评论