A. 数据仓库为什么按照主题划分
我觉得俺主题分类是易于查找,既然是“仓库”,那么必须有一种分类方专式来解决储存、寻找属储存数据,而且数据细分的话类别很多,按照别的分类方法会造成分类难以界定,因为有的数据不是那么容易划分的,而按照主题分类,那么这种模糊分类方法就比较实用啦!
B. adventureworksdw2008数据仓库包含了哪些业务主题
简单地说就一个数据库!
现阶段用的数据库有:Oracle,DB2,My Sql,Ms Sql Server等!
C. 典型的数据仓库系统包括哪几部分
典型的数据仓库系统包括以下几个部分:
数据源
ETL(数据抽取、转换和加载)
数据仓库
数据集市
前端展示(包括报表、多维展示等)
D. 数据仓库的主题和主题域是什么关系
数据仓库的抄主题和主题袭域是什么关系
主题(Subject)是在较高层次上将企业信息系统中的数据进行综合、归类和分析利用的一个抽象概念,每一个主题基本对应一个宏观的分析领域。在逻辑意义上,它是对应企业中某一宏观分析领域所涉及的分析对象。例如“销售分析”就是一个分析领域,因此这个数据仓库应用的主题就是“销售分析”。
E. 数据仓库的主题划分,列举有哪些主题.试题
我觉得俺主题分类是易于查找,既然是“仓库”,那么必须有一种分类方式来解回决储存、寻找储存数答据,而且数据细分的话类别很多,按照别的分类方法会造成分类难以界定,因为有的数据不是那么容易划分的,而按照主题分类,那么这种模糊分类方法就比较实用啦!
F. 数据仓库的特点包括以下哪几个 a.面向主题 b.集成的 c.相对稳定的
以下哪个不是数据仓库的特点?
A
数据的一致性
B
数据的完整性
C
数据的扩展性
D
数据的集成性
正确答案选:(C)
,
G. 数据仓库 主题数量 不超过多少
数据仓库是在企业管理和决策中面向主题的、集成的、与时间相关的、不可修改的数据集合
数据仓库,英文名称为Data Warehouse,可简写为DW。
数据仓库之父Bill Inmon在1991年出版的“Building the Data Warehouse”一书中所提出的定义被广泛接受——数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策(Decision Making Support)。
◆面向主题:操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分离,而数据仓库中的数据是按照一定的主题域进行组织的。
◆集成的:数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。
◆相对稳定的:数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期的加载、刷新。
◆反映历史变化:数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。
数据仓库是一个过程而不是一个项目。
数据仓库系统是一个信息提供平台,他从业务处理系统获得数据,主要以星型模型和雪花模型进行数据组织,并为用户提供各种手段从数据中获取信息和知识。
从功能结构化分,数据仓库系统至少应该包含数据获取(Data Acquisition)、数据存储(Data Storage)、数据访问(Data Access)三个关键部分
数据挖掘(Data Mining),又称为数据库中的知识发现(Knowledge Discovery in Database, KDD),就是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程,简单的说,数据挖掘就是从大量数据中提取或“挖掘”知识。
并非所有的信息发现任务都被视为数据挖掘。例如,使用数据库管理系统查找个别的记录,或通过因特网的搜索引擎查找特定的Web页面,则是信息检索(information retrieval)领域的任务。虽然这些任务是重要的,可能涉及使用复杂的算法和数据结构,但是它们主要依赖传统的计算机科学技术和数据的明显特征来创建索引结构,从而有效地组织和检索信息。尽管如此,数据挖掘技术也已用来增强信息检索系统的能力。
H. 在一个数据仓库里面,可以构建多个主题吗能构建多个多维数据集
当然可以建多个主题了,数据仓库就是以主题划分的,你说的多维数据集是MS SQLSERVER2005里的概念吧 我不太清楚
I. 怎么理解数据仓库中的面向主题
1、面向主题,是让你面向主题去分析问题,架构模型,而不是非要物理上分开版,就像面向对象编程一权样
2、“很多资料中都写数据仓库的数据模型是使用“第三范式”,数据集市才使用多维的星型模型”这个是不对的,因为在Inmon 和 Kimball 的书中都没有表示这种说法
Inmon 表是建数仓需要有个企业级的一致数据模型,并没有表示非要第三范式,这个第三范式是 Kimball 在自己的书里说 Inmon 的方式用第三范式不好啦啥的,具体自己看书《数据仓库工具箱-维度建模权威指南》第一种1.5节
数据集市使用维度建模,这个说法Kimball 也没有说过,而是 Inmon 在自己的书里说维度建模只适合数据集市,具体看《数据仓库》第5张5.19节(应该是这一节)
PS:其实感觉他俩的观点差不多,只是根据他们必须得给自己的观点加油呐喊而已,两个人互撕很多年了