知识大全 深入探讨数据仓库建模与ETL的实践技巧[5]

Posted 时间

篇首语:怀抱观古今,寝食展戏谑。本文由小常识网(cha138.com)小编为大家整理,主要介绍了知识大全 深入探讨数据仓库建模与ETL的实践技巧[5]相关的知识,希望对你有一定的参考价值。

深入探讨数据仓库建模与ETL的实践技巧[5]  以下文字资料是由(全榜网网www.cha138.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧!

  ETL是数据抽取(Extract) 转换(Transform) 加载(Load )的简写 它是指 将OLTP系统中的数据抽取出来 并将不同数据源的数据进行转换和整合 得出一致性的数据 然后加载到数据仓库中 例如 下图就向我们展示了ETL的数据转换效果 (图七 pic bmp)

  那么 在这一转换过程中 我们就完成了对数据格式的更正 对数据字段的合并 以及新增指标的计算三项操作 类似地 我们也可以根据其他需求 完善数据仓库中的数据

  简而言之 通过ETL 我们可以基于源系统中的数据来生成数据仓库 ETL为我们搭建了OLTP系统和OLAP系统之间的桥梁

  四 项目实践技巧

  (一) 准备区的运用

  在构建数据仓库时 如果数据源位于一台服务器上 数据仓库在另一台服务器端 考虑到数据源Server端访问频繁 并且数据量大 需要不断更新 所以可以建立准备区数据库(图八 pic bmp) 先将数据抽取到准备区中 然后基于准备区中的数据进行处理 这样处理的好处是防止了在原OLTP系统中频繁访问 进行数据运算或排序等操作

  例如我们可以按照天将数据抽取到准备区中 基于数据准备区 我们将进行数据的转换 整合 将不同数据源的数据进行一致性处理 数据准备区中将存在原始抽取表 转换中间表和临时表以及ETL日志表等

  (二) 时间戳的运用

  时间维度对于某一事实主题来说十分重要 因为不同的时间有不同的统计数据信息 那么按照时间记录的信息将发挥很重要的作用 在ETL中 时间戳有其特殊的作用 在上面提到的缓慢变化维度中 我们可以使用时间戳标识维度成员;在记录数据库和数据仓库的操作时 我们也将使用时间戳标识信息 例如 在进行数据抽取时 我们将按照时间戳对OLTP系统中的数据进行抽取 比如在午夜 取前一天的数据 我们将按照OLTP系统中的时间戳取GETDATE到GETDATE减一天 这样得到前一天数据

cha138/Article/program/SQL/201311/16278

相关参考

知识大全 深入探讨数据仓库建模与ETL的实践技巧[3]

深入探讨数据仓库建模与ETL的实践技巧[3]  以下文字资料是由(全榜网网www.cha138.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧!  这里

知识大全 深入探讨数据仓库建模与ETL的实践技巧[2]

深入探讨数据仓库建模与ETL的实践技巧[2]  以下文字资料是由(全榜网网www.cha138.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧!  (二

知识大全 深入探讨数据仓库建模与ETL的实践技巧[1]

深入探讨数据仓库建模与ETL的实践技巧[1]  以下文字资料是由(全榜网网www.cha138.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧!  这篇

知识大全 深入探讨数据仓库建模与ETL的实践技巧[6]

深入探讨数据仓库建模与ETL的实践技巧[6]  以下文字资料是由(全榜网网www.cha138.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧!  (三

知识大全 ETL的过程原理和数据仓库建设[1]

ETL的过程原理和数据仓库建设[1]  以下文字资料是由(全榜网网www.cha138.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧!  引言  数据

知识大全 ETL的过程原理和数据仓库建设[2]

ETL的过程原理和数据仓库建设[2]  以下文字资料是由(全榜网网www.cha138.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧!  数据抽取和上

知识大全 带你深入了解建立数据仓库的八条基本准则[5]

  当寻找能够维持长期合作关系的合作伙伴的时候(通常是行业内已经建立关系的)一定要注意自己内在的感受例如在对行业中某个公司的一位资深顾问进行考察以探察其对特定应用领域的数据集市的实现经验时一定要保证能

知识大全 数据仓库与数据挖掘视频教程简介

一课程简介  定价¥  本视频课程共课时主要讲述了数据仓库(DW)和数据挖掘(DM)的基本方法基本原理重点说明这些方法的主要思想和技术在数据仓库部分不仅全面深入地介绍了基本概念和体系结构而且详细阐述了

知识大全 深入了解数据仓库优化中的星型转换

  在数据仓库中经常查询的SQL总带有下列特征:  ◆几个表进行关联  ◆只有一个数据量巨大的表称为事实表  ◆其他的都是编码表称为维表  ◆维表和事实表之间有主外键关系  假设有D(key)D(ke

知识大全 带你深入了解建立数据仓库的八条基本准则[1]

  数据仓库应用具有从多个分散的部门级系统中捕捉大量共享信息的能力它们可以将机构的原始数据有效地转化为有用的知识信息于是这些知识信息就可以被用来进行战略决策支持从而提高企业效益在一个先进的数据仓库应用