知识大全 深入探讨数据仓库建模与ETL的实践技巧[2]
Posted 知
篇首语:上下观古今,起伏千万途。本文由小常识网(cha138.com)小编为大家整理,主要介绍了知识大全 深入探讨数据仓库建模与ETL的实践技巧[2]相关的知识,希望对你有一定的参考价值。
深入探讨数据仓库建模与ETL的实践技巧[2] 以下文字资料是由(全榜网网www.cha138.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧!
(二) 确定量度
在确定了主题以后 我们将考虑要分析的技术指标 诸如年销售额之类 它们一般为数值型数据 我们或者将该数据汇总 或者将该数据取次数 独立次数或取最大最小值等 这样的数据称为量度
量度是要统计的指标 必须事先选择恰当 基于不同的量度可以进行复杂关键性能指标(KPI)等的设计和计算
(三) 确定事实数据粒度
在确定了量度之后 我们要考虑到该量度的汇总情况和不同维度下量度的聚合情况 考虑到量度的聚合程度不同 我们将采用 最小粒度原则 即将量度的粒度设置到最小
例如 假设目前的数据最小记录到秒 即数据库中记录了每一秒的交易额 那么 如果我们可以确认 在将来的分析需求中 时间只需要精确到天就可以的话 我们就可以在ETL处理过程中 按天来汇总数据 此时 数据仓库中量度的粒度就是 天 ;反过来 如果我们不能确认将来的分析需求在时间上是否需要精确到秒 那么 我们就需要遵循 最小粒度原则 在数据仓库的事实表中保留每一秒的数据 以便日后对 秒 进行分析
在采用 最小粒度原则 的同时 我们不必担心海量数据所带来的汇总分析效率问题 因为在后续建立多维分析模型(CUBE)的时候 我们会对数据提前进行汇总 从而保障产生分析结果的效率 关于建立多维分析模型(CUBE)的相关问题 我们将在下期栏目中予以阐述
(四) 确定维度
维度是指分析的各个角度 例如我们希望按照时间 或者按照地区 或者按照产品进行分析 那么这里的时间 地区 产品就是相应的维度 基于不同的维度 我们可以看到各量度的汇总情况 也可以基于所有的维度进行交叉分析
cha138/Article/program/SQL/201311/16275相关参考
深入探讨数据仓库建模与ETL的实践技巧[3] 以下文字资料是由(全榜网网www.cha138.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧! 这里
深入探讨数据仓库建模与ETL的实践技巧[1] 以下文字资料是由(全榜网网www.cha138.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧! 这篇
深入探讨数据仓库建模与ETL的实践技巧[6] 以下文字资料是由(全榜网网www.cha138.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧! (三
深入探讨数据仓库建模与ETL的实践技巧[5] 以下文字资料是由(全榜网网www.cha138.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧! ET
ETL的过程原理和数据仓库建设[2] 以下文字资料是由(全榜网网www.cha138.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧! 数据抽取和上
ETL的过程原理和数据仓库建设[1] 以下文字资料是由(全榜网网www.cha138.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧! 引言 数据
规则三:定义目标和量化收益 在项目开始实施以前用户必须明确回答几个问题我们为什么要建立一个数据仓库?项目的目的同我们机构的任务一致吗?哪些问题是我们致力于要去解决的?要考虑及时推入市场质量和客户
数据抽取、清洗与转换及BI项目中ETL设计[2] 以下文字资料是由(全榜网网www.cha138.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧!
一课程简介 定价¥ 本视频课程共课时主要讲述了数据仓库(DW)和数据挖掘(DM)的基本方法基本原理重点说明这些方法的主要思想和技术在数据仓库部分不仅全面深入地介绍了基本概念和体系结构而且详细阐述了
在数据仓库中经常查询的SQL总带有下列特征: ◆几个表进行关联 ◆只有一个数据量巨大的表称为事实表 ◆其他的都是编码表称为维表 ◆维表和事实表之间有主外键关系 假设有D(key)D(ke