企业级数据仓库取代数据集市的方式方法
当前位置:以往代写 > 数据库教程 >企业级数据仓库取代数据集市的方式方法
2019-06-14

企业级数据仓库取代数据集市的方式方法

企业级数据仓库取代数据集市的方式方法

  下面就让我们来一起看看这个应用到底是怎么样运转的吧。

  著名市场调研机构Gartner的分析师Donald Feinberg表示,构建数据集市成本非常昂贵,如果你的公司有六个部门,每个部门都开发了自己的数据集市,那么你就必须为六个硬件系统和六个数据库软件许可买单,well同时你还需要足够的人手来维护每一个数据集市。

  企业级数据仓库取代数据集市的方式方法
  当出现上面这种情况时,企业往往会发现到最后,每个数据集市里都复制了大量相同信息,数据的保存不再是一个单一的主拷贝,同时还会浪费掉大量的存储空间。
而在一个企业级数据仓库中,数据的质量比在上述数据集市中更高。数据仓库项目不需要采取“一次性全部导入”的方式,你可以从一个小的项目开始,围绕一个数据仓库慢慢进行设计其他项目,随着时间推移,逐步补充添加更多的项目,最后这个小的数据仓库就会增长为企业级数据仓库,掌控起公司所有的业务数据。

企业级数据仓库取代数据集市的方式方法
拍卖网站eBay拥有全球最大的数据仓库之一,每天收集的数据达到40TB之多,并拥有5000多个商户。eBay的高级主管Oliver Ratzesberger在本周Teradata的欧洲用户大会上表示,eBay就像很多别的企业一样,数据集市的数量太多,这些数据集市很可能会毁掉企业的经营策略。
两年前,Ratzesberger开始实施一个项目,鼓励各个业务部门放弃各自的数据集市,转而使用eBay的Teradata企业级中央数据仓库。Ratzesberger称,他们免费提供这项业务,使得他们的商业用户不用再费劲去争辩到底是在MySQL数据库中进行数据分析便宜呢,还是在SQL Server数据库中分析数据成本更低。eBay只是让商户们知道,eBay为他们提供的分析的执行速度比他们自己从Dell购买一个服务器然后自己部署数据集市要快得多。
Ratzesberger的策略是在eBay内部提供数据仓库软件作为一项中央业务,由IT部门负责运行,允许商户进行测试。eBay允许各个商业部门在Teradata内部使用他们自己的数据执行数据分析来测试这个策略,不要求服务品质协议(SLA),而且用户将数据上载到Teradata数据库的限期为六个月。
如果这个在Teradata内部的样板分析结果成效显著的话,商户就有可能用这个样板为出发点开发在Teradata数据库中长期运行的生产系统。

企业级数据仓库取代数据集市的方式方法
Ratzesberger表示,我们的开发人员通常需要花费大量时间来解决数据质量问题,而不是用来构建数据仓库,随着这项新业务的开展,他们可以从中得到很多好处,因为测试样板会识别数据质量问题。在开发人员着手构建生产系统之前,这些问题就能够得到解决,这样就可以加速软件的开发速度。
虽然安装数据仓库的工程相当浩大,但是Ratzesberger的做法还是说明了IT部门是可以用一个低成本的替代方法,也就是企业级数据库,来避免在企业业务开展过程中出现数据集市的扩增现象。
看了上面的内容,大家有没有觉得很是方便,那么就让我们在课课家教育的平台上尝试下吧。
【相关文章】

  • 数据挖掘:概念与技术
  • 主流数据仓库产品对比分析
  • 数据仓库的架构方式及其比较
    • 关键字:

    在线提交作业