是不是后关系型数据库=XML+关系型?
关于数据库的知识数不胜数,今天,小编为大家带来了新的关于数据库的内容。
在XML、InfoBase、Webserver等概念热炒时,我们仍然看到目前的数据库技术,实际上只为企业解决了15%的结构化数据管理问题,其余85%的非结构化数据该怎么来管呢?
压在关系型数据库身上的三座大山
关系数据库最初设计为基于主机/终端方式的大型机上的应用,其应用范围较为有限,在经历了客户机/服务器时代后,获得了极大的发展。
关系数据库管理系统在很长时间内处于数据存储管理技术主流而独领**,但是这种传统的数据库管理系统因采用两维数据模型,而存在着本身固有的约束和限制。
随着信息技术的飞速发展,数据处理不仅在数量上要求越来越大,同时,信息数据的种类也在不断地展,越来越多的非结构化数据不断出现,包括企业的各种报表、账单、电子文档、网站的各种元素、图片、传真、扫描影像,以及大量的多媒体的音频、视频信息等等。此外,随着热门网站访问数量的激增,对数据库本身的存储机制、大量并发用户的使用需求、存储空间的使用效率、以及数据的完整性和安全性等方面都提出了更高要求。
今天,数据库所生存的外部土壤随着Internet以及在网络环境下IT系统互联互通相互协作的趋势,对信息管理技术 access数据库提出了新的挑战。这些挑战就像三座大山,压在了关系型数据库的头上。
信息复杂性
今天信息的复杂性与关系型数据库理论产生的时代已不可同日而语,信息的结构日益复杂,随着个性化服务等需求增长,信息的多样性和差异性都大大增加了,而关系型理论在管理信息复杂性方面的不足日益明显。
关系数据库本质上采用的是一个二维的模型,通过一系列二维关系的组合来描述复杂实体对象,每个表所代表的所有实体在建模设计时没有差异性,即使只有一个实体拥有某种属性,也必须为其建立一个字段。如果这种个体间的差异性不是仅仅表现在属性上,而且涉及结构和关系,则需要为有差异的实体建立不同的表和对应关系。因而今天的许多业务系统往往需要几千张表,甚至数万张表。数据库的结构变得十分复杂,数据库中的信息变得难以理解。而且,在现实数据中,有许多类型是关系数据库不能较好地处理的。
处理高效性
从某种意义上而言,今天业务系统数据库的信息是业务系统运行的副产物。数据库是为支撑特定业务应用的运行而设计,数据库中的数据也只被单一系统使用,所以很少考虑这些信息是否易于理解。然而,今天越来越多的系统需要相互协作、共享信息。信息的可读性、能否易于理解变得日益重要。
为静态应用设计的关系型数据库管理系统,并没有经过针对高效事务处理而进行的优化过程。其结果往往是某些关系型数据库产品,在对Web的事务处理过程中,没有达到预期的效果。用关系数据库的两维表数据模型,可以处理在大多数事务处理应用中的典型多维数据,但其结果往往是建立和使用大量的数据表格,仍很难建立起能模拟现实世界的数据模型。并且在数据需要作报表输出时,又要反过来将已分散设置的大量的两维数据表,再利用索引等技术进行表的连接后,才能找到全部所需的数据,而这又势必影响到应用系统的响应速度。
应用灵活性
随着IT系统进入社会生活的各个方面,信息不仅日益复杂,而且其需求内容和结构随着时间的推移oracle数据库视频 也不断地产生变化.现实世界要求信息技术具有越来越高的灵活性和适应性.关系型数据理论所采用的是一种固定的建模方式,任何关系和属性一旦定义,就是固定的,难以随着需求的变化进行灵活的调整。
关系数据库技术在有效支持应用和数据复杂性上的能力是受限制的。关系数据库原先依据的规范化设计方法,对于复杂事务处理数据库系统的设计和性能优化来说,已经无能为力。此外,高昂的开发和维护费用也让企业难以承受。
【文章相关内容】
第一页:压在关系型数据库身上的三座大山
第二页:后关系型数据库的三种演变
第三页:数据库技术应用的四个方向
第四页:资料:数据库技术的发展史
后关系型数据库的三种演变
虽然传统的关系数据库能很好地适合于处理相对简单的事务交易,但是却不能胜任非结构性数据的处理。很多的数据库应用开发者已经认识到了关系数据库的限制,并开始寻找适合的替代方案。但变革并不是很容易就可以实现的。
改良派:融入xml技术
XML语言的出现,给数据库系统的发展开辟了一片新的天地。XML的全称是“可扩展的标识语言(extensible markup language)”。XML有下列重要特性:
一、XML是一种表意而非表形的元语言。采用不同的显示页(stylesheet)就可以做到同一数据源却有不同途径的显示结果。
二、XML是Internet的标准语言,因而具有跨操作平台、跨区域的特点,因而是网络世界里的一种“世界语”。
三、由于由XML所写的文件能为机器所解读,使得网络世界里“服务器对服务器(Server to Server)”的应用成为可能,从而奠定了Internet应用自动化的基础。
四、XML是一种可自我描述定义的元语言,所以它可以大量用于制定行业内及行业间数据交换的标准。
对IBM DB2 9来说,IBM 的新一代数据库 DB2 9中第一次实现了关系型引擎与层次型引擎的结合,实现了混合数据库,IBM将此技术称为pureXML技术。IBM公司技术人员认为,关系数据库对非结构化数据的支持不亚于从层次数据库到关系数据库的**性转变。“XML在信息管理领域无处不在,不管是管理结构化或非结构化信息,或者用于信息传输,或者是集成信息的映射标准。它现在是不可或缺的。”而甲骨文、微软、Sybase等数据库厂商也同样看到了这个趋势,并提供了第一轮的XML支持。
我们不难看出,将xml技术和关系数据库进行整合,目前已经得到了主流关系型数据库厂商们的大力支持。毕竟,经过多年的打拚,各大数据库厂商的市场地位已经确立,其产品的市场分额也相对平稳。在这样的情况下,如果对数据库技术进行**性的改变,势必引发市场的重新洗牌,同时也是对原有技术积累的一种丢弃,这是目前主流数据库厂商们所不愿意看到的。
站在用户的角度,由于长期的使用,很大程度上已经接受并且习惯了传统数据库的使用方式,如果完全替换掉原有的关系型数据库,不仅需要一定时间来适应,同时,如何解决新旧系统间数据的导入、格式的统一以及与应用系统接口的调整,也是一个很伤脑筋的问题。能够在现有系统的基础上,增加对非结构化数据的支持,实现系统无缝、平稳过渡,可能也是用户最希望看到的情况。
专家观点:中国软件协会数据库及应用软件分会秘书长 王腾蛟
关系型数据库技术经过多年的积累,其数学模型已经相对完善,结构也很简单,尽管在不同数据格式的数据交换中,关系数据库表现不是很好,但是在处理数度上,关系型是强于XML的。同时,在针对事务处理方面,目前还没有比关系型更好的。尽管数据库未来究竟采取何种方式发展,现在还不好说,但是将XML技术融于关系数据库中,实现对异构数据的管理,这确实是一种很好的尝试。
革新派:取代“DataBase”
为了让企业更加有序地存储、管理并利用所有非结构化信息,有人提出了用“内容信息库(infobase)”取代传统数据库(database)的观点。
所谓“信息库”,其实就是利用一个统一的数学模型,对目前的数据库技术(datebase)和企业内容管理系统(ECM)进行整合,从而在一个统一的平台上,有效地实现对结构化数据和非结构化数据的集中统一管理。
可以说,“信息库”既是技术也是策略。从产品方面讲,这是技术、工具以及方法,可以帮助用户实现对各种内容的捕获、管理、存储、保护、发布;同时,它也是一种策略,负责管理用户所有的内容数据,包括结构化数据和非结构化内容信息。“信息库”向主流的数据库技术提出了挑战,它所包含的范畴将比数据库技术广泛得多,以至于我们目前还很难用几个简单的应用来定义其特征。
IBM技术人员表示,一个统一、完整、集成、开放、可扩展的“信息库”架构应该包含以下内容:
一、完善的系统架构。对于任何平台来说,良好的架构对于系统的重要性是不言而喻的。“信息库”技术同样需要考虑如何实现灵活高效的数据模型,如何设计各种语言的API接口,如何实现完善的访问控制管理,以及如何架构系统的拓扑以完成数据迁移、缓存,如何支持大量数据的存储和上千的并发用户。
二、数据模型。数据模型的能力直接表现出一个平台适应用户需求的能力。在信息管理中,通常元数据越复杂,内容提升价值的潜力就越大。而丰富元数据的模型不是一蹴而就的,这就要求一个面向客户全部信息管理的通用数据模型,以适应客户不断变化的需求。
三、检索查询等功能的完备。对于“信息库”技术的最终用户来说,如何高效准确地找到自己所需要的资源是首要课题。尤其是数据模型逐渐复杂、数据信息来源更加多样化的情况下,检索查询就变得更加重要,同时也变得非常困难。
四、内容管理的API。完整的API支持是区别“信息库”技术和一般的内容管理应用软件的重要依据。通过“信息库”提供的API,厂商可以开发出面向各种不同客户需求的垂直应用,也可以支持应用开发商和客户开发自己的内容管理应用。
目前,IBM、甲骨文、微软等主流数据库技术厂商,以及OpenText、ITRS等ECM软件厂商已经开始了针对统一标准的“信息库”研发工作,对传统数据库技术的革新工作,已经拉开了序幕。
专家观点 IBM中国软件部 技术经理 杨子阳
目前,关系型数据库也在采用很多方法来实现对异构数据的管理,比如说IBM的DB2 9中的purexml。Xml技术很大程度上可以解决关系型数据库对非结构性数据的存储问题,但是,靠增加一些模块到一个已经很复杂的关系数据库上去的途径,并不能从根本上解决问题。我们知道,数据库技术的一个基本目标就是要找到一个恰当的数据模型来表达它所管理的对象。为了解决用关系数据库不能有效表达和管理复杂数据的问题,我们应该寻求更好的、采用更适合管理复杂数据的数学模型,来适应新的变化。
颠覆派:让数据库消失
互联网可谓包罗万象,如果你愿意,你几乎可以寻找到你想要的任何信息。某种意义上说,web本身就是一个巨大的信息容器。因此,有很多人作出这样一个预言:在网络时代,数据库技术将消亡。
Web时代数据技术将向哪个方向走呢?有一种的看法是,它将向把数据本身、语义本身结构化的方向发展,不是在库这个容器中刻划出维度来处理数据,而是要对语言本身进行结构化处理,把维度内嵌到数据本身之中,这也是第三代互联网的神髓。
从数据库研究的角度出发,Web网站上的信息本身确实就是一个数据库,一个更大、更复杂的数据库。Web上的每一个站点就是一个数据源,每个数据源都是异构的,因而每一站点之间的信息和组织都不一样,这就构成了一个巨大的异构数据库环境。
充分利用有用的数据,对尽可能多的数据进行有效的存储、管理、分析和挖掘,这本身就是数据库技术思想的基础。但是,用WEB来取代数据库,可能在很多方面还不成熟。
首先,Web上的数据最大特点就是半结构化。Web上的数据非常复杂,没有特定的模型描述,每一站点access数据库软件的数据都各自独立设计,并且数据本身具有自述性和动态可变性。
其次,如果想要利用web技术取代数据库,必须要研究站点之间异构数据的集成问题,只有将这些站点的数据都集成起来,提供给用户一个统一的视图,才有可能从巨大的数据资源中获取所需的东西,这里面就涉及到一个数据格式统一的问题。
再次,还要解决Web上的数据查询问题,因为如果所需的数据不能很有效地得到,对这些数据进行分析、集成、处理就无从谈起。对于数据库技术来说,速度和并发性是其难以突破的瓶颈,而对网络用户而言,长时间的搜索等待,是难以忍受的。
最后,还要面对用户数据保密问题。因为在用户的实际使用中,并不是所有的数据都可以放到互联网中的。对于用户不愿意放到网络中保存的数据,web数据库将提供何种方式进行保存呢?
面向Web的数据处理技术是否能够真正的取代数据库,我们暂时还无法定论,不过,基于web的数据处理技术,在很大程度上挑战了传统数据库在应用系统设计时的中心地位,有利于帮助程序员们培养真正基于对象进行系统设计和开发的习惯。
专家观点 酷讯网CEO陈华
用Web取代数据库,理论上有这种可能,并且可能会对现有的搜索技术带来影响,不过这种观点太过理想化,真正实现起来将会出现很多困难。比如说网页数据的统一格式问题,对于网站来说,最重要的是给用户看的,而不是供机器进行数据挖掘的,对网页数据格式的统一,在技术上可以实现,在应用中很难。此外还包括数据公开的问题、查询的速度问题以及并发性的响应问题。
【文章相关内容】
第一页:压在关系型数据库身上的三座大山
第二页:后关系型数据库的三种演变
第三页:数据库技术应用的四个方向
第四页:资料:数据库技术的发展史
数据库技术应用的四个方向
数据库技术发展和大多数领域发展一样,必将是应用驱动和技术驱动相结合。传统的关系数据库,由于其自身的局限性,在使用中受到了很多限制,在搜索、多媒体、企业内容管理、计算机辅助设计等方面,数据库技术几乎很少涉足,如能在以下4个方面完善数据库技术,数据库将获取更大市场。
方向1.实现对非结构化数据的管理
企业在信息化过程中需要处理大量报表、账单、影像、电子文档、图片、音频、视频等非机构化数据,这些数据难以用传统的关系型数据库管理。随着xml技术的出现,数据库实现对非结构化数据的管理已经成为可能。
“如果谁能控制、支持和存储所有类型的数据,那么这样的厂商也就有能力扩展自己其他产品和服务的市场空间。因此整合XML、对象数据、多媒体数据,将所有数据类型放在一个平台上将是传统的关系数据库发展的一大趋势。”
不过,处理结构化数据的关系数据库从理论到技术上经历了30多年发展,已经相当成熟,而非结构化数据的复杂程度远远高于结构化数据,所以非结构化数据的存储还存在很多有待解决的难题,比如,如何很好地解决多种异构数据源的存储和查询就是其中的关键问题。虽然有人认为将来XML数据库将能比较好地解决非结构化数据的管理问题,但将现有文档映射到XML文档的工作才刚刚开始,XML查询语言也远不如SQL成熟。
方向2.实现对web数据的挖掘
近年来,随着Internet技术的快速普及和迅猛发展,使各种信息可以以非常低的成本在网络上获得,由于Internet在全球互连互通,可以从中取得的数据量难以计算,而且Internet的发展趋势继续看好,特别是电子商务的蓬勃发展为网络应用提供了强大支持,如何在Internet这个方硕数据库全球最大的数据集合中发现有用信息无疑将成为数据挖掘研究的热点。
数据库技术应用于Web挖掘主要是为了解决Web信息的管理和查询问题。这些问题可以分为三类:Web信息的建模和查询;信息抽取与集成;Web站点建构和重构。
从数据库的观点进行Web内容挖掘主要是试图建立Web站点的数据模型并加以集成,以支持复杂查询,而不止是简单的基于关键词的搜索。这要通过找到Web文档的模式、建立Web数据仓库或Web知识库或虚拟数据库来实现。相关研究主要是基于半结构化数据进行的。
长期以来,由于在数据库观点下数据的表示方法比较特殊,其中包含了关系层次和图形化的数据,所以大部分建立在扁平数据集合之上的数据挖掘方法不能直接使用。目前已经有人针对多层数据库挖掘算法进行研究。
方向3.对未来智能搜索技术的支撑
搜索技术是现在互联网的热门应用,不过由于速度慢和并发性差等瓶颈限制,数据库和搜索技术长期以来都是“大路朝天,各走一边”。据陈华介绍,在目前的搜索技术中,出于速度等方面的考虑,搜索过程中很少有使用数据库工具的情况。不过随着搜索技术对智能化要求的提高,大量的匹配信息、描述语句出现在搜索过程中,数据库技术如何配合未来的智能搜索,也逐渐被大家关注。
现代网络系统中存在大量的有用数据,例如,每天有几千万个研究。然而,得到这些数据却非常困难。据了解, google目前正在尝试建立一个体系结构能够支持新的关于海量Web数据的研究。为了支持新研究,Google以压缩的形式保存了实际所抓到的文档。google的目标之一就是要建立一个环境使其他研究者能够很快进入这个领域,处理海量Web数据,在这样的情况下,无疑需要数据库技术来对这种系统进行有效的支持。
大型Web搜索引擎将是个非常复杂的系统,为了提高搜索效率,需要覆盖大约100000000个网页。我们必须有一个巧妙的算法来决定哪些旧网页需要重新抓取,哪些新网页需要被抓取。受需求驱动,用代理cache创建搜索数据库正在成为目前一个有前途的研究领域。
方向4.辅助软件工程及制造(CAD,CAE,CASE和CAM)系统的应用
关系数据库技术是为传统的事务处理应用而开发的,如库存控制、工资、帐目等等。但是人们很少将关系数据库技术用于其他更广泛的应用。这些应用包括计算机辅助设计、辅助工程、辅助软件工程及辅助制造(CAD,CAE,CASE和CAM)系统及其应用。
传统的数据库系统所支持的事务模型不适合于交互式、协作设计环境下所必须的长(Long-duration)事务。传统的数据库系统也不提供表示和管理数据库的临时变化,包括如像模式的时间和版本变化以及变化的通报(notification)方面的一些工具。
其实,在计算机辅助设计过程中、制造过程中,会出现大量的结构信息数据,包括参数、图形、描述、表格、文档等。这些为数据库技术的应用带来了机遇和挑战。有效的构建相应结构信息的数据库,对所有的结构信息、载荷信息和技术资料进行合理的存储,并对这些信息资料设计专用检索程序,可以极大的优化设计工作效果,提升设计质量。
随着Internet的发展,数据库的应用空间将不断地扩展,未来数据库将向Web这样一个广阔的空间发展。然而另一方面,数据库技术也将向着实时性更强、更加智能化、更加专业化的方向发展,甚至对其融入自然语言甚至肢体语言的接口,让人们应用数据库变得更加容易。
【文章相关内容】
第一页:压在关系型数据库身上的三座大山
第二页:后关系型数据库的三种演变
第三页:数据库技术应用的四个方向
第四页:资料:数据库技术的发展史
连接:数据库技术的发展史
一、摇篮和萌芽阶段
首先使用“DataBase”一词的是美国系统发展公司在为美国海军基地在60年代研制数据中引用。
1963年,C.W.Bachman设计开发的IDS(Integrate Data Store)系统开始投入运行,它可以为多个COBOL程序共享数据库;
1968年,网状数据库系统TOTAL等开始出现;
1969年,IBM公司Mc Gee等人开发的层次式数据库系统的IMS系统发表,它可以让多个程序共享数据库;
1969年10月,CODASYL数据库研制者提出了网络模型数据库系统规范报告DBTG,使数据库系统开始走向规范化和标准化。
二、发展阶段
20世纪80年代大量商品化的关系数据库系统问世并被广泛的推广使用,既有适应大型计算机系统的,也有适用与中、小型和微型计算机系统的;
1970年,IBM公司San Jose研究所的E.F.Code发表了题为“大型共享数据库的数据关系模型”论文,开创了数据库的关系方法和关系规范化的理论研究;
1971年,美国数据系统语言协会在正式发表的DBTG报告中,提出了**抽象模式,即对应用程序所需的那部分数据结构描述的外模式,对整个客体系统数据结构描述的概念模式,对数据存储结构描述的内模式,解决了数据独立性的问题;
1974年,IBM公司San Jose研究所研制成功了关系数据库管理系统System R,并且投放到软件市场;
1976年,美籍华人陈平山提出了数据库逻辑设计的实际(体)联系方法;
1978年,新奥尔良发表了DBDWD报告,他把数据库系统的数据库学习设计过程划分为四个阶段:需求分析、信息分析与定义、逻辑设计和物理设计;
1980年,J.D.Ulman所著的《数据库系统原理》一书正式出版;
1981年,E.F.Code获得了计算机科学的最高奖ACM图林奖;
1984年,David Marer所著的《关系数据库理论》一书,标志着数据库在理论上的成熟。
三、成熟阶段
80年代至今,数据库理论和应用进入成熟发展时期。随着信息技术和市场的发展,人们发现关系型数据库系统虽然技术很成熟,但其局限性也是显而易见的:它能很好地处理所谓的“表格型数据”,却对技术界出现的越来越多的复杂类型的数据无能为力。九十年代以后,技术界一直在研究和寻求所谓的“后关系型数据库系统(post-relational database)”。
【文章相关内容】
第一页:压在关系型数据库身上的三座大山
第二页:后关系型数据库的三种演变
第三页:数据库技术应用的四个方向
第四页:资料:数据库技术的发展史
【相关文章】
更多详情请咨询课课家官网,了解更多内容.