网站首页  |   业界社区  |  电信社区  |  技术社区   |  极客社区  |  游戏社区  |  生活社区   |   科技博客  |   同事录
TechWeb-技术社区



标题: [推荐] 构建基于Web/XML的信息集成研究
deeek
TW中级会员
Rank: 3Rank: 3


UID 117337
精华 7
积分 435
帖子 234
阅读权限 30
注册 2007-4-2
状态 离线
发表于 2008-5-14 10:18 资料 短消息 加为好友
构建基于Web/XML的信息集成研究

 引言
2u2u7b4@%I  随着计算机技术,特别是Internet的不断发展,实现"信息孤岛"之间的集成与交互成为亟待解决的问题。
!J2H#^2^0B  在诸多解决方案中,基于多代理(Multi-Agent)的信息集成就是其中的一种。该系统已被认为是建造大型复杂分布式信息处理系统的重要技术和框架。在基于多代理的方法中,资源集成的具体操作步骤是:用户把请求提交给搜索代理,由搜索代理对请求进行适当的转换,发送给代理路由器;代理路由器通过链接,将查询请求发送给数据库代理;数据库代理接受查询请求,并进行具体的数据库操作,然后把查询结果返回给请求者;搜索代理对返回的结果进行识别,若存在所需的资源,则激活本地数据库代理,对获得的信息进行记录,由专家系统对所搜集的信息进行进一步的处理。这种方法有一个明显的缺陷,即必须明确数据库的格式,代理才能正常工作。1?5{7q7h6M O'e,u
  而XML技术则可以很好的解决这个问题。用XML进行数据集成,只需对所有的异构数据源增加一个以XML为格式的封装体,即在不改变数据源的前提下,用XML对数据源的定义描述字、数据源的创建等相关信息进行封装。供应链节点上所有数据源的封装体纳入全局的XML Schema或DTD,并存储在XML虚拟服务器,为系统检索、定位提供服务。在XML的集成机制里,可以通过XML封装体实现彼此之间的数据交互,所以不需要了解数据库的格式,从而弥补了基于多代理的集成方法在这方面的不足。
0[2x)U#N,L%J9dTechWeb-技术社区  下面首先概要介绍XML的相关技术,进而给出网络环境下的、基于XML的信息集成方案:包括系统的总体框图、层次结构、工作过程及系统主要组成部分的具体设计。
"Z)L-O4R:z9^6u,_9?  XML技术
.T/R'Q4y1D-]+Z:k)x  1、XML相关标准5r!Q0F)Y9U(h+n"|0?'@-[
  XML不仅仅是一种语言,广义的XML是一系列标准的集合。图1说明了XML及其相关标准,在图中,中间一层是XML基础标准,最下层是XML的应用标准。
(U:J;x6J7N:]'w
)t(@ W-U1x9xtech.techweb.com.cn图1 XML相关标准
;W'[.u2^ eTechWeb-技术社区)f8_#],]6~7X9?4Y,|,~
  XML基础标准是为XML的进一步实用化制定的标准,它规定了采用XML制定标准时的一些公用特征、方法或规则。XML Schema描述了更加严格定义XML文档的方法,以便可以更自动地处理XML文档。XML Namespace用于保证XML DTD中名字的一致性,以便不同的DTD中的名字在需要时 可以合并到一个文档中。DOM定义了一组与平台和语言无关的接口,以便程序和脚本能够动态访问和修改XML文档内容、结构及样式。 XQuery的目的是为从Web文档中提取数据,提供一种灵活的查询机制。XPath描述如何识别、选择、匹配XML文件中的各个构成元件,包括元素、属性、文字内容等。XPointer和XLink标准,规定了有关定位、链接方面的内容。CSS被用来作为XML文档显示的样式标准等等。*l8y5N+l:c;p+a1B0s'S:^
  2、XML的主要技术特点
/I0M9o'L1B3ktech.techweb.com.cn  XML是一种元标记语言,强调以数据为核心,这两大特点在XML的众多技术特点中最为突出,同时也奠定了XML在信息管理中的优势。tech.techweb.com.cn-q \,X4P:j5q(K
  XML是一种元标记语言tech.techweb.com.cn1z3Y1?,[#y(U
  与HTML不同,XML不是一种具体的标记语言,它没有固定的标记符号,是一种元标记语言,是一种用来定义标记的标记语言,它允许用户自己定义一套适于应用的DTD。
&Y2s&o;G:d%z7I"f本篇文章来源于 站长资讯网 原文链接:http://xml.chinahtml.com/2007/XML-119561463017177.shtml

引用 回复 顶部
deeek
TW中级会员
Rank: 3Rank: 3


UID 117337
精华 7
积分 435
帖子 234
阅读权限 30
注册 2007-4-2
状态 离线
发表于 2008-5-14 10:18 资料 短消息 加为好友
  XML的核心是数据tech.techweb.com.cn)B/_.@/u(}3k0N+S
  在一个普通的文档里,往往混合有文档数据、文档结构、文档样式三个要素。而对于XML文档来说,数据是其核心。将样式与内容分离,是XML的巨大优点。一方面可以使应用程序轻松的从文档中寻找并提取有用的数据信息,而不会迷失在混乱的各类标签中;另一方面,由于内容与样式的独立,也可以为同一内容套用各种样式,使得显示方式更加丰富、快捷。tech.techweb.com.cn g7i)D4E;s$q0b6W6Q*i$g
  3、DTD(Document Type Define,文档类型定义)tech.techweb.com.cn8N%|:Q.G ~4t
  DTD的作用是定义允许或不允许什么在文档中出现。DTD的结构:一般由元素类型声明、属性表声明、实体声明、记号声明等构成。一个典型的文档类型定义文件会把未来所要创作的XML文档的元素结构、属性类型、实体引用等预先进行规定。用户既可以直接在XML文档中定义DTD,也可以通过URL引用外部的DTD。DTD位XML文档的编写者和处理者提供了共同遵循的原则,使得与文档相关的各种工作有了统一的标准。程序开发,操作系统,服务器,源码下载,Linux,Unix,BSD,PHP,Apach,asp,下载,源码,黑客,安全,技术社区,技术论坛/U(O0n$h%J+D
基于XML的信息集成方案TechWeb-技术社区,S$E,H5_$X8}/z
  1、于XML的信息集成总体框图
0w3F!M%~8b4i6A0u2x)?5\0HTechWeb-技术社区  图2给出基于XML的信息集成的总体框图[1],是把来自供应链节点上的、不同数据源(数据库,构件库,领域知识库)的信息通过包装器(Wrapper)转换成XML数据,存储在虚拟集中存储器中,用户通过DOM/SAX来获取已经转换成XML格式的信息;同样,用户通过DOM/SAX接口提交的查询命令,通过包装器转换成本地数据源能够识别的数据格式进行查询。用户通过XML的封装体实现彼此之间的交互,而不需要了解对方的数据格式。TechWeb-技术社区'Q){9o5{,C)t6g.D1S)H&b2u
8k+]/e*c3e4^
:p ]%V$y%z3A
图2 基于XML的信息集成总体框图!m&I c8}*`

$P8n2C4Y%H"g"d!z'G;L  2、基于XML的信息集成的层次结构
+f9}7X!C7E.r(K.otech.techweb.com.cn  如图3所示,整个信息集成可以分为三个层次:其中最底层为信息抽取层,中间为中介层,最上层为用户接口层。
0o9`9`0O%H I$^;S-J2x
"n$D,E$r2Y6c9C9\)j/Y6h0t$a'I
图3 基于XML的信息集成层次结构程序开发,操作系统,服务器,源码下载,Linux,Unix,BSD,PHP,Apach,asp,下载,源码,黑客,安全,技术社区,技术论坛'P6p"E)`+z1b)x:J
  
8g3_ { f"N)e%h#q$\tech.techweb.com.cn  信息抽取层"F!R"S.]!T;k+H F&q4Q
  信息抽取层处于系统的最低层,是系统的数据提供者,主要功能是提取和集成分布在多个异构数据源(数据库,知识库及构件库)上的信息。这一层采用Wrapper(包装器)技术实现将一个从中介层得到的查询,翻译成能在经过封装的数据源上执行的操作,将查询结果抽取并打包到一个XML文档,最后将该文档返回给中介层。程序开发,操作系统,服务器,源码下载,Linux,Unix,BSD,PHP,Apach,asp,下载,源码,黑客,安全,技术社区,技术论坛#R7L.W+t6?
  中介层
8q/S:g Q!G0f3f/j7`1J  中介层(Mediation Layer)的主要功能有两方面:一方面对上接受用户通过DOM客户端API向系统提交的或应用程序发出的查询,将其转换成对XML的查询,并将查询结果返回给用户或应用程序;另一方面对下将XML查询分发给各个包装器,并将查询结果通过DTD说明再转换成XML格式。
3~,N+U4S6J*?#_-n8x  用户接口层#Y$\!s6g1m1L#M
  用户接口层(User Interface Layer)在中介层之上,负责将用户的查询命令提交给中介层,获得并解释查询结果树,并将结果显示给用户。XML DOM(Document Object Model,文档对象模型)是为合法的格式良好的XML文档设计的一套API(Application Programming Interface,应用程序接口),它同时定义了这些文档的逻辑结构,访问及操作方法。由于数据显示与内容分开,XML定义的数据允许指定不同的显示方式,使数据更合理的表现出来。本地的数据能够以客户配置,使用者选择或其他标准决定的方式动态的表现出来。CSS和XSL为数据的显示提供了公布的机制。

引用 回复 顶部
deeek
TW中级会员
Rank: 3Rank: 3


UID 117337
精华 7
积分 435
帖子 234
阅读权限 30
注册 2007-4-2
状态 离线
发表于 2008-5-14 10:23 资料 短消息 加为好友
DOM客户端API的设计
:b-Y3~ V!L程序开发,操作系统,服务器,源码下载,Linux,Unix,BSD,PHP,Apach,asp,下载,源码,黑客,安全,技术社区,技术论坛*h4X e:S.r'_3m4L
  DOM全称是Document Object Model,是一个文件对象所组成的模型。它不光用于XML,最早是用于HTML的。DOM定义了一组分析元可以显示的标准指令集,通过程序存取HTML或XML的内容,然后通过程序中的对象集合将其显示出来。
5`(u#v"R3n$P9xtech.techweb.com.cn
%e$x3D1t0E:G程序开发,操作系统,服务器,源码下载,Linux,Unix,BSD,PHP,Apach,asp,下载,源码,黑客,安全,技术社区,技术论坛  我们可以通过创建Document对象,使得应用程序得到对XML文档进行操作的入口。进一步通过直接加载XML文档把创建的这个文档对象同实际的XML文档关联起来。从而将XML文档转换成一个DOM对象模型,为上层提供访问服务。
'p&U&G3z)R'Y,@9K程序开发,操作系统,服务器,源码下载,Linux,Unix,BSD,PHP,Apach,asp,下载,源码,黑客,安全,技术社区,技术论坛
2n#{$R/s(z4}TechWeb-技术社区  下面的例子结合VBScript和XML DOM对象来生成XML数据:TechWeb-技术社区"j6j1d7b P/I9}$Y0K4U+I

9s8C)e6B;Z+w/v+@"Z;O<SCRIPT LANGUAGE=VBScript>*[,T*E%F7b7H"e!y
<!--
(e9G!N6N*L/?$?4OTechWeb-技术社区Sub dombml_OnClick()
%M)`#P.I0cTechWeb-技术社区Set dom_xml=CreateObject("Microsoft.XMLDOM")
4c:H+Z7j,D:r+M"Y%ZTechWeb-技术社区dom_xml.async=False
3S%\%}7j,s:f8i*l/Tdom_xml.loadXML"<?xml version='1.0'?>" &_
7F0o"e%{,t/Y,^程序开发,操作系统,服务器,源码下载,Linux,Unix,BSD,PHP,Apach,asp,下载,源码,黑客,安全,技术社区,技术论坛"<personalinfo>" &_tech.techweb.com.cn0[ v"w @4K7\7K&Q;o6|2e
" <name> " & namel.Value &_TechWeb-技术社区5D$e3F#s4B,j-D
" </name> " &_tech.techweb.com.cn8a&n/y7K6Z
" <id> " & id.Value &_
8^.Y;g.Y8X9G&\/c8HTechWeb-技术社区" </id> " &_
)d2P4?2b.m(K4l0~TechWeb-技术社区" <password> " &password.Value &_
"p!K7N,t2t1T:b程序开发,操作系统,服务器,源码下载,Linux,Unix,BSD,PHP,Apach,asp,下载,源码,黑客,安全,技术社区,技术论坛" </password> " &_
6K:o+X ]!?3Q2g程序开发,操作系统,服务器,源码下载,Linux,Unix,BSD,PHP,Apach,asp,下载,源码,黑客,安全,技术社区,技术论坛" <email> " &email.Value &_
2j6g p:@1X/r1f,T" </email> " &_
M9k7s'Q4l3i:[)A#VTechWeb-技术社区"</persomalinfo>"
9M!E9M"b1d1Vtech.techweb.com.cnaler(dom_xml.XML)
+s5}-v8\'b5\9FEnd Sub程序开发,操作系统,服务器,源码下载,Linux,Unix,BSD,PHP,Apach,asp,下载,源码,黑客,安全,技术社区,技术论坛&R&`3k3d7j!j8l
-->
2M;_2x$T"C2\&K5}程序开发,操作系统,服务器,源码下载,Linux,Unix,BSD,PHP,Apach,asp,下载,源码,黑客,安全,技术社区,技术论坛</SCRIPT>
$u7w*D4P6R$H6j<html>
-z1M.s'Q'c.C9m'k.|#rtech.techweb.com.cn<head><title>利用DOM对象来生成XML数据</title></head>
!P3P4r(V.P)}'X9}%}:C<body>
.r#w(L&_7K%F<hr>
(@9^:r!l/d姓名:
+_"z'b-N,l4o;D<Input id=namel>!M6|;a4l(y y/o
<br>TechWeb-技术社区9F0Y t/X9E(@
用户名:
1s:A*x$~+l$o%T;b1c*S8hTechWeb-技术社区<input id=id>8y8C#u,w/d:t9h
<br>
2s%A:~;h)L$Q G密码
/N"c8X5o(E B$u.e<input type="password" id=password>)L#m4y/C6m*h-B:s,[
<br>+t8n)S+|(@:f!I1C"E
电子邮件TechWeb-技术社区,j"^&J+|2d
<input id=email>&x6[*~#n4D!b6@*m
<Input type=Button id=domxml value="生成XML数据">TechWeb-技术社区9M2A8h"k6v#H
</body>
$U;c*n,K;L,A,r</html>
*B;d'j,q [-\9}程序开发,操作系统,服务器,源码下载,Linux,Unix,BSD,PHP,Apach,asp,下载,源码,黑客,安全,技术社区,技术论坛
*k!O P%^){#C9a0F7S,W  总结
!E'X0{2D-C2V+`$i'?4WTechWeb-技术社区tech.techweb.com.cn(b!F)B/|/A2F9q%A
  Web环境下的异构数据源的集成,特别是基于XML的数据集成问题已经成为当前计算机领域中一个重要的研究方向。XML具有简单、开放、可扩展性、灵活、自描述性等特点,给Internet注入了新的活力。作为数据表示的一个开放标准,XML为数据集成带来了新的机遇。用XML作为数据交换的中介,给系统的实现带来了极大的灵活性。系统可以屏蔽掉后台的多种数据源,用统一的XML格式的数据呈现给用户。接收数据方根据XML数据的DTD可以对数据进行任意的处理,如分解出其中需要处理的数据或是以不同的样式来显示。通过本系统,可以实现散布在Web上的异构数据源中的数据的无缝集成。

引用 回复 顶部
查看积分策略说明快速回复主题
选项 标题 Smilies
禁用 URL 识别
禁用 Smilies
禁用 Discuz!代码
使用匿名发帖
使用个人签名
接收新回复邮件通知
内容





当前时区 GMT+8, 现在时间是 2008-9-6 02:07
京ICP证060517号

本论坛支付平台由支付宝提供
携手打造安全诚信的交易社区 Powered by Discuz! 5.5.0 © 2001-2008 Comsenz Inc.
Processed in 0.036809 second(s), 8 queries

清除 Cookies - 联系我们 - TechWeb.com.cn - Archiver - WAP