现在的互联网主要是为人类的使用而创造的,虽然机器可读的数据是互联网上最先出现的,但是这些机器可读的数据一般是以单独的文件和单独的格式被发布在互联
网上的,机器可读的和人类可读的数据之间的关联是相当少的。结果就是现在的浏览器在解析和处理web数据上的能力很差,因为浏览器只负责展示这些信息。
但是浏览器能够识别这些数据又有什么用呢?
用处多了,如果浏览器可以很好的识别这些数据,它就会形成一个固有的数据结构,而如果将这些数据结构加里利用,那我们就不需要记录一些信息都是通过
无数次的ctrl+c和ctrl+V来完成了,一键操作就很方便了,而对于搜索引擎来说,就是更好的搜索结果展示以及更强大的数据挖掘能力了。
所以基于这个目的,RDFa出现了,就是为了达成我们的这个目的,它的全称是Resource Description Framework in attributes,其实从它名字的全称就可以获取到很多信息了,呵呵。
RDFa介绍:
提到了为什么会出现RDFa这个东西,那什么是RDFa呢,主要体现在下面几点:
连接机器与Web数据之间的一座桥梁 通过为一些可视化的数据提供一系列的XHML属性而使得这些数据可以被机器所理解。 基于XHTML+RDFaDTD而与我们平时做的页面相比,使用RDFa技术的时候,它的头部doctype是这样定义的:
12
!DOCTYPE html PUBLIC -//W3C//DTD XHTML+RDFa 1.0//EN"http://www.w3.org/MarkUp/DTD/xhtml-rdfa-1.dtd"
上面的这种是基于XHTML的,主要是因为此标签的可扩展性,可以使得RDFa更好的嵌入,但是虽然html无法有这么好的扩展,但是仍然有针对它的标准,定义如下:
12
!DOCTYPE html PUBLIC "-//W3C//DTD HTML4+RDFa 1.0//EN" http://www.w3.org/MarkUp/DTD/html4-rdfa-1.dtd
而对于html来说,唯一需要解决的问题就是对名字空间缺乏的问题。
优势:
增强的搜索功能 Publisher Independence 数据再利用性 自我控制 模块化架构 可提升可访问性实现原理:
(本文来源于图老师网站,更多请访问http://m.tulaoshi.com/webkaifa/)在实现主要是通过引入名字空间的方法在已有的标签中加入RDFa相应的属性来使得支持RDFa技术的浏览器或者搜索引擎可以解析到,从而达到优化的目的,就通过一段简单的代码做实例吧:
12345
div xmlns:dc="http://purl.org/dc/elements/1.1/" about="http://www.example.com/books/wikinomics"span property="dc:title"Wikinomics/spanspan property="dc:creator"Mr right/spanspan property="dc:date"2006-09-02/span/div
在上面的代码示例中主要用到了RDFa属性中的about属性和property属性,这段代码示例说明了一篇文章,然后描述了和这篇文章相关的信
息,比如说标题,创建者和创建日期,而这些属性就可以使得支持RDFa的机器识别,从而形成跟我们人类所理解的那种结构的一个体系,达到我们的目的。
而我们要做的就是在我们了解这个网络的同时,我们也要让机器跟我们一样懂。
前景:
W3C刚出不久的一个标准(2008/10/14) 目前firefox已经有了针对RDFa的插件,可以对使用RDFa的页面进行解析。 Google已经在今年的5月12日发布支持RDFa以及微格式的宣言。 而在Google之前,yahoo已经支持了RDFa了,而且目前已经有相应的优化页面。通过这些我们可以看出,RDFa的前景还是很不错,如果某一天真的浏览器也支持了,那我们的互联网上将会出现一种新的局面,期待中,大家有什么问题,也可以一起探讨。