迈向语意查询的网路学习环境-Ontology与SCORM的结合运用
迈向语意查询的网路学习环境-Ontology与SCORM的结合运用
林萤骏 klood@telgem.com.tw 李升暾 stli@mail.ncku.edu.tw
国立高雄第一科技大学 信息管理系 国立成功大学 信息管理研究所
林居鸿 u9124801@ccms.nkfust.edu.tw 张渊钧 u9124365@ccms.nkfust.edu.tw
国立高雄第一科技大学 信息管理系 国立高雄第一科技大学 信息管理系
摘要
现今网路学习的观念渐趋成熟,许多研究单位也纷纷的投入网路学习平台的开发,但也产生了网路学习平台其标准各自为政的问题,使其学习教材在众多平台中难以共享,于是美国国防部推出SCORM标准用以规范学习教材,使教材能够在符合SCORM标准的学习平台上能够重复使用,而教材通常会透过订定的Meta-data來描述其内容。而为有效地促进SCORM教材的分享,提升学习教材搜寻的效率,利用Ontology做为描述学习領域的相关概念模型,并引进本体工程理論(Ontological Engineering),对不同教师的SCORM教材加以分析、比对、归纳、关聯,以建立课程间的关系,提供评估、推荐功能,进而提供学习者具有语意及推理功能的SCORM教材搜寻机制。
关键词: E-Learning、SCORM、Semantic Web、Ontology、Ontological Engineering
壹、 前言
近年來远距离教学盛起,各界纷纷投入教学系统的开发,然而这些优质的系统间因为缺乏共通的标准,使得存放在这些平台中的教材难以共享。有鉴于此,学习平台之间应有一套公开遵循的标准存在,如IMS、IEEE LTSC、AICC CMI、AROADME等,其中SCORM(Sharable Content Object Reference Model,分享式内容组件参考模式),是由ADL参考上述标准,所制定的网路学习平台。当教材与平台都遵循同一个标准,教材便能在不同学习管理系统中彼此分享使用[1]。
在标准化奉为圭臬的同时,现行网路学习仍然潜伏「信息松散」的问题。「如何寻找有效的课程?」、「相关课程为何?」、「可以參考什么课程?」,这是学生及老师所面臨的困扰之一,虽然学习者可透过网路学习平台搜寻到大量的学习教材,但是当网路学习平台发展到一定的程度,其所提供的学习教材數量势必相当惊人;所以如果搜寻到的教材不能依照学习者的需求加以过濾、编排,那么所呈现出來的学习教材将只是一堆杂亂无序、毫无意义的资料罢了。
如何有效的搜寻学习教材是网路学习平台非常重要的功能,举例來說,学习者如何从众多网路学习平台中搜寻出有用的教材,其关键在于学习者所下达的查询命令是否能被搜寻引擎所理解。目前在搜寻引擎的设计都是透过比对字串的为其主要的运作模式,所以在查询学习者所需资料的同时,搜寻引擎并不具有字义的理解能力,也无法找出字与字之间的关聯性,于是Tim Berners-Lee教授提出「语意网」(Semantic Web),也称为第二代全球信息网,「语意网」是当今网路的延伸,也就是要把全球信息网上的资料,变成计算机能理解的资料型态[9]。
因此为了解决上述问题,利用「语意网」的互連及推理的特性提供语意式搜寻,以及为了能使语意式搜寻能应用于各个不同的学习領域,则需仰赖Ontology的运用。因此在网路的学习平台上,Ontology可以视为该学习系统所提供的学习教材分類准则。同时,以Ontology所架构出來的概念,在针对不同的学习領域,即可以使用不同的Ontology來描述。若日后欲将此网路学习平台转移到不同的学习領域时,仅需将其Ontology模块置换成描述该学习領域之Ontology即可。
一般而言,Ontology的应用仅针对某个特定的領域,如医学、金属产业或造船业。而本論文以「信息教学」为例,我们采用由ACM组织所制定之规范去建构其Ontology[8],该规范乃以计算机領域所有关键词所组合而成的,其主要优点为,该规范已存在一定的时间,较为大家所认可,所以采用其做为对信息領域学习教材的分類。
本論文针对以SCORM为基础的网路学习平台,提出一套有效的SCORM教材管理机制,透过SCORM本身对教材已规定好丰富的Meta-data,并引进本体工程理論(Ontological Engineering)[10,12],针对不同的SCORM教材加以分析、比对、归纳、关聯、评估、推荐,因此彼此不认識的教材作者所制作的教材得以串聯,以辅助网路学习平台对SCORM教材能进行更精确的分類管理工作。而学习者透过网路学习平台的推荐,更容易选择「适性化」或「个人化」的教材,进而让学习者能在众多的学习教材中找到所需要的资料,改善以往查询准确度不够高的问题。综合上述,如何利用SCORM的教材Meta-data与Ontology结合运用,并产生知識库提供学习者更完整及详尽准确的查询结果,是本論文的重点,我们将在本論文中一一陈述。
贰、 文献探讨
一、SCORM
SCORM (Sharable Content Object Reference Model)是美国国防部于1997年提出「先进分布式学习主导计划」 (Advanced Distributed Learning Initiative)时推出的共享式教材组件标准。如其名,主要目的在于建立一个「同一教材在不同学习管理平台上分享」的标准,因此符合SCORM标准的教材俱有,可重用性(reusability)、可得性(accessibility)、恒久性(durability)、互用性(interoperability)等諸项特性[2,5]。
SCORM主体包含了内容整合模型(CAM,Content Aggregation Model)以及执行环境(RTE,Run-Time Environment)。内容整合模型是描述如何制作与组装规格符合SCORM的学习资源,让同一学习资源得以在不同的学习管理系统(LMS, Learning Management System)上互通。学习资源规格是遵循ADL教材标准定义,依据IMS订定之Meta-data來描述教材内容,其中学习资源的描述方式,称为LOM(Learning Object Metadata),学习资源的组装规格,称为Content Packaging。不論LOM或Content Packaging皆是以XML格式呈现[1]。SCORM执行环境主要是提供学习管理平台与共享内容沟通的环境。为了让不同厂商所制作的教材资源都能兼容于不同的学习管理平台,SCORM定义了共同方法使学习平台和学习内容有一共通的沟通管道。藉由内容整合模型和执行环境的搭配运用,学习组件就可以在不同的学习管理平台之间共享及重用。
二、Ontology
本体論(Ontology)起源于哲学,以哲学的观点來看「本体」是一切存在的终极本质,因此Ontology乃是对于万物的现实及其关系的一种概念描述[6]。所以当其观念引进到知識管理的領域,并结合相关的信息科技期望能解决知識的不具结构性及缺乏正规的表示方法來表达知識的本质。所以Ontology可视为是针对某一特定任务(Task)或領域(Domain)知識的主体來描述该任务或領域之概念的分類,而某个知識領域所表达出來的概念,其概念之间会具有其阶层性及关聯性。换言之,Ontology在某种程度上也表达了该知識領域的一个概念模型[3]。
我们运用Ontology此一概念模型,经由本体工程理論(Ontological Engineering)[10,12]來将分散在各地的知識加以重新彚整,使其知識可以更容易去寻找及再利用。而本体工程理論则是探讨如何有效的利用Ontology此一公认的架构,去进行知識内容的分析及语意上的比对处理的相关方法,而在这个知識转化的过程我们称之为本体化(Ontologization)。
三、KAON-The Karlsruhe ontology and Semantic Web framework
KAON为德国Karlsruhe大学的FZI (Research Center for Information Technologies)和AIFB (Institute of Applied Informatics and Formal Description Methods)所共同发展的Open-Source计划。KAON包含了相当多的工具及开发套件,被设计用來建构Ontology的发展平台,并可利KAON API來开发以Ontology为基础(Ontology-based)的语意趋向(Semantic-driven)应用软件,且可以建置在J2EE的架构底下为系统带來显着的稳定性、弹性、安全性、及可移植性。而利用KAON API所建立的KAON Ontologies,它主要是由Concepts、Properties和Instances所组成,而此一KAON Ontology我们则称其为OI-Model(ontology-instance models)[7]。图1为描述体育用品的OI-Model的部份范例,如运动器材(Sports Utility)会使用于(used-in)运动(Sport)上面,Sports Utility及Sport为描述现实所代表的概念,而此一概念则称其为Concept;而Sport Utility与Sport之间即以used-in做为其之间的关系描述,则称之为Property;而描述每一个概念的实体,则称其为Instance,如Sport这个Concept底下有兩项运动用來代表运动种類的实体,各为Climbing及Cycling[4]。
图 1:OI-Model
形式存在,一种是为档案形式,另一种则是储存在关聯式资料库中。而KAON Engineering Server正是被设计用來可以同时多人存取OI-Model的一种服务器,其搭配关聯式资料库來储存OI-Model。 因此当我
析时,整个系统的运作效能更显重要, KAON Engineering Server选择使用关聯式资料库做为OI-Model的储存媒体,一來可以让系统同时多人多任务处理,增加未來系统开发的实用性,并解决传统在处理以档案为基础的RDF查询效率不佳的缺点,且能对系统異动有更好的掌握并增加系统的稳定性。
ntologization)的參考模型,并说明如何透过SCORM的教材Meta-data与Ontology相结合,最后把经由本体化的SCORM教材汇入到知識库并提供整合的查询接口,让学习者可以透过查询接口找出所需的SCORM教材。该架构如图2所示。
是如何协同运作,提出的架构中,可以粗略地分为四个部份
(1) KAON Engineering Server
(2) Transformation Agent
(3) Ontologization
(4) Knowledge Search Mechanism
一般在实作 Ontology 都是以 RDF 來描述 Ontology,在 KAON 的架构中 OI-Model 则可以有 兩种 们需要对 OI-Model 做各种存取的动作,尤其在利用 OI-Model 做知識的推理及语 意分 參、 系统架构 在本节中我们将介绍在SCORM网路学习平台上,如何利用Ontology做为SCORM教材本体 化(O 图2:系统架构图 我们将逐一探讨系统内部的各个模块 并详述各个模块的功能,而在本論 文所 一、 KAON Engineering Server 我们依据 Ontology 來做为本体化(Ontologization)SCORM 教材的參考模型,如文献探讨中所 提到
,我们采用KAON Engineering Server做为操纵OI-Model的系统。如图2中,KAON Engineering Server在底层透过KAON API对OI-Model做新增、删除、修改的动作,并提供一个查询接口(Query Interface),使得外部的使用者可以利用KAON Query Language搜寻整个OI-Model,而在KAON Engineering Server后端则以关聯式资料库做为其储存OI-Model的媒体。
二、 Transformation Agent
SCORM的教材编制准则是定义在Meta-data裡面,为了让教师在制作教材时有足够的发挥空间,其Meta-data的制定可說十分详尽,其中用來描述LOM的属性就有數十项,若以其主要功能來归纳则可分为九大類,如表1所示:
表1:SCORM Meta-data分類模型
元素名称 說明
1 General 描述学习资源的一般信息說明。
2 Life Cycle 描述学习资源的歷史资料和目前的狀态,及影响其学习资料的異动歷程记錄。
3 Meta-Metadata 描述此学习资源的meta-data的相关信息。
4 Technical 描述此学习资源所需用到的技术、特性及其使用环境。
5 Educational 描述此学习资源在于教育上的特性。
6 Rights 描述此学习资源的版权及使用情况。
7 Relation 描述学习资源彼此之间的关系。
8 Annotation 描述使用学习资源时必要的批注。
9 Classification 描述此学习资源所属的分類。
然而教师在编制教材时不一定要用到全部的属性才能完整描述教材内容。为了让教材Meta-data在本体化后有足够的信息來描述教材特性及建立教材间关聯,我们撷取
、、这三种最常用的项目及其子属性,如表2。我们知道文件在本体化的过程中,最为困难且耗时的莫过于文件内容的剖析及关键词的比对,为了提高教材自动化分類的精确度和缩减系统开发的时间,我们利用中的來储存教材分類的关键词。 而Transformation Agent扮演着转换SCORM的教材Meta-data到关聯式资料库(为图2的SCORM Meta-data Storage)之间的转换桥梁,Transformation Agent主要是以 JAXB为核心所构成的,而JAXB为升阳(Sun Microsystems)所发展用來处理XML的程序开发工具,它可以自动将XML文件与Java对象互相对应。JAXB可将XML Schema编译成一或多个Java 類别原始码,而这些Java類别原始码经过编译实体化成为Java对象后,则可以解析与格式化所有符合该XML Schema的XML文件。 SCORM的教材Meta-data本身为XML档案,也因为它的规格符合SCORM的标准,且ADL在推出SCORM之际,也同时的公开其XML Schema[11],所以JAXB藉由剖析其XML Schema并透过自动化的转换机制把剖析出來的资料储存至SCORM Meta-data Storage。 Transformation Agent采用JAXB最大的好处就是可以减少程序代码的數量,并可大幅减少程序的复杂度,最重要的是当SCORM Meta-data有所異动时,程序将不用再做大幅度的修改甚至是重写,只要重新下载新版本的Schema并对它重新编译即可,有了这些自动化的机制,对于减轻开发者的负担将有很大的帮助,开发人员不必再因SCORM规格改版而大幅修改程序,如此一來开发者便能专注心力于其它功能的开发,并且可以节省相当多的开发成本。 表2:SCORM Meta-data信息模型 1. General 1.1 title 1.1.1 langstring 1.2 catalogentry 1.2.1 catalog 1.2.2 entry 1.3 description 1.3.1 langstring 2. Lifecycle 2.1 version 2.1.1 langstring 2.1 contribute 2.1.1 role 2.1.1.1 source 2.1.1.1.1 langstring 2.1.1.2 value 2.1.2 centity 2.1.3 date 3.Classification 3.1 taxonpath 3.1.1 taxon 3.1.1.1 source 3.1.1.2 id 3.2 keyword 3.2.1 langstring 三、 Ontologization SCORM教材的本体化(Ontologization)是本論文的主轴,如文献探讨中所提到,将知識转化成具一致性的概念且能用完整的概念模型來表达其知識領域,亦能为该知識領域的专家所能认同,这过程我们称之为本体化。换言之,也就是将知識外显化,使其能更易于被理解及再利用;以SCORM教材來說,运用SCORM教材中原有丰富的Meta-data将教材建立明确的关系,内隐知識便得以外显,课程群组将发挥比单一课程更大的教学功效。 由于每一个SCORM教材都有Meta-data描述其特性,在对SCORM教材本体化的过程中,我们依据表2所订定的SCORM的教材Meta-data中所定义的完整内容來做为其分類的依据,不对SCORM教材的内容做复杂的剖析及处理,以简化本体化SCORM教材的困难度。首先我们透过KAON所提供的Query Language去查询OI-Model (ontology-instance models)的各个成员,并将其查询的结果与欲分析的SCORM的教材Meta-data做相关的分析比对,在分析比对的过程中,经由Semantic Analysis剖析Meta-data的内容找出其字彚的相关性,并透过Inference Engine藉由OI-Model所定义的知識領域概念,推导出此一SCORM教材之间的关系,使得Rule-based Category这个机制可以依据分類规则对SCORM教材做分類,最后经由一連串的比对及最佳化的处理后,就可以产生本体化的SCORM教材(Ontological Data)。之后将本体化的SCORM教材汇入到Knowledge Base去,以利日后对SCORM教材的语意式搜寻与存取。 在本体化这个机制中,包含了以下几个重要的处理组件:(1) Semantics Analysis (2) Inference Engine (3) Rule-based Category (4) Scheduling (5) Indexing (6) Matching,其详述如下。 (一) Semantic Analysis 知識如何有系统的转化成让系统更容易去处理的形态,Semantic Analysis是一个可行的方案,就系统处理面來說,Semantic Analysis是本体化的核心处理流程,在本論文我们以Semantic Analysis这个功能去分析SCORM的教材Meta-data内容,为裡面所定义的词彚分析出各个不同的属性,其各功能详述如下: Àz 语言转换 在OI-Model (ontology-instance models) 裡我们可以针对每一个成员(Concept、Property、Instance) 定义相关的Lexical Information,举例來說我们有一个成员(Concept)中文名称叫做书本,英文则称为Book,西班牙文为Libro德文为Buch,同样一个名词在各个语文则有不同的写法,从系统观点來看Book与Buch是没有任何的相異性,所以在OI-Model只要为每一个成员定义各个不同语言的词彚,相对的也达成了跨语言词彚的转换。 Àz 同义字分析 我们常会发现一个词彚可能都会有好几种不同的意义,而通常在述描某一个意义的词彚也常会出现好几种。例如,英文的Chief此一词彚中文可翻作首領,而首領也可以被翻成Leader表示領导之人,所以Chief及Leader这兩个英文词彚可說是互为同义字。当我们了解什么是同义字之后,可以利用此一特性做更广泛的分析,找出每一个词彚的关聯性,接下來在提供多重词彚词义的检索上会有更精准的判断。 Àz 词干分析 词干是没有词形变化的部份,也就是词彚的源头,以英文來說就是不含变化形的字词。词彚可以有相当多的特性,例如:同义词、上位词、下位词、词干...等等,这些特性在我们转化的过程,如何的正确的辨明词义是非重要的。以have这个词彚來說,当我们分析到有关has、had、having这些词彚时,会找出这些变化形的动词词彚的词干,如此可以更准确的找到我们的资料。 (二) Inference Engine 在OI-Model中Concepts之间的关聯性可以由Property來做連结來表示其关系,而此一Propety可以被设定为Symmetric、Transitive或者是Inverse的型态,其详述如下: Àz Symmetric Properties:如果A is-friend-of B,若is-friend-of为Symmetric,则KAON会利用此一Property推理出B is-friend-of A。 Àz Transitive Properties:如果A is-friend-of B而且B is-friend-of C,若is-friend-of为Transitive,则KAON会利用此一Property推理出A is-friend-of C。 Àz Inverse Properties:如果A is-parent-of B而且is-child-of与is-parent-of为Inverse关系,则KAON可以推論出B is-child-of A。 这些特性使得OI-Model具有轻量的推理机制(Lightweight Infernece Mechanism)。所以当我们对SCORM 的教材Meta-data做完语意分析(Semantic Analysis)之后,会根据所分析出來的结果与OI-Model做比对,以决定SCORM教材该属于OI-Model的那一个成员(Concept)底下,并仰赖OI-Model各个Concept之间所建立起的属性(Property)所隐含的推理功能去导出SCORM教材之间的关系。 (三) Rule-based Category 当系统对SCORM的教材Meta-data进行Semantic Analysis及依据Inference Engine所推理出SCORM教材之间的从属关系之后,SCORM教材之间已经具备关聯,最后为每一份SCORM 教材归纳其分類。所以当SCORM教材取得它所归属的類别之后,就会依据分類的结果及先前所做完的分析,汇入到知識库(Knowledge Base)中,使得学习者更容易去查询及找到所需的SCORM教材。 而采用规则式分類方法只要透过浅显易懂的规则设定,就可以协助大量的SCORM教材进行分類,而且所订定的分類规则也可以随时依环境的改变而有所变动,所以除了能大幅地提升系统效能之外,也能使系统具有更大的弹性,并增加系统的分類准确度。 (四) Scheduling SCORM教材的本体化(Ontologization)可以依据系统所设定的时间來决定何时要转化SCORM教材,所以我们可以利用排程设定(Scheduling)方式,选择在系统的離峰时段自动执行,减少系统资源的消耗,或者面对例行性的SCORM教材本体化而设定为长期的自动执行,以避免管理者需要每天去为例行性的工作而设定排程。 (五) Indexing 当我们把本体化(Ontologization)的SCORM教材,汇入到知識库(Knowledge Base)的同时,系统便会产生其相对应的索引,并建立及更新其索引表,透过索引可以帮助学习者可以更快速地在知識库搜寻其所需要的SCORM教材。同时知識库也可以透过排程设定,定期为索引做最佳化及调整,让索引可以实时反应知識库的SCORM教材狀态。 (六) Matching 在本体化(Ontologization)过程中,比对机制(Matching)会针对SCORM的教材Meta-data内容,将其与OI-Model的Concept、Property、Instance的词彚做语意上的比对,并依分析出來的结果产生出其比对的相似值,并依照比对的相似值决定SCORM教材与OI-Model的成员的关系。也就是說,SCORM教材该位属于OI-Model的那一个成员上。 四、 SCORM教材搜寻机制 在SCORM教材的搜寻方面,是由HTTP Server裡的Integrated Search Engine所负责,它会透过JDBC协议到知識库(Knowledge Base)去查阅出学习者所需要的SCORM教材,而知識库所存放的内容是经过本体化的SCORM教材。Integrated Search Engine提供了基本的分類搜寻,学习者可以搜寻所有的知識库,亦可针对某一類知識库做搜寻。所以,当我们针对某類知識库内容做搜寻而所查询出來的结果亦属于另一類,则Integrated Search Engine亦会至另一類知識库搜寻,以提高搜寻的效果。 另外我们也提供了SCORM教材的查询接口(Query Interface),让学习者可以透过简易的操作接口,做为与Integrated Search Engine的桥梁,学习者可以键入关键词做基本搜寻,也可以设定多重进阶的搜寻条件:指定标题、作者,或内文要包含某些字串,并利用布林函數 (AND、OR、NOT) 加以组合,并配合模糊搜寻,最后所搜寻到的内容可以以分類的方式所展现出來,并找出相似的教材出來。 肆、 结論 在本篇論文中我们针对以SCORM为基础的网路学习平台,提供教材的语意查询功能,学习者更容易在学习平台上找到适合的学习教材。利用Ontology做为描述该学习領域的概念模型,并引进本体工程理論(Ontological Engineer)将分散在各处的SCORM教材本体化,而使得SCORM教材之间得以整合串聯起來,因此学习者可以透过更直觉化的搜寻方式找出其所想要的学习教材,而不需透过复杂的查询语言。另外,当学习平台所提供的教材内容欲转换至其它領域,仅需要将Ontology置换成该学习領域之Ontology即可,使学习平台之应用更有弹性。SCORM制定丰富的Meta-data來描述其教材,Ontology得以为关键词之中隐晦的关系建立关聯,俱各自具备其优点。我们希望我们的研究成果,能将这兩项优点充份结合发挥,系统便能为教师找出其相关的课程教师,也能为学生勾勒出课程藍图。未來我们将更效力于将目前系统尚不完善的部份持续完成,例如教材藍图的推荐机制等等,以使我们的系统,更能提高教学之成效。 伍、 致谢 本计划承蒙国科会计划NSC91-2520-S-327-001、NSC92-2524-S-327-001,谨此志谢。 陸、 參考文献 [1] 李升暾、张渊钧、林居鸿,2003,「數位学习教材自动化管理-以整合SCORM与LDAP为例」,2003台湾网际网路研讨会,国立政治大学。 [2] 李升暾、林居鸿、冯志成。2003。”符合SCORM标准的多媒体串流教材模型”,2003网路教学系统平台与内容标准化学术研讨会,高师大。 [3] 谢煌志、李升暾,2002,「基于本体論分布式知識管理系统之研究」,2002 [4] A. Maedche and B. Motik and L. Stojanovic and R. Studer and R. Volz,“An Infrastructure for Searching, Reusing and Evolving Distributed Ontologies", WWW 2003, Hungary, 2003. [5] ADL Co-Laboratories, http://www.adlnet.org/. [6] Barry Smith, Christopher Welty,“Ontology: Towards a New Synthesis“, FOIS’01, October 17-19,2001, Ogunquit, Maine, USA. [7] B. Motik, A. Maedche and R. Volz,”A Conceptual Modeling Approach for Semantics-Driven Enterprise Applications“, Proceedings of the First International Conference on Ontologies, Databases and Application of Semantics (ODBASE-2002), Springer, LNAI, California, USA, 2002. [8] Computer Classificaation System, http://www.acm.org/class/ [9] D. Fensel, I. Horrocks, F. Van Harmelen, S. Decker, M. Erdmann, and M. Klein,“OIL in the Nutshell“,In: Knowledg Acquisition, Modeling,and Management, Proceedings of the European Knowledge Acquisition Conference, 2000. [10] Riichiro Mizoguchi and Jacqueline Bourdeau, “Theory-aware authoring environment-ontological engineering approach”, Proceedings of the International Conference on Computers in Education(ICCE’02). [11] SCORM Version 1.2 XML Controlling Document - IMS Global Learning Consortium, Inc. Learning Resource Meta-data Specification Version 1.2.1 XML XSD http://www.adlnet.org/index.cfm?fuseaction=DownFile&libid=269&bc=false [12] Vladan Devedzic, "Understanding ontological engineering", Communications of the ACM, p136-144, 2002