4.1 教育数字媒体内容资源描述与组织
1.教育数字媒体内容资源描述技术
1)教育数字媒体内容教育属性描述方法
随着互联网的发展,信息资源的描述日益成为突出问题,只有提供了高度扩展性、灵活性、实用性的信息描述及其工具,才能支持和促进信息资源的检索、交换、发现等诸多应用,实现信息资源的有效组织和管理。教育数字媒体内容相较其他种类的信息资源,具有数据量大、人工管理困难等特点,因此更加需要进行内容描述和标准化工作。
目前,面对信息资源,一般采用资源描述技术,主要是资源元数据技术。元数据(metadata)是“关于数据的数据”。针对元数据的处理,以W3C等为代表的技术组织提出了XML、RDF、Semantic Web等具有高度灵活性、可扩展性的技术框架,以实现对通用信息资源的描述:在数字图书馆领域,有在线计算机图书馆中心(OCLC)制定的都柏林元数据核心集(Dublin core metadata initiative,DCMI);在教育资源描述领域,比较著名的有教学管理系统全球学习联合公司(IMS)的学习资源元数据(learning resource metadata,LRM),国际电器电子工程师协会学习技术委员会(IEEE LTSC)的学习对象元数据(learning object metadata,LOM),国际标准化组织与国际工程师协会第一联合技术委员会第三十六工作组(ISO/IEC JTC1SC36)的学习资源相关元数据(metadata for learning resource,MLR)等著名标准/规范。
中国网络教育技术标准组织也制定了相关学习对象元数据(CELTS-3)标准。该标准通过定义一个通用的概念数据模型,保证学习对象元数据的绑定之间有较高程度的语义互操作性,使不同绑定之间的转换变得简单、直接。学习对象元数据模型描述了学习对象元数据的数据结构,它将学习对象的基本特征划分成以下9个不同的类别。
(1)通用。主要包含整体描述学习对象的一些通用信息,如标题、关键字、标识符等。
(2)生存期。主要包含同学习对象的历史和当前状态有关的属性信息以及对学习对象的发展起作用的个人和组织的信息。通用和生存期这两个类别所描述的信息是传统意义上的属性信息,覆盖了Dublin core大多数的数据元素。
(3)元-元数据。主要包含元数据实例本身(注意不是元数据实例所描述的学习对象)的一些信息,如元数据实例的创建者、元数据实例所使用的语言等。
(4)技术。主要包含学习对象在技术要求和技术特征方面的信息,如数据格式、大小、软硬件要求等,这些特征和学习对象的运行、获取和存储有直接关系。
(5)教育。主要包含学习对象在教育和教学特征方面的信息,如终端用户类型、使用对象、语义密度等,这些信息是区分教育资源与其他资源的重要特征。该类信息的存在有利于教学目标的实现和教学质量的提高。
(6)权利。主要包含学习对象知识产权和使用条件等信息。该类信息和电子商务有较密切的关系。
(7)关系。主要包含学习对象同其他相关学习对象之间的关系信息。在此基础上可以建立学习资源网络,为学习者提供全面、系统的资源服务,也有利于引导学习者对其他领域产生兴趣。
(8)评价。主要包含对学习对象在教学使用上的一些评价,以及这些评价的作者和创作时间等信息。这些评价信息有利于教师之间交流经验,同时为学习者提供有用的参考和指导。
(9)分类。包含学习对象与某个或某些特定分类系统的关系信息。恰当的分类对学习对象的管理、查找都有很大的帮助,但现在仍然缺少统一的分类方法。
教育数字媒体内容作为一种教育资源,具有一定的教育方面的属性和特征,当然可以将其抽象为学习对象资源。因此,在分布式教育数字媒体内容管理中我们采用CELTS学习对象元数据标准CELTS-3作为内容描述标准,并使用XML语言来实现对其元数据信息的描述。
2)教育数字媒体内容媒体属性描述方法
教育数字媒体内容在具有教育资源属性的同时,还具有多媒体资源方面的一些属性和特征。例如一段教学视频具有多种视觉和听觉特征,并具有时间和空间关系。此外,教育数字媒体内容往往具有不同的类型、不同的风格、不同的粒度(素材/片段/成品等)以及不同的格式。要实现海量教育数字媒体内容的有效管理和高效检索,除了研究学习对象这一粗粒度的资源描述技术之外,还应该研究更加细粒度的数字媒体内容描述技术。
MPEG组织制定的MPEG-7标准是一个专门用于描述多媒体内容的标准,其目标就是要对各种不同类型的多媒体信息进行标准化描述,并将该描述与所描述的内容相联系,以实现快速、有效的媒体内容管理和检索。MPEG-7标准涉及的媒体对象包括静止图像、图片、音频、活动图像等,对于不同的数据类型,MPEG-7定义了不同的描述集,包含各种视觉和听觉特征描述符。在视觉特征方面主要有颜色、视觉对象、纹理、轮廓(草图)、形状、静止和动态图像、体积、空间关系、运动(如视频镜头中的运动,用于利用时间合成信息来检索等方面)、变形(如对象的弯曲)、视觉对象的源及其特性等。在听觉方面的特征主要有频率轮廓线、音频对象、音色、和声、频率特征、振幅包络、时间结构(包括节奏)、文本内容(语音或歌词)等。
MPEG-7的制定对基于内容的海量数字媒体内容管理和检索技术的发展起到了积极的推进作用,各种数字媒体内容检索系统应运而生,如UIUC的MARS系统,IBM的CueVideo系统,Microsoft的新闻视频浏览系统,哥伦比亚大学的VideoQ系统等。
因此,在分布式教育数字媒体内容管理中,我们还要采用MPEG-7标准对数字媒体内容的细粒度级别的视、听觉特征进行描述,目的是实现基于内容的教育数字媒体内容检索和管理。通常MPEG-7描述也可以使用XML语言来实现。
2.教育数字媒体内容组织技术
在教育数字媒体内容组织技术方面,我们可以利用内容包装规范(content pack-aging specification,CPS)来进行资源的组织和管理。该规范旨在为学习内容定义一个标准的数据结构,并且绑定足够的描述信息,以便进行学习资源的快速检索以及有效的共享和交换。在符合内容包装规范的前提下,使用不同的教育资源制作工具制作的资源只要发布在网上,就可以很快地被检索到,可以作为独立单元进行传输和交换,可以在不同的平台上被执行,而且可以在不同的制作工具中被重复使用。内容包装规范使学习内容成为可以在多个应用与学习环境之间进行交换重复使用的学习单元,有利于不同网络教育机构之间进行充分的教育资源共享,减少学习内容制作的时间和开销。
内容包装规范定义的信息模型如图4-1所示,主要包括以下结构。
(1)PACKAGE(包)。它是一个逻辑目录,包含了一个顶级内容清单文件以及各级子目录中包含的实际物理文件。一旦一个包为了便于传输而被合成为一个单独文件,则被称为包交换文件。包交换文件是一种简练的网络发送形式,一种传输结构化信息的方法。一个包代表了一组可单独使用和重复使用的学习内容,是各种粒度学习内容的集合,是可独立运行的、有意义的学习单元,还可被重组和拆分成其他包。
(2)Manifest(内容清单)。它是对有意义的教学资源的描述,描述了包自身,它也可以包括可选的子内容清单。内容清单的作用范围是可伸缩的。内容清单描述的是可以独立使用的学习内容(课程的一部分、一门完整的课程或一系列课程的集合)。通过使用子内容清单可以组合和拆分一个包,而这完全由内容制作者决定。如果组成课程的所有内容连接紧密以至于不能进行拆分,内容制作者就可以使用一个内容清单来描述整个课程的资源和组织。否则,内容制作者可以为每个教学对象制作各
图4-1 内容包装规范信息模型
自的内容清单,把这些内容清单相互组合,可以形成更高级别的、不同课程的内容清单。最后,一个内容制作者也可以把多个课程放到一个包(课程集合)中,这样一个顶级内容清单将包含各个课程级内容清单和课程中所包含的各教学对象内容清单。每一个内容清单实例包含以下几部分。①Meta-data(元数据)部分。对内容清单作整体描述。②Organizations(组织结构)部分。描述了在内容清单中内容的一个或多个组织结构。③Resources(资源)部分。包含了对所有实际资源和内容清单中所需媒体元素的引用,还包括描述资源的元数据和对任何外部文件的引用。④(sub)Manifest(子内容清单)部分。零个或多个嵌套的内容清单。
(3)PHYSICAL FILES(物理文件)。是指媒体文件、文本文件、测评文件以及其他以文件形式存在的数据。不像包,它不能独立发布。每个物理文件或者在内容清单的资源元素中描述,或者在资源依赖的文件列表中列出。在内容清单中描述的物理文件和内容清单文件一样是包不可缺少的组成部分。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。