如何提高数字图书馆的数据安全性论文

时间:2022-11-17 08:13:06 论文 收藏本文 下载本文

如何提高数字图书馆的数据安全性论文(精选16篇)由网友“喵嘟月”投稿提供,下面是小编给大家带来关于如何提高数字图书馆的数据安全性论文,一起来看看吧,希望对您有所帮助。

如何提高数字图书馆的数据安全性论文

篇1:如何提高数字图书馆的数据安全性论文

如何提高数字图书馆的数据安全性论文

摘 要 本文主要讨论如何提高数字图书馆的数据安全性,首先讲述数据安全性对数字图书馆的重要性,然后描述了目前我国数字图书馆的数据安全性现状;然后分析了影响数字图书馆数据安全的因素,最后详述了如何提高数字图书馆的数据安全性,分别从软件安全措施、硬件安全措施和人员素质培养措施这三个方面进行具体描述。 关键字

数据安全 数字图书馆 数据库 复制技术

一、论题背景

随着计算机技术和网络技术的不断发展,我国各高校的数字图书馆系统,无论从承载的业务量和数据规模,还是提供服务的质量上,都得到了很大的提高,特别是通过Internet对外提供的很多人性化的服务,例如:馆际互借、网上预约、在线续借、在线查询、推荐订购等等。

然而,Internet作为一个庞大的计算机网络,其通常跨越的物理范围从几十公里到几千公里,它能连接多个城市或国家,或者横跨几个洲,并能提供远距离通信,形成国际性的远程网络。其具有信息资源的共享性、整体的开放性和分布的广域性,而真是这些特点为系统的破坏、信息的盗取以及非法的操作,提供了极为方便和难以预防控制的可乘之机。因此,数字图书馆的数据安全性是现代各高校图书馆必须关注的核心问题,其直接关系到数字图书馆的可用性、安全性、稳定性以及未来的发展。

二、数据安全的因素

影响数字图书馆的数据安全因素较多,包括内部的、外界的、人为的和不可抗因素等等,但主要可以罗列为以下几个因素:

首先,是自然灾害原因,如火灾、地震、水灾、雷击等各种自然灾害导致主机损坏而造成的数据丢失情况。

其次,因服务器突然断电或者主机耗损过度而导致有重要数据的硬盘损坏,从而造成的数据丢失情况。

其次,人为的误操作导致,如误拔电源、误删除重要文件等造成的数据丢失情况。

其次,来自Internet的恶意攻击,如网络恶意攻击数字图书馆服务器,损坏数据和重要文件而造成的数据丢失情况。

最后,软件故障原因,如某些恶意软件或者带有病毒的盗版软件,导致操作系统损坏或者数据丢失情况。

由此可见,怎样妥善处理好以上5个主要因素,是保证数字图书馆的数据安全的`根本。

三、提高数据安全性措施

针对以上提到的影响数字图书馆数据安全因素,我们可以从软件安全措施、硬件安全措施和人员素质培养,这三个方面来解决数字图书馆在数据安全性方面存在的问题。

1、工作人员素质

图书馆管理员的个人素质高低,对于数字图书馆的数据安全有直接的影响。因此,针对图书馆工作人员的安全素质培训是非常重要的。我们可以采用以下措施:

首先,对于图书馆管理人员的选拔,我们应该尽量选择那些做事比较细心、慎重的,最好有计算机知识基础的人,谨慎使用做事比较粗心大意的人。

其次,我们要定期对图书馆工作人员进行安全培训和考核,包括系统安全、软件安全、数据库安全和服务器安全等。只有这样,我们的工作人员的安全素质才会不断地提高,同时图书馆的数据安全也得到了人力的保障。

最后,我们要对以前出现过的故障,以及经常遇到的问题进行总结,这样我们图书馆的工作人员的实战经验会得到很大的提升,工作效率相对的也会提高很多。

2、硬件安全措施

硬件安全措施主要是指储存数字图书馆数据的服务器安全,其对于数字图书馆的数据安全也有着直接的影响,因为一旦服务器出现故障,例如磁盘损坏,那么其后果可能是无法弥补的。

3、软件安全措施

软件安全措施分为系统软件安全措施和应用软件安全措施。系统软件安全包括操作系统和数据库,其安全是其他软件安全的基础。应用软件安全措施主要是指数字图书馆系统软件安全措施,其安全是保证数字图书馆的数据安全的首要保障。

(1)操作系统安全措施。操作系统安全是其他所有应用软件的安全根本,也是数字图书馆的数据安全的前提。对于windows系列的操作系统,因为其应用最为广泛,因此最容易受到计算机病毒感染,也总容易遭到黑们的攻击。

(2)数据库安全措施。数据库是存储图书馆系统数据的地方,其安全和稳定性直接关系到整个数字图书馆能否正常运行,是保证数字图书馆数据安全的重中之重!目前比较流行的数据库有甲骨文公司的Oracle和MySQL,IBM公司的db2,SYBASE公司的Sybase数据库,微软公司的SQL Server数据库。各高校目前比较通用的是Oracle和SQL Server两种数据库。那么对于数据库的安全性,我们可以采用以下措施:

首先,依然强调的是选择正版的、稳定性好的数据库产品,这样如果后期数据库 出现重大问题,我们可以直接联系相关的数据库厂家,进行修复和完善。 其次,我们需要定期对数据库的数据进行备份,这是最廉价的安全防范措施。我们可以通过手工备份相关数据文件,也可以采用数据库的复制技术来实现。 最后,我们需要定期查看数据库的监控日志,监控日志中一般都记录了数据库的运行情况,以此来核查我们在

日常操作中无法觉察到的异常情况,并将异常问题提交到数据库产品厂家,以便及时给数据库存在的漏洞打上补丁。

(3)数字图书馆系统安全措施。数字图书馆系统是直接操作后台数据库的,因此它对数字图书馆数据的安全具有直接的影响。对于数字图书馆系统软件安全,首先,我们应该对其进行严格的账户管理,账户密码的复杂度尽量要高,防止有人盗取账户进行恶意操作;其次,应该要求数据库厂家定期检查或修复系统存在的异常和漏洞,以防止网络黑进行恶意攻击;最后,要定期对图书馆管理员进行软件操作及安全性培训,防止因图书馆管理员失误而造成数据丢失和异常情况发生。

数字图书馆的数据安全与否,是整个图书馆系统得以正常运行和对外提供服务的根本,其是未来数字图书馆发展的必须关注的一个关键环节。因此,对于图书馆的全体工作人员,应该要有较高的安全意识和丰富的计算机安全知识。只有这样,才能为广大师生提供一个安全的、稳定的和人性化的数字图书馆服务。也只有这样,才能保证数字图书馆的可持续发展。

参考文献:

[1]《信息安全概论》,段云所,9月,高等教育出版社、

[2]《数据库安全》,陈越,7月,国防工业出版社。

篇2:基于数据挖掘的数字图书馆检索技术研究论文

摘 要:现如今,数字图书馆在国内外引起了广泛的关注,成为图书馆领域的研究热点。本文先对数字图书馆的概念、组成和作用进行概述,然后从数字图书馆的检索技术方面对数据挖掘的概念、主要方式和常用的技术方法进行详细论述,并具体分析了数据挖掘在数字图书馆的检索技术领域中发挥的作用,得出数据挖掘在未来的图书馆发展中具有非常可观的应用前景的结论。

关键词:数据挖掘 数字图书馆 应用前景 检索技术

1 数字图书馆

1.1 概念解析

作为高新技术下的产物,数字图书馆的研究不仅在科学技术领域突飞猛进,而且也为人类的社会事业做出了突出贡献。不同于现实中的图书馆,数字图书馆是虚拟的,它将分散的各种信息资源以数字化的形式存储,以网络化的方式实现互联,以此提供及时的信息,实现资源共享。它是以网络环境为基础的可共享的可扩展的网络知识系统,是一种能方便快捷地为用户提供数字化信息资源的高水平服务机制,也是面向未来互联网发展的信息管理模式。只有深入理解数据挖掘技术,才能不断促进数字图书馆检索技术的发展,从而充分发挥出数字图书馆在图书馆领域的重要作用。

1.2 组成及作用

数字图书馆包括能够服务于广域网的网络设备和通信条件,还有一整套用于信息的管理维护和用户服务的软件系统,这个软件系统可以划分为5个模块:权限管理模块、获取与创建模块、存储与管理模块、访问与查询模块以及动态发布模块。

数字图书馆是在传统图书馆的基础上发展而来,既包含了传统图书馆中的功能,还融合了档案馆、博物馆等中的功能,可以为公众提供综合信息的访问服务,在社会文化、电子政务、大众媒介等公众信息传播中广泛应用。

篇3:基于数据挖掘的数字图书馆检索技术研究论文

数据挖掘在具体的数字图书馆检索中的概念指的是,在没有给出明确假设的前提下对图书信息资源进行挖掘,也可以理解为在大量的图书统计数据中对内在规律和特点进行分析,这里的挖掘对象可能是不同类型,不同物理服务器上的数据库。现在市场上已经出现了很多“数据挖掘系统”,但大多数只能称的上是机器学习系统或是实验系统原型,因为这些系统更多地是进行数据检索,并不能真正地处理大量数据,实现数据挖掘。真正的数据挖掘既涉及多种学科技术的集成,又包涵数据库技术、统计学、高性能计算、数据可视化、信息检索、模式识别等领域。借助数据挖掘,数字图书馆用户可以从数据库中及时准确地检索到自己所需的信息资料。所以,数据挖掘技术处在数据库系统的前沿,在信息技术领域里拥有非常光明的发展前途。

随着数据库系统在图书馆领域的广泛应用,系统中的数据,特别是全球存储的数据快速增长。然而,调查结果显示如此海量的数据无法都被有效利用。如果能在数据海洋中抽取出有效的信息,将会大大提高信息的.利用率,创造更大的实用价值,而这恰恰是产生数据挖掘技术的原因。

总而言之,数据挖掘就是从大量的、模糊的、不全面的、随机的数据中提取出隐含在其中的、潜在的、有用的信息资源,把数据应用从一般的简单查询提升到挖掘数据知识的高度,提高信息的利用率。

篇4:基于数据挖掘的数字图书馆检索技术研究论文

3.1 数据挖掘的主要实现方式

数字图书馆检索技术中的数据挖掘的主要实现方式可以简单地分为两种,即直接数据挖掘和间接数据挖掘。直接数据挖掘是在可用的数据资源的基础上创建一个模型,根据此模型对剩余的数据和数据库中表的属性进行描述。间接数据挖掘是利用所有的变量建立某种关系,而不再是选出具体的变量对其建立模型描述。

3.2 数据挖掘的常用技术

目前,数字图书馆检索技术中的数据挖掘的常用技术可以分为以下几类。

3.2.1 传统统计分析

传统统计分析技术使用了很多分析方法,如相关分析、回归分析等,大多数情况下,这种技术是由系统对数字图书馆用户提出的假设进行验证。

3.2.2 传统主观导向系统

传统主观导向系统技术要有经验模型,在专业领域中的应用较为广泛。它主要是运用从简单的走向分析到以高等数理知识为基础的分析方法。

3.2.3 决策树

决策树相对来说是一种简单的表示方法,这种技术的思路在于根据分类规则将事例层层归类成不同的类别。由于其分类规则易于理解,在数字图书方面较能被用户所接受。

3.2.4 神经元网络技术

神经元网络技术作为计算机领域中的重要方法之一,已经在各个工业部门广泛应用。它是模拟人的脑神经学习的技术,在数字图书馆领域,利用这种技术可以有效解决从模糊数据导出概念和确定走向中出现的复杂问题。

3.2.5 基于事例的推理方法

基于事例的推理方法关键在于系统会根据当前的情形,从已有的相似事例中筛选出一个最佳的解决方案。在数字图书馆中,这种技术可以用于很多问题的求解,特别是那些在一般情况下难以处理的疑难问题,采用此技术往往会得到比较不错的解决效果。

篇5:数字图书馆中大数据存储的应用研究论文

图书馆、阅览室的数据存储系统与其他行业的存储系统有较大不同,主要表现在:①数据量庞大。一座大型图书馆每年的数据增量可达10TB以上;②存储周期长。图书馆数据需要较长的存储时间,甚至可达50年以上;③数据类型多样。现代图书具有影像、图像、文字、声音等数据,均需要存储;④高度的可靠性和安全性要求。作为一所信息化程度较高的图书馆,为了构建一个满足业务需要的高效数据存储系统,可以利用数据压缩、重复数据删除、自动精简配置、自动分层存储等现代数据存储技术,对大数据进行高效的存储和管理。

一、数字图书馆大数据存储容量不足的问题

现代图书馆是一个十分复杂的机构,完备的图书馆除了具有对借阅人员信息、图书还借与出人信息、图书设备信息等硬数据进行管理外,数据量最大最复杂的当属对图书资料本身的软数据管理以及现代电子图书资料的储存与管理,特别是大型图书馆或高校图书馆,门类齐全、借阅量大、内容及设备多样,更使得它所产生的数据结构复杂且数据增量大。

图书馆的数据量随时间线性增长,随着各种类型的数字化图书及设备越来越多,信息化程度的不断加强,对图书及读者管理规范程度的不断提高,以及读者对资源要求的不断加深,致使数据容量加速增长。

当前大型图书馆每年的数据增量大约为20~30TB,如此浩大的数据量,对于一个拥有100TB存储容量的图书馆一也只能满足3一5年的`数据存储需要,因此需要采取有效的应对措施予以解决。

日前,许多高校图书馆的存储设备容量利用率不到50%,大有潜力可挖。在图书馆实际管理工作中,在缺乏技术的情况下,经常采取整理碎片的技术来提高存储空间利用率和数据查询效率,这对于一般性的小容量操作是可行的,但对于大型数据系统其耗费的时间是难以估计的。况且,碎片的整理并不能有效消除分配卷中未使用的空间,达不到精简配置的目的。

二、数字图书馆大数据存储容量不足的应对

措施日前许多图书馆采取的办法是由被购买了电子图书的商家作数据备份,这显然不是最有效的数据存储机制。为了大幅度提高数据存储效率,最有效的办法是采用数据压缩技术和重复数据删除技术。

1、利用压缩技术提高空间利用率

对于书籍等图书资料文件,其文件内和文件间存在大量的相似性关系,Delta压缩技术则可以对文件内和文件间的数据进行比较,删除文件内和文件间的冗余数据,达到数据压缩的日的,相似程度越高,压缩比越小。

2、利用消重技术提高空间利用率

图书馆数据在存储过程中往往有大量的备份数据,数据经过多次备份后,产生较多的数据重复,重复数据删除技术在备份过程中能够较好地消除重复数据,进而节约空间。对于重复数据备份,可以分为时间数据消重和空间数据消重。对于电子书籍等产生的数据一般属于自然数据,其主要特点是,数据的变化率较低、完备的数据备份、数据长期保存、数据内容可以感知等,因此,适合采用时间数据消重。因此,就本校图书馆的数据整理,大约每三个月进行一次。

图书馆数据量庞大,仅仅一所5000人规模学校的中型图书馆,其电子图书数据量就可达到15TB以上。因此,不能简单采用与中小备份类似的解决方案,由于存在大量的图形文件及影像文件等,其海量数据备份是一个非常耗时的过程,在热备份情况下,可能需要花费近一个月时间。最佳实践做法是,采用备份设施来拷贝数据并同时保证应用程序仍然可以让客户端使用。重要数据的备份可以使用有冗余级别配置的主机或硬盘RAID。两个独立硬件控制的RAID阵列的软件镜像可以用来备份其关键数据。这种技术可以保证当某个磁盘或阵列发生故障时整个系统仍然可以使用,任何网络组件的故障,如网卡、视频设备、IDE控制器、电源等可以容易地替换而不影响运行。最经济且非常有效的数据备份方案可以采取冗余技术RAID4,即若干个数据盘带一个冗余盘,在这些盘中的相应块内,存储的相应位的1的个数必须是偶数个。当某一个数据盘发生故障而更换了新盘后,只要按照偶数个1的原则就可以将损坏了的数据恢复到新盘中。

在实际操作中,可以有多种备份方案,通常采用停机备份:正常关闭待操作数据,进行数据的冷备份。备份所有数据文件、控制文件、日志文件和参数文件,把冷备份拷贝到新存储设备上,然后新建一个同名实例,最后再把备份数据文件重新打开即可。

3、提高存储空间的利用率

对于某项应用,传统空间分配方案采用完全供给,以确保该应用拥有足够的增长空间,这势必造成大量的存储空间闲置,在空间浪费的同时也造成了能源损失。采用自动精简配置是一种较新的存储空间管理技术。利用自动精简配置技术,能够帮助用户在不降低性能的情况下,大幅度提高存储空间利用效率,能使用户实现接近100%的存储空间利用率,因为数据需要多少空间系统则按需要进行分配,基本不产生多余的空间。自动精简配置技术的一个明显的优势在于可自动扩展分配卷,无须手动扩展,而且当需求变化时,无需更改存储容量设置;通过虚拟化技术集成存储,减少超量配置,降低总功耗。这也是解决机房耗能问题的很有效的方法。

三、总结

总的来说,对于数字图书馆大数据的存储和管理都十分关键,有效地存储和管理大数据是现代图书馆信息化管理的必要基础,良好的数据管理技术能够为图书馆管理工作的顺利开展提供保障。所以,加强大数据存储工作的管理,是未来数字图书馆发展的重要保证。

参考文献

[1]彭磊.建立SAN(存储局域网)——高校图书馆数据存

篇6:数字图书馆的数据安全与数据备份论文

数字图书馆的数据安全与数据备份论文

]以华北电力大学图书馆为倒,对数字图书馆的各类数据资源进行了分析,从加强磁盘可靠性、组建双机热备系统、加装UPS不间断电源以及加强服务器的日常安全雏护等多方面考虑图书馆数据资源的安全防御问题,并对馆藏数据信息安全资源的数据备份方法做了介绍。

数字图书馆是网络信息技术发展的结果,在数字图书馆中,已经不仅仅局限于原来的图书、期刊等纸质资源,电子期刊、电子图书、视频等电子文献资源日趋增多,编目、采访、流通等图书馆业务管理都实现了电子化、自动化、网络化,因此,图书馆的数据资源急剧增加,图书馆的自动化管理工作也日趋复杂。数据资源是数字图书馆的“心脏”,对图书馆有着至关重要的作用,数据资源的丢失和破坏,将对图书馆造成致命影响,因此,保护数据资源的安全是图书馆自动化管理工作的重中之重。

网络在给图书馆带来便利的同时,也给图书馆数据资源带来了很大的安全隐患,除了要保证机房良好的运行环境外,还应该从数据备份、磁盘可靠性、双机热备、电源保障及服务器的日常安全维护等多方面来考虑数据资源的安全问题。

下面将结合华北电力大学图书馆的实际情况对数据安全策略以及数据备份进行探讨。

1 数据资源分析

华北电力大学图书馆的数据资源主要分为三大类:

1.1 馆藏数据资源

馆藏数据资源主要包括该馆所收藏的图书、期刊等纸质文献的书目数据、书目数据所使用的相应规范、读者信息以及文献的流通信息等,这些数据是图书馆的核心数据,非常重要。馆藏数据资源的数据变化量非常大。一旦丢失或破坏,数据恢复的难度很大,因此,必须做好这些数据的备份工作。

1.2 电子文献资源

电子文献资源主要包括电子期刊、电子图书、

学位论文

相关信息

试论情感语言节目主持人万峰、钟晓的语言特点基于园本课程开发背景下研究教师教育理念的形新生儿高胆红素血症护理相关因素分析及对策试析价值多元化背景下学生价值观的引导试论高等职业院校高等数学课程改革争议试论中职《外科护理学》的情境式教学试析高校教师职业道德建设问题研究经济学和经济法基础课程融通教学小针刀治疗颈椎病疗效观察手术侧卧位适宜度的研究

、各种会

议论文

相关信息

浅议利用网络进行文献检索课教学的实践与探究试论高等职业院校高等数学课程改革争议试论高等职业院校高等数学课程改革刍议会计学视角下应对国际反倾销策略刍议等浅议多渠道培养语文综合实践能力房屋建筑施工中的质量管理刍议浅议把握考试方向科学有序训练小议构建综合性银行的法学研究浅议如何让学困生走进英语世界谈议论文的出彩方法论文

、网络视频数据库以及国内外各种网络数据库资源等。

电子文献资源可以分为以下几类:

1.2.1 通过网络远程访问的电子资源

通过网络远程访问的电子资源都有专门的数据库供应商,数据库安装在供应商的远程数据库服务器上,不需要图书馆本地安装和维护数据。

1.2.2 通过本地镜像方式访问的电子资源

本地镜像方式需要将数据库全部安装到图书馆本地服务器上,数据库一般都比较庞大,但是变化不太频繁,在需要时可以由数据库供应商来进行数据的恢复,不需要做本地备份。

1.2.3 通过分布式镜像方式访问的电子资源

分布式镜像方式是将数据库索引安装到本地服务器上,通过网络来获取原文数据。索引数据一般以月或者年度为单位进行更新,本地服务器上只需要备份索引库。

1.3 图书馆自建数据库资源

图书馆自建数据库资源主要包括学位论文提交服务系统数据库、图书馆无线上网系统数据库以及校外访问图书馆资源的VPN系统数据库等,对应系统都提供了相应的备份和恢复方法,备份及恢复都比较简单。

汇文系统作为图书馆的核心管理系统,需要全天候不间断运行,数据要求安全可靠,而且数据的读写操作频繁,因此所配备的磁盘阵列首先必须有很好的冗余性,其次是读写性能。如表1所示,RAIDl是冗余性最高的方式,可以作为首选,但是RAIDl的磁盘利用率很低仅为50%,可以通过增加磁盘的方式来满足系统对存储空间的需求,多组RAIDl镜像磁盘如果直接使用则需要建立多个磁盘挂载点,不便于数据的管理和维护,因此,本文在RAID1的`基础上又将各镜像磁盘通过RAID0组成了一块大容量磁盘,从而形成了RAID1+0磁盘阵列。

RA/D1+0磁盘阵列虽然牺牲了一半的磁盘空间,但是充分保证了数据的安全,只有在同一组RAID1中的2块镜像磁盘同时损坏的情况下才会导致数据丢失,其安全性较RAID3和RAID5都要高,而且RAIDl+0不存在数据奇偶校 三类数据资源中以馆藏数据资源最复杂、变化最频繁,同时也是最重要的,因此,馆藏数据资源的安全与备份工作是图书馆自动化管理工作的重点。 华北电力大学图书馆的馆藏数据采用由江苏汇文软件有限公司研制开发的汇文文献信息服务系统(以下简称“汇文系统”)进行管理,本文将重点阐述汇文系统的软硬件安全保障方法和数据备份的实现方法。

2 软硬件保障

2.1 RAID技术

RAID(Redundant Array ofIndependent Disk)是一种由多块磁盘构成的冗余磁盘阵列,RAID可以充分发挥出多块磁盘的优势,加快磁盘读取速度,提高容错性能,使数据更加安全、可靠。

RAID有RAID0~RAID7等多个级别,它们的侧重点各不相同,最常用的是RAID0、ILMDI、RAID3和RAID5,如图1所示。

验因而数据读写(尤其是写)及数据恢复的速度都比RAIm和RAID5有了很大提高,充分满足了系统对数据安全性及数据读写性能的要求。

2.2 双机热备技术

RAID技术仅能从磁盘安全的角度保证数据的安全问题,而当服务器硬件或操作系统出现问题时,要保证汇文系统服务不被中断,则需要引入双机热备技术。汇文系统采用2台HP服务器组成双机热备系统,在系统运行正常时,1台服务器作为主机,另外1台服务器作为备机,2台服务器通过“心跳线”连结,当主服务器出现故障时,EMC AutoStart管理软件通过“心跳”信号监测到主机系统发生故障,并自动将服务转移到备用服务器,从而保证汇文系统不间断运行。

2.3 UPS不间断电源供电

机房的突然断电会导致服务器异常停止工作,不但会导致数据的丢失或损坏,而且会造成服务器和存储等硬件设备损坏,给图书馆带来数据资源的缺失和巨大的经济损失。

为此,该馆在机房内安装了2台山特20kVA的UPS不间断电源,在发生突然断电的情况下能继续供电2小时,如果断电时间比较长或者不可预知,可以选择关闭部分或者全部服务器及硬件设备,在恢复正常供电时再重新开启服务器及硬件设备,以保证数据及硬件设备的安全。

此外,为了保证uPS的安全可靠,还可以配备双机冗余UPS电源,条件允许的情况下还可以安装uPS监控软件,用来监视IIPS的运行状态,及时了解电池状况,以便采取预防措施,还可以设置在断电情况下安全关闭用户系统,以确保数据的安全。

2.4 服务器的日常安全维护

图书馆自动化工作人员需要在服务器上安装网络版杀毒软件、防火墙,定期检查服务器运行状况,及时修复系统漏洞和进行杀毒软件升级,通过查杀病毒、查看系统日志提早发现问题,做到防患于未然。

3 汇文系统数据备份

3.1 数据库备份方法

华北电力大学图书馆汇文系统采用的是Oracle数据库,Oracle数据库的备份方法主要有3种:

(1)冷备份,冷备份的备份比较快,容易归档,容易恢复,但是该方法需要在关闭数据库的情况下才能进行,而图书馆的oracle数据库是7*24小时运行的,这不符合图书馆的实际情况。

(2)热备份即物理备份,可以在表空间或数据文件级备份,备份的时间短,并且备份不影响数据库使用,恢复速度快,但是该方法需要将数据库设置为归档模式,而且需要一个表空间一个表空间地备份,比较复杂,维护比较困难,不能出错,出错后后果严重。

(3)逻辑备份即导出/导入备份,该方法不需要数据库运行在归挡模式下,备份时数据库可正常运行,备份简单,备份及恢复的时间短。逻辑备份根据备份内容可以分为3种模式:

①用户备份:备份某个用户的所有对象以及对象中的数据,业务数据库通常采用这种模式;

②表备份:备份某个用户指定的对象(表);

③完全备份:对数据库所有对象进行备份,主要用于数据库的移植以及系统的备份。

该馆的oracle数据库采用逻辑备份的用户备份方式,手动操作的具体实现方法是:在“命令提示符”窗口输入exp,根据oracle提示进行导出备份,如图2所示。

3.2 汇文系统数据自动备份

汇文系统的数据库是7*24小时运行,因此,为避免进行备份操作时数据变化频繁,备份操作选择在数据操作比较少的深夜时进行,以期达到较好的备份效果,实现方法是将导出备份的命令做成批处理文件,并添加到系统的任务计划,让其在预定时间自动执行。

批处理文件内容如下:

exp userid=system/******@llbsy~file=f:ak\%date:~11,3%,dmplog=f:ak\%date:~11,3%.log owner=libsys bufferffil024000

该命令指定了备份文件名、日志文件名和存放路径,其中%date:~11,3%取的是系统时间中的星期信息,目的是存放最新一周的备份信息,每周自动覆盖。为了保证数据的安全,需要每周将备份文件和备份日志用移动硬盘拷出,做馆外保存,以防服务器故障及火灾和其他自然灾害发生时造成数据丢失。

4 结语

为了保证数字图书馆的数据资源的安全,应当全方位、多层次的考虑数据的安全保护方案,切实做好数据资源的备份工作,还应加强自动化管理人员的业务培训,加强安全意识管理,从而保证图书馆业务的正常运转,更好地为读者服务。

篇7:数字图书馆著作权论文

数字图书馆著作权论文

1国会馆数字图书馆建设与服务中的著作权解决方法

1.1数字资源建设中的著作权解决方式

1.1.1“近代数字图书馆”项目

起,国会馆开始实施“近代数字图书馆”(DigitalLi—braryfromtheMeijiEra)项目,即将馆藏的明治、大正时期的图书、期刊等资料数字化,同时清理著作权,将进入公有领域或解决完著作权的资料发布到互联网上,为读者提供浏览、复印等服务。日本《著作权法》第四节规定,著作权保护期为著者在世及逝世后50年,团体作品的著作权保护期为发表后50年。自20起,国会馆开始解决馆藏的明治、大正时期图书期刊等资料的著作权。流程为:首先公开对象资料,然后调查这些作品是否在著作权保护期内,如尚在著作权保护期内则调查有无著作权人,查找相关权利人的联系方式,争取取得授权。在至间,国会馆通过这种方式确定了16298名权利人的作品进入公有领域,找到480名权利人的联系方式,取得315份授权许可。年至之间,国会馆通过这种方式大约解决了34万册图书的著作权。在“近代数字图书馆”项目中,有相当一部分资料为孤儿作品,不能确定是否有权利人或查找不到著作权人的联系方式。根据《著作权法》第六十七条第一项的规定,对于经过相当的努力仍然不能取得著作权人联系方式的作品,可以申请文化长官裁定,交付一定的补偿金后对作品进行使用。在“近代数字图书馆”项目中,国会馆通过向文化长官申请裁定的方式,即向每个作品提供51日元的补偿金,获得5年的使用权的方式,解决了72583个作品,38794个权利人的作品的著作权。

1.1.2网络信息资源采集保存项目

WARP国会馆自2002年开始实施“网络信息资源选择性存档实验项目”(WebArchivingProject,简称WARP),即选定一些网站,定期对其网页进行采集和保存。为大规模采集和保存网络信息提供了法律保障,国会馆积极推动相关立法。2002年3月,国会馆向议会提出将“网络出版物”等列入缴送范围的议案,1月,《国立国会图书馆法》和《著作权法》正式进行了修订。修订后的《著作权法》第四十二条第三款规定,国会馆采集网络信息资源时无需取得著作权人许可。《国立国会图书馆法》第二十五条第三款第一项规定了国会馆有权采集的对象机构的范围;第二项规定了如果国会馆在采集时遇到障碍,对象机构有义务协助消除障碍;第三项规定,必要时国会馆有权要求上述机构向其发送指定内容的网络信息资料。《国立国会图书馆法》和《著作权法》的修订为WARP项目解决著作权提供了法律保障,在法律修订后的两个月内,WARP采集的机构对象数量由480个增加到2400个,增长了5倍。

1.1.3“历史的音源”项目

国会馆自开始提供“历史的音源”服务,即在国会馆的专门网页上公开“唱片数据库推进协议会”(HIRAC)缴送的数字化唱片。除国会馆外的公共图书馆或其他类型的图书馆只要提供资源,都可以免费参加这个项目。在这个项目中,国会馆将小部分著作权及邻接权保护期满的唱片内容发布在互联网上,其余大部分尚在著作权与邻接权保护期内的,则仅在国会馆或参加馆馆区内提供服务。采用这种根据著作权情况区别提供服务的方式,截止到209月,国会馆公布了19初到1950年之间的唱片约5万种,包括日本传统音乐、流行乐、落语(类似于单口相声)、漫才(类似于对口相声)、演讲等。

1.2读者服务中的著作权问题

为了保证在法律许可范围内提供数字图书馆服务,国会馆主要采用了两种方法:一是根据资源的权利状态分区域提供服务,如:在WARP项目的网页上,国会馆在为读者提供采集的网络信息资料阅览服务时,根据《国立国会图书馆法》第二十一条、《著作权法》陈瑜日本国立国会图书馆数字图书馆著作权解决及其启示7第三十八条,在取得权利人许可的情况下,才将资料发布在互联网上公开,其余的仅在国会馆东京总馆、关西馆、国际儿童馆馆区局域网内为读者提供阅览服务。二是在每个网页适当的地方发布声明,以提醒读者在使用数字资源时遵守相关法律。如在“近代数字图书馆”项目的网站上,国会馆发布了声明:“收录资料的著作权归著作权人所有”、“如果有想将著作权保护期未满的作品私用的情况,需要取得该作品的权利人的许可”。在“历史的音源”中,国会馆在网站上明示:“收录的音乐作品的著作权(邻接权)归著作权人(著作权邻接者)所有”。“著作权(邻接权)保护期满的作品,在互联网上公开。其余的只能在国会馆馆内欣赏。

2国会馆著作权解决的特点

可见,国会馆在数字图书馆建设过程中解决著作权的主要方式有:

①推动相关立法,扩大国会馆合法使用的范围;

②甄别是否进入公有领域,充分利用公有领域作品;

③取得相关权利人授权,根据授权协议使用;

④申请文化长官裁定,对孤儿作品进行利用。在提供服务的.过程中,国会馆则根据资源的著作权情况区别服务范围,且警示读者在权利范围内进行使用,以保证读者的使用行为在法律许可的框架内。

2.1积极推动相关立法

国会馆在解决数字资源著作权时,积极推动相关立法。修改法律或者立法能够从源头上解决著作权问题,有力的推动相关工作的进展。著作权相关的法律能够及时立法或修订,得益于日本法律体系相对比较完善,也与国会馆本身就是属于国会的政府机构有关。

2.2侧重解决自建资源的著作权

国会馆数字资源有自建资源的较多、商购资源相对较少的特点。由于商购的数据库使用范围有较为严格的限定,提供服务仅限于国会馆馆区内,或馆区的某些阅览室,所以国会馆更侧重发展自建资源及解决其著作权,以较少的资金和人力成本获取范围更大、时间更长的权利。

2.3重视公有领域作品的著作权

国会馆在解决著作权的时候,集中安排人力物力,有计划分步骤地清理进入公有领域的近代作品,并在之后形成固定的制度,让进入公有领域的作品能及时上线供读者使用。建立公有领域作品甄别制度,能够以较少的投入获得较大范围的权利,充分利用公有领域作品为读者服务。

3对我国相关工作的启示

我国从20起大力推进数字图书馆建设工作,而著作权问题是数字图书馆建设与服务过程的瓶颈,只有解决好数字资源的著作权问题,才能更进一步推动数字图书馆事业的发展。从以上对国会馆著作权解决方式的分析中,可以得出对我国相关工作的以下启示:

3.1积极推动立法

建国以后,我国图书馆行业相关的立法虽然取得了一些成就,但还明显滞后,涉及到数字图书馆著作权的内容很少。《文化部“十二五”时期公共文化服务体系建设实施纲要》中提到:要加强公共文化服务领域政策法律法规建设,继续推进《公共图书馆法》立法工作;我国图书馆界也在积极推进《国家图书馆条例》的制定。我国图书馆界可以积极呼吁,在将来会颁布的这些法律法规中,增加一些数字图书馆在建设与服务中的著作权的相关条款,如逐步建立数字资源呈缴制度,允许图书馆在馆内提供尚在著作权保护期内作品的阅览服务等,以从源头上解决数字图书馆建设与服务的著作权问题。

3.2推动自建资源著作权解决力度

国家图书馆在数字图书馆建设过程中,建立了很多馆藏特色资源。如数字方志、善本、讲座、文津图书奖图书等。可以通过甄别这些资源是否进入公有领域,或取得权利人授权等方式,进一步加快解决自建资源著作权的问题。相比购买资源著作权的方式,直接解决自建资源的著作权能够省略一些中间环节,节省成本,提高效率,以更加直接的方式取得数字资源的著作权。

3.3加快公有领域民国资料的甄别进程

据统计,国家图书馆藏有民国图书、期刊和报纸总计约67万册(件),其中民国图书45万册(件)、期刊20万册(件)、报纸合订本2万余册。国家图书馆自开始启动“公有领域图书筛查”项目,即搜集并制作民国以来已进入公有领域的中文图书目录,目前已征集到6万多种书目数据。今后可进一步推动该项工作,并使之常规化,以及时甄别进入公有领域的民国图书,充分利用已经进入公有领域的图书为读者提供服务。

篇8:数字图书馆元数据方案设计问题探讨

【内容提要】在阐述数字图书馆元数据方案设计原则的基础上,对数字图书馆元数据方案的设计有关问题进行较为深入的思考,并且提出若干建议。

【摘  要  题】专题探讨

【英文摘要】This  article  begins  with  the  illustration  of&n

篇9:数字图书馆元数据方案设计问题探讨

元数据方案就是数字图书馆中所使用的信息描述方法。数字图书馆的运作,无论是存取过程还是检索过程,都是以元数据方案为基础实现的。换言之,元数据方案为数字图书馆分布式信息资源的发现和检索奠定了基础。因此,元数据方案决定了数字图书馆的功能特征、运行模式和系统运行的总体性能。为了实现这一总体性能,达到共建共享信息资源的目的,数字图书馆元数据方案应遵循下列原则。

1.1 元数据方案的标准化原则

在数字图书馆建设中,标准问题最重要的是元数据的制作,而与元数据的制作紧密相关的问题是元数据方案的设计。

然而,目前在元数据方案的标准化方面存在很多问题。首先,就DC系列元数据而言,在同一元素的著录内容上存在较大的差异。如,北京大学拓片元数据要求在权限(Rights)元素中著录馆藏地址、允许使用的用户范围,而在《数字式中文全文文献通用格式》规定著录有关权限管理的声明,包括知识产权等。其次,对于同类型信息资源的组织,有的图书馆已经采用DC元数据,有的则仍然采用MARC元数据。这种著录内容和同类信息资源所用元数据的不一致都会给数据交换的带来困难。最后,各个元数据所采用的编码语言也是各不相同,有的采用HTML,有的采用SGML或XML。由于各个编码语言的标签设置、内容、可扩展性的不同,则会影响元数据的通用性。

元数据方案的标准化原则具有广泛的内涵。它包括元素著录内容的标准化、同类型数字化信息资源的著录所采用元数据的一致性、元数据方案所采用编码语言的统一性这几个方面。

1.2 元数据方案的准确性原则

所谓准确性原则一方面指元数据方案中元素的定义、使用的术语等不能模棱两可,容易产生歧义,导致不同的理解;另一方面指元数据方案能够准确地描述信息资源。也就是说,元数据方案不仅要规定元素的设置、著录规则、标记语言的使用,而且要规定著录所依据的标准、传输交换语言等。

当前困扰各个搜索引擎的问题是如何提高其查准率。搜索引擎的低查准率究其原因是其对信息资源特征的揭示不够准确、深入。数字图书馆的信息资源类型多样,既有文字信息,也有音频、视频信息,只有准确地揭示它们的特征,提供高质量的元数据,才能保证较高的查准率。

1.3 元数据方案的通用性与专用性原则

元数据方案的通用性与专用性都是相对而言的。所谓通用性是指元数据方案可用于数字图书馆多种信息资源的元数据制作。所谓专用性是指元数据方案只适用于数字图书馆某一特定类型信息资源的元数据制作。具有通用性的元数据适用于组织多种类型的信息资源。通用性元数据有两种:一种通用性元数据的结构非常庞大、复杂,但是具有很好的描述深度,因为所有的情况都已经定义了,比如MARC元数据。另一种通用性元数据,其结构非常简单,好学易用,仅仅只有几个非常普遍的属性,但对特定类型的信息资源的描述能力不够。而具有很好专用性的元数据,其对于某一特定类型的信息资源描述能力很强,但无法覆盖其它类型的信息资源。数字图书馆信息资源类型多样,过分强调专用性会导致多种元数据各自为政。因此,在设计元数据方案时,设计人员需要在通用性和专用性之间加以协调、平衡,才能产生更好的效果。

1.4 元素设置的可扩展性原则

所谓元素设置的可扩展性原则是指在元数据方案设计时,为元素、元素的限定词以及属性值的扩充留有一定的余地。数字图书馆要处理的数字化信息资源非常广泛,而且各类数字化信息资源的应用背景更为复杂。如果元数据方案只提供最广泛意义上的描述,一些针对特定应用背景的内容并不纳入,那么,应允许使用者在不破坏已规定的标准内容(如元素的语义定义)的条件下,扩充一些元素或属性值。此外,元数据是一个发展活跃的领域,新的元数据元素会不断出现,老的元数据元素会不断修改完善。数字图书馆的生存环境是一个不断变化的环境,新的.信息源也会层出不穷。这就要求元数据方案允许将新的元数据元素容纳于其中,或者要求修改更新已经注册的元数据方案。

1.5 元数据方案的互操作性原则

所谓元数据方案的互操作性,是指在由不同的组织制定与管理且技术规范不尽相同的元数据环境下,要向用户提供一个统一的数据检索界面,确保系统对用户的一致性服务。在具体应用上,互操作性表现为易转换性,即在所携信息损失最小的前提下,可方便地转换为其它系统常用的元数据。

篇10:数字图书馆元数据方案设计问题探讨

3.1 推进元数据标准化进程,提高元数据的互操作能力

目前,国内出现了许多种元数据,例如,拓片元数据、建筑元数据、古籍元数据、中文数字化全文文献元数据等,由于每种元数据都是由不同图书馆研制而成的,并且针对不同类型的数字化信息资源。因此,就会出现DC系列元数据与MARC元数据并存的局面。这种局面有利于DC系列元数据与MARC元数据形成优势互补,也可以使某些适合用DC系列元数据描述的特定类型信息资源被充分地揭示和利用。同时,这种局面也会带来一些问题。目前,我国DC系列元数据至少有4种以上,那么对DC系列元数据是否一体化;那些特定类型信息资源以前的机读记录该如何处理等。

笔者主张DC系列元数据一体化,反对各自为政。DC系列元数据都是在DC元数据的基础上根据用户的需求与信息资源特点进行了修正,所以这些元数据的核心或实质仍然是DC元数据。这一点可以作为DC系列元数据一体化的基础,但是,这种一体化工作完成就需要各个研制单位之间的协调与合作,需要以国家标准的形式出现加以强制执行,从而结束元数据结构各自为政的局面。对于那些原由MARC元数据著录的信息资源来说,MARC记录已为受编信息资源提供了著录内容详尽,查全率高的机读格式,在受编信息资源数字化的过程中没有必要舍弃原有的元数据,而采用其它元数据方案。

3.2 选择适用的编码语言

在数字图书馆元数据方案设计中,编码语言的选择也是关键步骤之一。目前,在DC系列元数据中通常使用HTML、SGML或XML。有比较才有鉴别和选择,我们不妨对这三种编码语言的优劣进行分析比较。

XML是SGML语言的一个子集,同HTML一起成为SGML家族的主要成员。SGML是一种元语言,可以用来定义其它更专门的标记语言。HTML是由SGML定义出来的,专门使用在WWW上的标记语言。SGML是很好的资料存储格式,适用于任何复杂的文件,但不便于网络传输,SGML非常复杂,不易学习掌握。XML与HTML不同,XML是SGML的一个简化版本,实际上,XML也是一种元语言。与HTML不同的是,XML并没有语义上的元素定义,也没有预先定义好的一套标记系统。在实际应用中,可以根据需要定义自己的标记。

XML是可扩展的,具有较强的灵活性和适用能力,同时它很有可能在今后成为应用最为广泛的标记语言。但是,目前,XML在网络上的应用不如HTML广泛。由于HTML文档本身的结构性不强,扩展能力差,描述内容的能力也较弱,因此不太可能成为今后数字图书馆元数据方案的主要编码语言。笔者建议,数字图书馆元数据方案的编码语言采用XML。

3.3 数字图书馆元数据方案的设计应面向专业编目人员

信息资源编目实际上是信息资源进行分析、判断和组织的过程。组织过程包括分类、描述、归并及格式化等过程;分析过程则包括区分、验证、评估、比较、解释及综合过程。[2]总之,信息资源编目是一个复杂的、信息增值的过程。目前,困扰信息资源编目的主要问题是费用。一是时间的花费,二是金钱的花费。费用问题使得许多元数据方案的设计者希望所研制的元数据可以由非专业人员制作。毫无疑问,非专业人员制作元数据的费用低,然而这种低费用是以牺牲元数据的质量为代价的。笔者认为,对于数字图书馆的建设而言,元数据的总体质量是不容忽视的。如果没有高质量的元数据,数字化信息资源的利用也就成为一句空话,甚至会像搜索引擎一样,查准率很低。所以,建议数字图书馆元数据方案的设计应面向专业编目人员。只有专业编目人员利用编目规则及书目控制等手段,才能够提供具有较高质量的元数据。

3.4 数字图书馆元数据方案的设计中应考虑到其它技术运用

在数字图书馆建设的过程中,必然要涉及到许多技术,其中包括数据库技术、全文检索技术、开放式网络词表/分类技术、地理信息系统(GIS)等。在数字图书馆元数据方案的设计中,我们需要与这些技术进行衔接并加以应用。以联合在线资源目录(Cooperative  Online  Resource  Catalog,简称CORC)为例加以说明。CORC是建立在网络环境下的为本地或网络电子资源创建书目元数据的系统,是一种为电子资源编目的数据库和工具包。CORC利用了网上杜威分类法数据库,实现了编目过程中DDC号码和主题标目自动分配。同时,CORC数据库的软件平台采用Mantis,这是一种适用于任何元数据定义与界面的网络资源编目系统工具箱。Mantis用XML存储记录,使得记录的输出非常容易,且有MARC、DC  HTML和DC  RDF、XML多种格式可供选择。CORC的成功在于其能够充分利用各种技术。因此,我国在数字图书馆元数据方案的设计过程中,也需要考虑其它技术的运用。

【参考文献】

[1]CC:DA  Task  Force  on  metadata  and  Cataloging  Rules:Final  Report,August  21,[EB/OL].[―03―05].  http://www.ala.org/alcts/organization/ccs/ccda.

[2]真溱.矛盾重重的元数据世界[J].中国图书馆学报,2001,(6):56―59

篇11:数字图书馆元数据方案设计问题探讨

2.1 非MARC元数据与数字图书馆信息资源组织的质量问题

在此,根据我国当前引进、研制元数据的状况,将现存的元数据分为两类,即MARC元数据和非MARC元数据。MARC元数据包括USMARC、UNIMARC、CNMARC等。非MARC元数据包括DC系列元数据和非DC系列元数据。DC系列元数据是指我国在数字图书馆建设的过程中,对DC元数据加以引进并改造而生成的针对特殊类型信息资源的元数据,也就是说这些新出现的元数据是在DC元数据的基础上进行了扩充、改进。例如,DC元数据、北京大学拓片元数据、《数字式中文全文文献通用格式》以及清华大学的建筑元数据。非DC系列元数据包括TEI头标、EAD、GILS等。目前将非DC系列元数据用于数字图书馆信息资源组织的呼声很高。美国图书馆协会(the  American  Library  Association,简称ALA)编目:著录与检索委员会(Committee  on  Cataloging:  Description  and  Access,简称CC:DA)在《元数据与编目规则研究报告》(CC:DA  Task  Force  on  metadata  and  Cataloging  Rules:Final  Report)中以TEI头标、EAD等元数据为例,就非DC系列元数据作为编目源的情况做出评估,得出三点重要结论。第一,非MARC元数据在专门针对其用途而设计的系统中效率最高,但在图书馆目录系统中的效率就不是最高的。第二

,不符合AACR的普通元数据进入图书馆目录的时候,总是需要图书馆编目人员对其进行严格审查。第三,绝大多数非MARC元数据方案没有提供足够的信息以区别相似的信息资源或者内容基本相同而不同版本信息资源。[1]也就是说,只有充分地利用各种编目规则和其它一些质量保证手段,非MARC元数据才能具有较高的质量,才能用于图书馆信息资源组织。

众所周知,非MARC元数据大多数是一些资源描述机构针对自己的需要而开发的。在这些元数据方案中,元数据的制作可以由专业的编目人员完成,也可以由根本没有任何经验信息资源的提供者自己完成。非专业人员制作的元数据具有费用低、元数据的专指性较好的优点。但是,这样做会导致对数字化信息资源的属性和特征的揭示程度差别很大,进而影响元数据的总体质量。到目前为止,绝大多数元数据仍然由专业人员提供。例如,TEI头标是一种复杂的元数据,绝大多数TEI文本都是由人文科学领域非图书馆专业人员创建,而TEI头标通常是由图书馆员创建或维护。如果让非专业人员参与元数据的制作,那么数字图书馆元数据方案设计就应解决元数据制作质量的检测与管理问题。

2.2 DC系列元数据与MARC元数据的关系

目前,有些数字图书馆纷纷采用DC元数据作为描述数字化信息资源的格式。例如,清华大学图书馆的建筑数字图书馆项目以DC元数据作为基本框架,结合建筑资料的实际情况对DC元数据进行改造,扩充为THDL――清华大学建筑数字图书馆元数据格式。北京大学依据DC元数据开发了拓片元数据格式。上海图书馆也使用了DC元数据。自从DC元数据产生以来,图书馆界争论不休的问题是,图书馆是继续使用MARC元数据,还是舍弃MARC元数据,改用DC元数据?具体到我国,在任何一个数字图书馆元数据方案的设计过程中,必然要涉及到MARC元数据与DC系列元数据关系的处理。

DC元数据最初的定位是处于全文索引和复杂格式的元数据之间,提供简单明了的元数据格式。DC元数据与MARC元数据的最主要的区别在于DC元数据结构简单,而MARC元数据复杂。DC元数据经过数次研讨会后,对其进行扩展,使用修饰限定词使得DC元数据不可避免地复杂起来。其扩展的原因有两个。一是应用领域比较复杂,DC元数据没有足够的元素来描述信息资源的各种重要特征;二是人们希望DC元数据应用于多个领域。实际上,无论如何扩展,DC元数据不可能解决所有数字化信息资源的描述问题。笔者建议:由国家标准化权威机构――全国信息与文献标准化技术委员会来制定适应于各类数字化信息资源的元数据方案。这样做,可以在全国范围内,就某一类数字化信息资源采用何种元数据著录达成共识。目前,在MARC元数据与DC系列元数据并存的情况下,信息资源的存储与检索必然涉及MARC元数据与DC系列元数据两者之间的转换,是将全部MARC元数据转换为DC元数据,还是将DC元数据转换为MARC元数据?笔者认为,MARC元数据与DC元数据之间转换的目的是实现一条记录可以以MARC元数据和DC元数据两种格式来显示以及数据的交换与共享。但是,如果用户没有这种需求或者两者之间不转换并不影响数据交换,则没有必要进行转换。也就是说,根据实际需要来决定是否需要MARC元数据与DC元数据之间相互转换。MARC元数据与DC元数据之间的转换会产生很多问题。由于MARC元数据的描述能力大大丰富于DC元数据,如何尽量解决两者之间转换所产生的歧义与不确定性以及信息丢失等难题。

2.3 元数据的编码语言问题

元数据的编码语言是指针对元数据元素和结构进行定义和描述的具体语法和语义规则。目前,各种元数据使用的编码语言是不同的,包括标准通用标记语言(Standard  General  Markup  Language,简称SGML)、超文本标记语言(Hypertext  Markup  Language,简称HTML)、可扩展标记语言(Extensible  Markup  Language,简称XML)三种形式。有些元数据明确规定使用何种标记语言,如TEI头标、EAD和美国联邦地理数据委员会《数字地理空间元数据内容标准》使用SGML。也有些元数据没有规定使用何种编码语言,如DC元数据,有使用HTML,也有使用XML的。从数据交换和共享的需要出发,元数据的作用是传递计算机系统可以理解的描述信息和存储数据。计算机首先要理解元数据的各个元素或字段序列化的方式,即按怎样的顺序和结构来组织各个元素及其内容。所使用的编码语言不同,元数据编码规则以及记录格式也存在差异。这样则不利于数据的交换和信息资源的共享。因此,从长远利益来看,有必要对元数据的编码语言进行统一。

篇12:数字图书馆中XML数据安全的研究论文

数字图书馆中XML数据安全的研究论文

随着数字图书馆全方面网络信息服务的提供,数字图书馆中数据的存储和访问安全变得越来越重要。数字图书馆中的元数据可以通过XML语言描述,XML作为数据交换的规范已经在数字图书馆中进行了应用。通过对XML数据安全进行分析,使用XML加密和数字签名技术可以确保数字图书馆在互联网应用环境下的数据信息安全。

随着网络技术的不断发展和应用,各种数据信息的存储、表达和检索等要求越来越高。伴随着数据信息深层次处理要求的不断提高,可扩展标记语言(Extensible Markup Language,XML)应运而生。XML是一种基于SGML标准简单灵活的语言,并得到了W3C(World Wide Web,联合组织)的认可。XML解决了HTML的诸多问题,被认为是第二代因特网信息组织的格式标准。目前,XML技术已经被业界广泛的接受,并成为网络应用中事实上的数据表达和数据交换的标准,在Web服务、数字图书馆、以及电子商务中得到了应用。

1 XML技术与数字图书馆

1.1 XML技术对数字图书馆的影响XML技术对数字图书馆的影响,有以下3个方面:(1)XML是一种对信息资源的结构化描述,其功能用来规定数字化信息组织的数据结构标准,因而可以描述各种类型的信息资源。XML与元数据的发展不可分割,利用XML可以生成各种用于不同目的元数据。XML允许用户自定义标记集,实现个性化文献定制,这些标记集能用超越标准HTML的元素类型表达特殊信息。从数字图书馆的角度来看,元数据是数字图书馆信息描述的方法,为数字化信息的发现、存储、组织、共享和检索奠定了基础。利用XML可以生成各种用于不同目的的元数据,如:导航图、内容评价、流路径、定义和著者等,由此可见,用XML语法写成的元数据将为数字图书馆建设做出很大贡献。(2)XML有利于不同系统之间信息交换,能够方便的将图书馆数字化建设中用到的各种数据库系统之间的数据进行自动转换。XML不仅支持字符集Unicode,而且支持开放性文本,因此,数据自我描述和获取不同结构数据的操作非常方便。XML数据方便信息的获取和利用,便于各种数字资源的整合。(3)XML使Web信息发布方式发生了变化。XML的良构性和可扩展性使得对Web结构化信息管理成为可能,使得图书馆参与网络信息资源组织和整理的环境更为有利。XML对图书馆馆藏信息资源的描述和发布产生的影响将改变图书馆基于MARC格式的书目数据形式。MARC格式提供了对不同文献对象进行著录的统一标准,但该标准却阻碍了图书馆书目数据资源融入网络信息资源,参与网络信息流通,通过XML技术可以有效的解决这一问题。

1.2 数字图书馆的数据安全随着数字图书馆建设的步伐加快,图书馆开展了全方位的网络信息服务。由于以Internet为基础设施的网络系统本身存在的安全隐患,加之图书馆网络系统的开放性、复杂性和用户的多样性,使得图书馆网络系统极易受到骇客的攻击、病毒的侵袭和合法用户的误操作等。数字图书馆系统的数据主要是元数据、对象数据和用户数据等。这些数据所面临的威胁主要有:数据泄露或丢失,非法窃取,修改或重发,非授权用户访问等。数据的安全主要表现在:如何确保数据的机密性、完整性、可用性、可控性和可审查性等特征。确保数据安全的方法:依靠操作系统的访问控制功能实现,采用用户身份认证来实现,通过数据加密技术来实现等。目前,在数字图书馆中元数据大都可以通过XML语言来描述,而且在数字图书馆资源使用过程中多数都以XML文档作为数据对象在服务器和浏览器之间传输,XML是Internet交换数据事实标准。因此,只有解决了XML数据的安全问题,XML才能得到更广泛的应用,数字图书馆的数据安全才能有所保证。

2 XML数据安全标准

2.1 XML数据加密W3C的加密方案规定了把XML数据明文加密产生密文以及对密文解密恢复XML数据明文的过程。XML加密包括加密语法和处理规则两部分,前者描述加密数据的表示形式,后者描述加密的处理过程。XML数据加密根据加密粒度可分为:加密XML文档,加密XML元素,加密XML元素内容。XML数据加密的过程:将XML文档转换成为一个DOM(Document Object Model,文档对象模型)对象,标记要加密的内容并记录其位置,加密相关内容,将加密内容封装成标准的XML文挡。XML加密数据的一般格式如下:EncryptedData是密封加密数据和解密所需相关信息的最外层元素,它包含了4个关键子元素:(1)EncryptionMethod:使用XML加密规范中定义的算法标识符描述采用的加密算法。(2)ds:KeyInfo:提供用于加密和解密数据的对称密钥。(3)CipherData:包含或引用实际的加密数据。(4)EncryptionProperties:提供了应用程序专用的附加信息。  2.2 XML签名规范当对XML数据进行交换和访问时,可能会出现数据的伪装、篡改和抵赖等,数字签名是确保数据安全的一种常用方法。XML签名规范是W3C为了对敏感的数据通过会话密钥或公、私密钥进行加密而定义的数字签名进程和XML文档结构的规则。XML签名提供了灵活的数字签名机制,不仅支持对网络资源和消息整体的签名,也支持对XML文档或消息的部分进行签名,既支持公钥数字签名,也支持对称密钥的密钥散列验证。XML数字签名标准包括如何用XML和XML签名命名空间来描述一个数字签名。传统的数字签名技术其签名对象是要签署的文档整体,不支持对文档的部分签名。而XML数字签名标准充分利用XML数据的强大表达能力和扩展能力,增强了XML数字签名的灵活性和扩展性。XML签名不仅可以对整个文档进行签名,而且还可以实现对文档的特定部分进行签名,并支持多重XML数字签名。下面给出的是应用XML签名的示例:

Signature标识了整个XML数字签名,它包含了4个关键子元素:(1)SignedInfo:是签字信息元素,整个XML签名中最重要的核心元素,XML数字签名对整个签字信息元素签字,它包含与签字相关的`所有信息。(2)SignatureValue:容纳Base64编码的签字值。(3)KeyInfo:包括用来验证XML签名的具体信息。(4)Object:包含XML签名所需要的附加属性。在XML签名中,签字元素(Signature)和数据对象的相对位置有3种:(1)封装签字:数据对象放在客体元素中,签字元素就是数据对象的祖先元素。(2)被封装签字:签字元素作为数据对象的子孙元素。(3)分离签字:签字元素与数据对象相分离。

2.3 XML密钥管理规范W3C在制定了XML密钥管理规范(XML Key Management Specification,XKMS)。XML数据加密和数字签名技术以公共密钥基础设施(Public Key Infrastructure,PKI)为基础来实现加密、解密、签名和验证等操作。XKMS为访问和集成PKI提出了解决方案。XKMS由VeriSign、微软和webMethods共同制定,其主要功能包括:公钥的登记、发布、撤销、验证、管理和查询。XKMS以Web服务的形式实现,允许客户端应用程序访问PKI功能,从而减少客户端应用程序的复杂性。XKMS由XML密钥信息服务规范(XML Key Information Service Specification,X-KISS)和XML密钥登记服务规范(XML Key Registration Service Specification,X-KRSS)两部分组成。X-KISS定义了一种可用于验证互联网上公钥合法性的服务实现规范。使用X-KISS,应用XML数据的用户可通过互联网委托可信的第三方处理有关签名认证、数据加密等服务,包括提供其它客户的加密公钥,验证公钥合法性等。X-KRSS定义了一种可通过互联网接受公钥登记、撤销、恢复的服务规范。若一个XML应用建立了一个密钥对,则可通过X-KRSS协议将公钥部分及其它有关本人身份的信息发给可信第三方登记。XML数据加密和解密的原理如下:(1)接收方生成两个非对称密钥,一个是公钥,一个是私钥。(2)发送方获取接收方的公钥,生成一个对称密钥,用对称密钥加密XML数据。(3)发送方使用接收方的公钥加密生成的对称密钥,然后将加密的XML数据、加密的对称密钥结合在一起,生成一个XML文档发送给接收方。(4)接收方使用非对称密码算法和自己保管的私钥来解密对称密钥,然后用解密的对称密钥来解密XML数据。XML加密和XML数字签名是两个既独立又紧密相关的技术。XML加密确保数据的机密性,XML数字签名确保数据的完整性和不可否认性。

3 结束语在数字图书馆中应该确保数据存储、访问和交换的安全,XML数据作为数据交换的规范已经在数字图书馆中有了广泛的应用,W3C制定的XML数据加密和数据签名技术可以在一定程度上确保数据的安全。XML数据安全技术在电子商务,WEB服务中也有应用。采用合理的加密算法,根据XML数据的加密技术和数据签名规范实现数字图书馆的数据安全在技术上是可行。随着数字图书馆全方面网络信息服务的提供,数据安全将在以后的应用中彰显它的重要性。将XML加密和签名技术结合起来,可以确保数字图书馆在网络环境下的数据安全。

篇13:基于数据挖掘的数字图书馆个性化服务

基于数据挖掘的数字图书馆个性化服务

随着网络用户群的日益增长,更多的`用户期望能得到具有针时性的、个性化的信息服务和用户支持.数据挖掘技术因其在海量信息资源中的智能表现,为数字图书馆的个性化服务建设提供不可或缺的技术支撑.

作 者:骆颖  作者单位:重庆三峡学院图书馆,重庆,404000 刊 名:黑龙江科技信息 英文刊名:HEILONGJIANG SCIENCE AND TECHNOLOGY INFORMATION 年,卷(期): “”(5) 分类号:G25 关键词:数据挖掘   数字图书馆   个性化服务  

篇14:会计电算化中数据安全性剖析论文

会计电算化中数据安全性剖析论文

摘要:我国会计电算化事业起步较晚,但发展较快。文章分析了我国会计电算化发展过程中存在的主要问题,从完善规章制度、提高从业人员素质、保障数据安全等角度提出了推进会计电算化发展的对策建议。

关键词:会计电算化;数据安全;人员素质。

会计电算化是用电子计算机代替传统的记账、算账,以及利用电子信息技术完成对会计信息的分析、预测、控制的过程。会计电算化使会计业务的处理流程化、规范化,免去了许多手工重复劳动,不仅提高了工作效率,节省了人工成本,而且易于核算出财务分析所需的一些复杂数据指标,并且能够保证数据的精度和广度。会计电算化加快了会计由单一的核算职能向融合分析、预测、决策、控制的管理职能转变的进程。自九十年代至今,我国会计电算化迅速普及,但在此过程中,也不可避免的产生了一些问题。

一、会计电算化发展中存在的问题。

1、管理职能尚未得到充分发挥。

会计电算化发展初期侧重核算职能,随着发展的深入,逐步过渡到“管理型”和“决策型”职能阶段,当今与企业整体管理决策支持系统相统一的ERP阶段是会计电算化发展的一个主流趋势。但现阶段,我国的企业中采用“管理型”和“决策型”财务软件的较少,采用ERP的企业就更少。我国现在企业电算化的发展阶段距离会计电算化的最终功能实现还有一段不小的距离,完善的会计电算化不仅肩负着记账、算账、登帐等基本工作,而且还应能够提高企业财务管理的效率,帮助经营者借助更加准确的财务指标做出正确决策,提高经济效益。我国仅仅是初步实现了会计电算化,总体来说尚处于会计电算化发展的初级阶段。账务处理系统以输入记账凭证开始,经过计算机处理,完成记账、算账、报账等工作,但只局限在财务会计范畴,与企业管理信息系统结合不密切,较少发挥“管理会计”的职能。这种情况下,大量的财务分析工作仍需要手工操作,费时费力。

2、政策、法规尚待完善。

我国财政部在1994年相继颁布《关于大力发展我国会计电算化事业的意见》、《会计电算化管理办法》、《会计核算软件基本功能规范》、《会计电算化工作规范》等文件,但由于规章的级别和执法力度不够,致使相当部分的会计人员根本就不知道法规的具体内容,发生的违法违规行为也缺乏相应的监督监管条例和专门的监管部门。随着会计电算化的高速发展,会计电算化犯罪也逐渐显现,如何防范和规治这种高科技、新技术新型犯罪成为我国普及电算化进程中不应忽视的一个问题。国家有关部门应引起重视,制定专门针对会计电算化操作的法律法规,对会计电算化工作有规范,有监督,有惩处,使之早日纳入法制轨道。

3、操作人员素质亟待提高。

会计电算化作为一门涉及计算机学、管理学、会计学、信息学多个学科的应用技术,对实际操作人员的业务水平要求较高,既要有良好的会计素养,深刻理解电算化软件处理账务的原理,又要熟练掌握计算机基本操作。但现在的实际情况是,大多数单位的电算化人员是由过去的会计人员经过短期培训上岗的。他们年龄结构偏高,往往对会计业务较熟悉但对计算机知识接受较慢,对软件的掌握仅停留在简单操作阶段。一旦计算机出现故障,常常会束手无策,就更难涉及进一步的系统分析、设计、维护等复杂的工作了。所以要想充分发挥会计电算化的优越性,发挥会计电算化的省时高效的优点,就不仅要培养操作人员的会计业务素质,而且要培养软件维护、分析技能,培养会计、计算机跨领域的“双精”人才。

4、安全、保密性差。

现今的会计电算化处理系统大多还存在一些漏洞,致使企业财务信息系统的安全性、保密性、可靠性较差。众所周知,财务数据是一个企业的商业机密,窃取它或将威胁一个企业的生存和发展。程序在现阶段还存在着一些保密隐患。数据库技术的高度集中,未经授权的人员可以通过计算机和网络浏览全部数据文件,复制、伪造、销毁企业重要的财务数据。目前市面上的软件制造企业真正着力于研究数据保密、防盗窃问题的厂家寥寥无几。一般意义上的加密,也无非是对软件本身的加密,防止盗版。

我国多数会计电算化软件的数据保护存在隐患,缺乏操作记录功能,当问题出现不利于追究责任。

5、网络化程度有待提高。

目前我国会计电算化网络化已经取得初步进展,比方说企业已可以实现网上报税,申报信息通过IC卡无纸化传递,但仍要看到,企业和企业之间无法联网,企业与财政、银行等综合管理部门的联网也尚需完善。可以说,建立一套服务于企业,惠及全社会的财务信息传输网络,提高数据发布的及时性,节约中转成本,成为当前会计电算化发展的`当务之急。

二、对策探讨。

1、制定相关规章制度。

电算化会计是一套关于会计信息处理的有机系统,电算化软件是其中的主要组成部分,除此之外,还需要相配套的规章制度来保证会计信息的安全准确,充分发挥电算化信息处理的优点。有关部门应借鉴发达国家电算化管理经验和规则条例,加大对会计电算化监管制度的研究,尽早建立起一套适合我国国情并富于操作性、实用性的监管法律法规体系,切实保障我国会计电算化工作朝着健康方向发展。会计电算化必须建立的管理制度应包括:会计电算化岗位责任制度、电算化系统操作管理制度、计算机硬件和软件管理制度、电算化系统会计资料和档案管理制度等。进一步完善会计电算化的配套法规,针对会计电算化发展中出现的新问题、新情况不断地补充和完善相关法规。通过准则类法规规范会计电算化操作流程,使会计电算化工作有章可循、有法可依。

2、重视电算化教育,提高从业人员素质。

培养一大批懂财务并精技术的会计电算化复合型人才是我国会计电算化持续发展的根本。人才的培养,必须从学校教育和岗位培训上双管齐下。对于学校教育中电算化课程的开设,往往存在学时较少,课程安排过于基本,软件单一的问题。学生学完课程后,往往只掌握了一些日常业务的简单操作,稍显复杂的业务处理或软件的一些高级功能就知之甚少了。可见,要在实际工作中全面发挥会计电算化的管理功能,在课堂教学中,就应锻炼学生们利用会计电算化软件管理分析数据的能力,而不仅仅局限于基本的核算操作。对于正在从事着会计工作的会计人员,应对他们进行经常性的短期培训,使他们不断更新自己的知识结构来适应日新月异的电子信息处理技术的发展。

3、加强安全、保密性。

加强安全、保密性,从外部来看,需要会计软件生产企业在开发设计新软件的同时加强对数据保护模块的研究;从内部来看,需要企业自身加强财务安全意识,建立内部控制制度。

第一,实行用户权限分级授权管理,建立网络环境下的会计信息岗位责任。

第二,建立健全对病毒、电脑*客的安全防范措施。采用防火墙技术、网络防毒、信息加密存储通讯、身份认证、授权等。

第三,从电算化网络软件的设计入手,增加软件本身的限制功能。

第四,建立会计信息资料的备份制度,对重要的会计信息资料要实行多级备份。为确保档案的真实性和可靠性,实行纸质档案和新型载体档案双套保管,并逐渐向完全保管新型磁介质载体过渡。

第五,强化审计线索制。

第六,建立进入网络环境的权限制。在进入系统时加一些诸如用户口令、声音监测、指纹辨认等检测手段和用户权限设置等限制手段。

第七,建立机房管理限制。对于重要的计算机系统应加电磁屏蔽,以防止电磁辐射和干扰。制定计算机机房管理规定,制定机房防火、防水、防盗、防鼠的措施,以及突发事件的应急对策等。

4、实现网络化财务信息管理(1)传送数据网络化。

企业可以将公布财务或审计报告等工作直接借助于网络平台实施,节约成本,便捷高效。

(2)实现企业会计电算信息系统的网络化。

随着财务软件技术的深入开发,在未来的若干年内我国的大部分会计电算化系统必将渐渐地从单项环境过渡到网络化的环境中来。可以考虑建立一个数据共享平台,使企业的数据资料在网络上可以选择与其他企业的财会数据资料实现共享。

(3)将企业的资金账户与系统挂钩实现网上收支。

企业可以将局部网定向到银行的账户上,在网上直接进行资金的划拨和收支,提高了企业的资金周转率,便于开展电子商务。

5、加强软件的友好性和易用性。

考虑到会计人员的年龄结构、素质层次多样,为了使会计软件更加易于操作、易于学习,就需要软件开发人员能够设身处地为使用会计软件的从业人员考虑,使开发出来的会计软件界面亲和、易懂易用。如“采用自动转账凭证生成模块”就是一个很好的例子。所谓自动转账凭证生成模块,就是会计软件系统根据收、付、转和汇总凭证的格式,事先设置好摘要栏、借贷方科目、金额栏(借或贷)以及金额的计算方法,当会计人员把每一个会计期间所发生的经济业务输入系统时,系统自动生成所需的记账凭证。自动生成记账凭证可以有效地保证会计报表数据源真实可靠。

自九十年代至今,我国会计电算化高速普及,但摆在当前的问题是,与会计电算化的普及程度相比,无论是人员的素质还是相应的监管、操作规范都没有配套地跟进。二十一世纪是一个信息时代,我们应抓住机会,与时俱进,深刻认识会计电算化现存问题,采取有力措施逐步解决这些问题,建立更加高效的财务处理系统,更好地为企业的经营管理服务,为我国经济的高速发展助力。

关于本站:中国最大的权威的公务员站-公务员之家创建历经7年多的发展与广大会员的积极参与,现已成为全国会员最多(95.4万名会员)、文章最多、口碑最好的公务员日常网站。荣膺搜狐、新浪等站与权威媒体推荐,荣登最具商业价值网站排行榜第六位,深受广大会员好评。

篇15:数据挖掘在数字图书馆中的应用研究

文本数据挖掘在数字图书馆中的应用研究

文本数据挖掘在数字图书馆中的应用进行探索研究,重点对数字图书馆文本分类的'构建与实现进行研究,并将开方拟合检验方法、KNN分类算法等经典理论应用到数字图书馆文本分类模型中,以提高数字图书馆检索能力以及检索准确性.

作 者:叶福军  作者单位:浙江传媒学院动画系,浙江,杭州,310018 刊 名:硅谷 英文刊名:SILICON VALLEY 年,卷(期): “”(7) 分类号:G25 关键词:文本数据挖掘   数字图书馆   文本分类  

篇16:数字图书馆数据备份系统方案的规划

数字图书馆数据备份系统方案的规划

本文针对当前数字图书馆对于数据备份的认识不足和技术缺陷,分析了数字图书馆对数据备份的需求,提出了数据备份系统的`建设原则.在该原则的指导下分别对数据备份设备的选择、数据备份软件的选择、数据备份策略的制定以及在数据备份方案实施过程中应该注意的问题及数字图书馆数据备份系统方案的规划进行了论述.

作 者:郭晓玲  作者单位:西安陆军学院图书馆,陕西,西安,710108 刊 名:丝绸之路 英文刊名:SILK ROAD 年,卷(期):2009 “”(12) 分类号:G258.93 关键词:数字图书馆   数据备份   信息资源  

浅谈基于网络平台的信息传播多元化整合路径研究优秀论文

数据大集中管理模式下数据同步技术探讨论文

电子商务管理系统的论文

计算机本科毕业论文

图书馆少数民族文化资源建设与传播论文

管理系统中互联网电视论文

客户管理系统论文

论文参考文献标准格式

试论基于知识经济时代背景下的高校档案管理方略论文

基建工程档案信息化管理研究论文

如何提高数字图书馆的数据安全性论文
《如何提高数字图书馆的数据安全性论文.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

【如何提高数字图书馆的数据安全性论文(精选16篇)】相关文章:

高校体育教师教学能力现状与优化路径论文2022-11-27

数字化教学论文2023-10-05

工业控制系统信息安全专业化服务体系建设研究论文2023-04-17

数字电气工程技术研究论文2023-10-04

计算机科学技术在计算机教育中的应用论文2023-06-03

旅行社个性化服务论文2023-12-26

计算机系统分析员论文-企业人事信息系统的应用2023-05-05

广电媒体资产管理系统建设分析论文2022-09-16

校园建设方案的策划书2022-11-08

学术图书馆科研数据管理体系研究论文2023-07-27