论文网
首页 职业教育职业技术教育正文

关于图书馆软件智能模糊检索的改良——以广东文艺职业学院图书馆为例

  • 投稿丽水
  • 更新时间2015-09-23
  • 阅读量566次
  • 评分4
  • 31
  • 0

关于图书馆软件智能模糊检索的改良

——以广东文艺职业学院图书馆为例

李燕红

(广东文艺职业学院图书馆,广东广州511400)

【摘要】如何使读者能够快速、准确地获取所需信息,是现代图书馆面临的一个重要课题。从图书管理系统中进行合理性的改良,以图书检索现状就图书检索现状做了详细分析,并提出一套行之有效的解决办法,旨在试推行图书智能模糊的功效。

教育期刊网 http://www.jyqkw.com
关键词 智能模糊检索;信息检索;教育期刊网 http://www.jyqkw.com
关键词 的拆分与组合

高校图书馆的重任是以师生读者为服务对象,要开拓图书管理系统实效性的查阅功能是至关重要。由于图书馆主要从事大量的图书资料的储存和流通,所以一直以来,图书馆软件在图书馆的图书管理中得到了广泛的应用。目前,以广东文艺职业学院图书馆的实际情况来看馆藏逐年增长,如何使丰富的馆藏资源得到更彻底更有针对性的利用,成为图书馆人需要思考的一个新课题。实行图书系统检索改良就是要使图书馆软件做到对读者负责,快速完成查找检索图书并对信息进行数据库管理。为了适应图书馆业务发展的需要,解决艺术院校读者借阅图书常见的问题,经过考察,决定对本单位的图书管理系统进行尝试性改造。新软件不仅能利用当前的软件开发技术和原有的建设成果,方便读者查询、借阅操作,解决流通中存在的问题,而且能结合使用过程中的新问题,图书量大等特点,对图书管理中各业务环节进行加强管理。

现有图书馆软件系统存在的问题:

1关于图书简介或者目录检索的现状

目前我馆所使用的图书馆软件为IlASII,它的书目查询系统所能实现的检索途径如图1,有:题名/刊名、责任者、主题词、分类号、标准书号、索取号六种检索方法

但是仍然不能满足读者的快速查询需求。本馆为艺术类院校图书馆,例读者要借阅一本含有“小白菜”的五线谱的图书。通过ILASII编目处理系统我们可以看到《趣味钢琴曲选》里的330字段显示本书收录的钢琴乐曲谱是有“小白菜”这首歌的曲谱的,如图2:

但是图书馆现有的系统无法实现用目录查找检索,我们尝试着在题名输入“小白菜”,如图3:

但是用“小白菜”搜索出来的结果并不是读者所需要的资料。

因为主题词又称叙词,在标引和检索中用以表达文献主题的规范化的词或词组。显然主题词的专业性要求是相当高的。有经验的图书管理员或许可以想到在分类号处输入“J64”或者“J65”进行模糊检索,检索所出结果成百上千条。

图书管理员需要在此查询结果的基础上进行一本本图书的查找并进行人工翻阅图书的目录。幸运的可能找到,不幸运的也许就与某本有该歌曲的图书失之交臂。这样的业务实现方式,不仅加重了图书管理员的借阅查询工作量,也不利于图书最大程度地被利用。又如读者要借阅的图书不清楚书名,也不明确作者,只是大概知道图书的内容……如果图书的目录或简介可以被标引为可检索点,将有利于完成这几种情况的借阅。

2检索的缺陷

本馆有“快速零购”这一特色服务,是为了满足读者的快速需求而设立的。在此服务的实施过程中,经常发现零购回来的图书其实馆内是有的。认真分析了之后才发现以下的情况:例如有本图书《一位销售经理的工作心得》如果记成《一名销售经理的工作心得》则将会检索不出来;甚至于一个全角的,以及一个半角的,都会导致检索不出。造成这种缺陷的原因就是现有的检索途径太过单一,限制性太强,检索词必须高度的精准匹配。这样的情况对于当下的90后大学生读者来说是非常难以避免的。

解决的设想:

(1)为了更进一步提高查找效率和准确率,建议在不修改现有图书馆管理系统的基础上,增加一个检索管理系统数据库的接口,使得查询系统具有检索图书目录、图书简介及图书附注模块的功能。以下是国家图书馆的一个检索功能,它是通过对要检索的数据作索引处理,并通过所有字段的查找达到检索图书书目。在所有字段检索中键入“当男人爱上女人”即可检索到所有字段中出现有关“当男人爱上女人”的相关图书信息,可以发现该书的题名或者主题都未涉及这首歌曲名字,但是在内容附注里有“当男人爱上女人”的词条。通过此方式可以实现现有图书管理系统暂时未能实现的内容附注、内容提要模块的检索功能。

(2)在现有图书管理软件的基础上集成OCR软件接口(文字识别软件),建立强大的后台数据库,并且可以智能的对后台数据进行处理。通过OCR软件可以精确的将图书或期刊等各种纸质文件转化为计算机能识别的数据,并通过接口将数据导入到后台数据库服务器。服务器通过特定的检索命令自动将图书简介或者附注或者目录进行索引标识,索引后的数据能通过检索文献内的模糊(3)实现智能检索,需要教育期刊网 http://www.jyqkw.com
关键词 拆分分离识别技术支持。图书馆学有门课程叫主题词。主题词是经过严格优选的专业检索语言。在信息量飞速增长的今天,单纯地依靠精致的专业的主题词显然无法适应读者的大众化和平民化。因为要求对大量的自然语言进行标引,使其能直接进行标识。自然语言中大量存在的等同关系词不加规范统一,也不显示等同、等级关系。需要标引者突破传统的主题词表或教育期刊网 http://www.jyqkw.com
关键词 表的束缚,对传统的检索语言进行改良,使之适应网络信息处理对标引效率和检索易用性的要求。通过参照系统实现检索策略的调整,从而得到高质量检索效果并实现方便自动化的信息处理。

综合以上三点,首先增加检索管理系统数据库的接口,并利用集成OCR软件达成模糊检索技术,再通过教育期刊网 http://www.jyqkw.com
关键词 拆分分离识别技术,最大限度的增加了检索数据库容量、检索途径数量以及教育期刊网 http://www.jyqkw.com
关键词 的索引口。通过这种方式,可以在最大程度上改善ILASII管理系统不能提供模糊检索的功能以及方法的不足。图书馆现有的软件系统,无论在操作熟练程度还是使用的时间上,都经过了很长时期的适应。要在短时间内改变图书馆员的操作习惯,最好的方法就是这种改变必须浅显易懂,容易上手,不会在现有的基础上增加操作难度。通过对本设想的技术进行深入分析,结果证明该方法是行之有效的,具有很高的实用价值。分析表明,该设想不但在操作上更加便捷,更人性化,同时也大幅增加了检索的速度以及准确率。如果本设想得以推广,可以将我馆的馆藏资源和网络资源进行整合和有序化,实现全方位、多途径为教学科研及广大读者提供快、精、准的信息服务和信息检索服务;提高信息检索服务质量,可有效发挥图书馆的应有功能,让教师、学生及科研工作者可以及时了解科研技术发展水平的新技术、新动向,激发读者的求知欲,进一步提高图书馆图书利用率。

图书检索技术的好坏,直接影响到图书的使用效率。而读者从图书馆获取信息的最基本、最直接的手段,就是通过图书馆的检索系统。伴随着计算机技术、网络技术的迅猛发展,特别是Internet覆盖范围的扩大,使得图书检索系统从封闭走向开放,并依托Internet朝着使读者不受时空的限制,并且准确定位所需信息的方向发展。实现图书馆软件智能模糊检索的改良,是一种技术性的突破,通过准确性的检索方法便利于获取信息资源,让更多读者受惠资源共享,是高校图书馆的读者服务的促进与发展。

教育期刊网 http://www.jyqkw.com
参考文献

[1]李纲,叶光辉.基于词词关联矩阵改进的模糊检索研究——模糊语词转模糊概念检索方法探究[J].图书情报工作,2013(21):104-111.

[2]付真真,陆伟.基于教育期刊网 http://www.jyqkw.com
关键词 的搜索引擎优化策略及效果分析[J].现代图书情报技术,2009(6):61-65.

[责任编辑:邓丽丽]