魏俊强
(邯郸市瑞杰水利水电工程有限公司河北邯郸056000)
【摘要】本文针对计算机数据挖掘技术应用在档案信息管理系统中的相关问题,做以下几方面论述。
教育期刊网 http://www.jyqkw.com
关键词 计算机;数据挖掘技术;档案信息管理;形式分析;应用
Computer Data Mining Technology in Archives Management System
Wei Jun-qiang
(Handan City Ruijie Water Resources and Hydropower Engineering Co., Ltd河北邯郸056000)
【Abstract】In this paper, computer data mining technology-related issues in the file information management system, do the following aspects discussed.
【Key words】Computer;Data mining technology;Archives information management;Formal analysis;Application
在21世纪科技日益更新的年代,随着网络计算机的迅速普及、网络技术的发展以及数据库的日益成熟,人们在日常生活中收集数据的能力大幅度提高。随着行业的不同,大量的数据库被用于商业管理、政府办公、科学研究和工程开发等各个行业。在促进我国社会发展的同时,也在一定程度上给人们的日常生活带来了困扰。在这些困扰中,其核心在于数据丰富而知识贫乏。由此人们在分析数据的过程中,很难取得有价值的知识。随着数据挖掘技术的研究应用,在解决这一问题的同时,还在很大程度上推动了社会的发展,直接提高档案信息的管理效率。在此,本文从数据挖掘的概念与技术、数据挖掘的形式分析以及数据挖掘技术在档案信息数据处理中的应用等三个方面出发,针对档案信息管理系统中,计算机数据挖掘技术的应用,做以下分析。
1. 数据挖掘的概念与技术
随着社会的迅速发展,传统的数据收集模式已经无法适应现有的社会发展需求,而数据挖掘技术的应用,在提高数据收集质量的同时,还在一定程度上促进了社会的发展。而在数据挖掘的相关应用中,具体分析如下:
1.1数据挖掘的概念。 随着计算机的迅速发展,数据挖掘(DataMining,DM),是一种决策支持过程,它主要基于人工智能、机器学习、统计学技术,高度自动化地分析企业原有的数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助决策者做出正确的决策。一般认为数据挖掘是数据库中知识发现KDD的一个环节,是KDD中采用具体的数据挖掘算法从数据中自动高效地提取有用模式的最重要的步骤。然而,在产业界、媒体和数据库研究界,“数据挖掘”比“数据库中知识发现”更流行,由于DM的广泛使用,我们也对DM和KDD不作严格区分,而认为是等价的概念,在这种意义下它们的定义是一致的。KDD(DM)是从数据集中识别出有效的、新颖的、潜在有用的并最终易于被人们理解的模式的非平凡处理过程。
1.2数据挖掘的技术。 在数据挖掘技术运用的过程中,一般所采用的是数学方法,然而在情况特殊的状况下,也可以采用非数学的运用方法。除此之外,在整个数据挖掘技术运用的过程中,除了以上两种方法之外,还在一定程度上可以运用演绎与归纳的方法进行数据收集。数据挖掘技术在运用的过程中,通过对相关数据的挖掘、收集以及分析等得出一定的结果,而这一挖掘结果在某些状况下可以直接运用于信息管理、查询优化、决策支持、过程控制以及数据维护等多个方面。与此同时,数据挖掘技术在应用的过程中,鉴于数据挖掘技术特性,不仅涉及到多门学科,同时还涉及到数据库、人工智能、数理统计、机器学习、可视化、并行计算等领域。且在很大程度上,数据挖掘技术在使用的过程中,经常使用的技术主要包括人工神经网络、决策数、遗传算法、规则归纳以及可视化等相应的技术。
2. 数据挖掘的形式分析
数据挖掘在其使用的过程中,基于不同的数据收集,因而在使用的过程中需要使用与之相符的数据收集方法。在确保数据收集资质量的同时,还能确保计算机整个系统的顺利运行。而在数据挖掘形式分析的过程中,主要包括以下几种,具体分析如下:
2.1分类。 在计算机数据挖掘技术运用的过程中,分类作为计算机挖掘技术中的核心形式,不仅关系着数据收集的质量,同时还关系着数据的收集属性分析,因而在整个挖掘技术运用的过程中有着极其重要的作用。而分类作为整个数据挖掘技术中的核心部分,在其运用的过程中,主要是通过分析相关程序的数据库,将元组分为与之相对的几个小组。而在其划分的过程中,针对部分数据,则尤其根据相关人员的操作,对其进行集中处理划分,在系统程序对其分析之后,由相关程序对剩余的数据进行最终检测,在达到检测要求之后,按照相应的规则进行分类。在其具体分类的过程中,典型的分类过程包括了确定分类范围、选取目标属性、形成训练集、属性分析、选择算法、分类运算、显示结果、抽取测试集、验证分类规则、分类规则输出等10个步骤。
2.2相关规则。 在计算机数据挖掘技术运用的过程中,相关规则作为整个技术中既简单又实用的关联分析规则,不仅能将程序中产生的相关数据准确的描述出来,同时还能针对相关数据资料进行仔细的分析。而在其具体运用的过程中,主要是通过一个具体的事物描写,将同类事物中相同属性的事物结合在一起,然后通过归纳总结,得出他们共有的属性与模式。在关联规则使用的过程中,一般将其直接用在事物的数据库中,不同的事物在产生数据的过程中,都由同一个记录将其记录集合。而这种事物数据库通常被概括为庞大的数据。由此就需要关联规则在其使用的过程中,应恰当的进行数据记录,在减少数据占有空间的同时,还能在很大程度上完善整个系统的数据运行。
2.3粗糙集。 在整个计算机数据挖掘技术使用的过程中,粗糙集作为一种研究不精确、不确定性知识的数学工具,在整个系统使用的过程中有着极大的优势。主要包括以下几个方面:首先,在整个粗糙集运行的过程中,无需知道相应的信息,且在整个运算的过程中,算法简单且易于操作,因而在很大程度上受到计算机用户的青睐。其次,在整个数据挖掘研究的过程中,所面对的数据库多为一系列的型号数据库,而这种数据库在数据收集的过程中,粗糙集收集方法的使用,能够在最短的时间内发现所有数据库的规律,并通过相应的表格归纳,将其列为决策表,方便了计算机用户的查阅。最后,即使在现实世界,一些规则在使用的过程中也会发出不确定性,更何况虚拟的网络世界。而在数据库使用的过程中,也会发现一些不确定性的知识,而这些都需要粗糙集方法对其进行解决。
3. 数据挖掘技术在档案信息数据处理中的应用
档案信息在日常管理的过程中,不仅关系着相关人员的历史记录,同时还是相关人员智慧成果的最终反映。随着计算机网络技术的应用,在档案信息数据处理的过程中,数据挖掘技术的应用,不仅能从根本上提高档案信息数据的管理效果,同时还能在很大程度上创新档案管理模式。针对数据挖掘技术在档案信息数据处理中的应用,具体分析如下:
3.1计算机数据挖掘技术在档案信息管理系统中应用的重要性。
3.1.1增强了档案实体与内容的安全保护。 档案信息关系着当事人过去的劳动成果,同时还关系着相关人员的隐私信息,一旦泄露,不仅侵犯了相关人员的隐私权,同时还对其今后的生活造成极大的消极影响。而档案管理人员在工作的过程中,针对档案信息,除了保密性严之外,还应注重档案的长期保存质量。针对一些利用率较高的档案,寿命必然会在原有的基础上缩短,而针对档案资料中的相关信息,若缺乏完善的监控设备,将直接造成档案内容的泄密。将数据挖掘技术应用于档案信息效据管理,通过对异常借阅行为的分析统计,可以防范非正当的利用行为发生。从而更好地保护档案实体及档案信息内容。
3.1.2提高档案的利用服务水平。 档案工作人员在档案管理的过程中,针对档案的保密性,在其使用的过程中。其涉及的范围往往比较小。如果将数据挖掘技术应用于档案信息数据管理中,通过档案利用情况分析,就可以加强与利用者沟通,发现潜在的用户和利用方向。并通过针对性地提供档案、加强相关档案的收集、数字化和编研等形式,从而实现真正意义上的主动提供档案利用服务。
3.1.3加强档案鉴定工作的水平,降低档案的收集、保管成本在档案业务的整体工作环节中,档案鉴定不仅关系着档案的真实程度,同时还关系着档案管理工作的整体性。然而在我国档案鉴定中,所凭借的都是档案管理人员的相关业务经验来实现的,因而在很大程度上存在着主观因素。数据挖掘技术应用档案数据处理中后,通过对利用情况和档案情况的分析,了解各单位档案形成特点、规律和档案利用范围,从中发现档案收集工作的薰点。为档案鉴定工作提供了一种的定量化方法,使档案鉴定工作真正实现有据可依。
3.2计算机数据挖掘技术在档案信息管理中的应用。 数据挖掘(data mining)是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、潜在有用信息和知识的过程。在档案信息管理中,数据挖掘技术可以通过自身特有的信息分析能力,对档案信息的调阅以及操作等各个流程产生的数据进行仔细的分析,在充分掌握各单位档案形成的特点、规律以及档案利用范围之后,针对档案信息活动产生的数据进行收集,并将其中的重点进行集中归纳。而这些重点,都是档案鉴定的基本依据。另一方面,数据挖掘技术能够在档案信息管理的过程中,针对大量的有声信息、不完整信息、模糊信息以及随机信息中提取人们不知道的或者潜在有用的信息,并将这些信息及时的反馈到档案信息的整体管理系统中,使其在处理的过程中及时的采取措施,避免档案信息的流失而造成严重的影响。除此之外,计算机数据挖掘技术在运行的过程中,能够针对档案信息管理中出现的大量数据进行相应的管理以及维护,在确保档案信息数据顺利进行的同时,还能针对档案信息自身存在的管理系统进行整理,以便能及时的发现档案信息管理中存在的问题,从而能及时的采取相关措施,避免相关档案信息的流失。
4. 总结
综上所述,随着社会的发展以及科技的进步,计算机数据挖掘技术在使用的过程中,不仅促进了计算机行业的发展,同时还在很大程度上推动了社会的进步。档案信息管理中计算机数据挖掘技术的运用,在提高档案信息管理水平的同时,还在很大程度上完善了档案信息管理,方便了档案信息的保存。由此就需要相关人员在档案信息管理的过程中,能够准确的使用计算机数据挖掘技术,在确保档案信息管理质量的同时,还能创新档案信息的管理模式。
教育期刊网 http://www.jyqkw.com
参考文献
[1]罗艳,黄明初,陆旭安,潘雄伟.简述数据挖掘在数字档案馆中的应用实现[J].广西计算机学会2010年学术年会论文集[C],2010.
[2]黄华.数据挖掘分析在档案管理方面的应用[J].网络安全技术与应用,2009,(4).
[3]蓝天.数据挖掘技术在信息管理领域中的应用[J].情报探索,2009,(2).
[4]房红菊.数据挖掘技术在档案个性化服务中的运用[J].科技情报开发与经济,2009,(10).
[5]王锐,马德涛,陈晨.数据挖掘技术及其应用现状探析[J].电脑应用技术,2007,(2).
[6]潘旭武,陈玲洪.数据挖掘在数字档案管理中的应用研究[J].浙江高校图书情报工作,2007,(1).
[7]黄建设,姚奇富擞据挖掘技术在档案管理中的应用[J].浙江工商职业技术学院学报,2005,(3).
[8]潘家财,邵哲平,姜青山.数据挖掘在档案信息管理中的应用研究[J].中国航海,2010,(2).
[文章编号]1006-7619(2015)08-18-209