基于Web数据挖掘的企业知识管理系统模型框架
(北京交通大学 经济管理学院,北京 100044)
摘 要:
文章阐述了知识管理、知识管理系统和Web数据挖掘技术,构建了企业知识管理系统,根据Web数据挖掘的特点构建了基于Web数据挖掘的企业知识管理系统模型,并对未来企业的知识管理进行了展望。
关键词:
知识管理系统;
数据挖掘;
Web数据挖掘
中图分类号:
F270.7 文献标识码:
A 文章编号:
1007—6921(2009)19—0011—03
经济全球化的快速发展给企业带来了巨大的压力,而知识经济的到来更是雪上加霜,它使企业间的竞争从传统的资本、技术、人力资源发展到知识要素。21世纪的全球经济的主导力量是知识密集型产业,企业只有重组为知识创新型企业,企业员工互相学习、不断创新才能立于不败之地。由于知识要素特殊的性质使其不同于一般的管理,知识管理应用而生。企业收集知识、管理知识就是为了员工能够学习知识并将其转化为生产力,而知识种类和数量都很多,这就需要借助Web数据挖掘技术从员工浏览的众多网页中挖掘出员工需要的知识以此增加企业内部知识库的知识内容。
1 知识管理系统概述
1.1 知识管理
知识管理(KM)是企业为适应市场竞争力的变化而发展起来的、用于增强企业客户知识和企业员工知识获取、共享和创新的基于IT技术的数据和信息处理管理。其不同于一般的管理,而是对抽象的企业知识进行系统化管理,使知识这种生产要素发挥其应有的作用。
知识管理在客户关系管理的应用称为客户知识管理,就是指企业通过与客户互动过程中所获得的知识的创造、交流和应用来使公司业务增长和价值最大化,实现创造公司价值、维持竞争优势的过程[1]。客户知识管理重在创造和传递革新的产品和服务,管理并加强与新老客户、合作伙伴、供应商之间的关系以及改善与客户相关的任务实施与过程。
知识管理在企业内部员工知识共享的应用称为企业知识管理,就是指企业根据自身特点,对员工在工作过程中积累的经验和各类知识进行有效管理,使这些隐性知识传递给员工,方便员工的交流与沟通,以此提高员工的积极性和创造力,提升企业经营业绩和市场竞争力的过程。企业知识管理重在收集知识、产生知识和利用知识,在知识的管理过程中产生新知识,提高企业员工的创新能力[2]。
1.2 知识管理系统
知识管理系统(KMS)是企业实现知识管理的工具,用于企业知识的收集、组织和传播的管理技术,能够使知识从单独的个体转化为具备专家性、综合性、完备性和系统性的软件系统[3],为企业员工提供学习交流的平台,促进企业知识创新,提高企业综合竞争力。知识管理系统主要有知识地图、搜索引擎、知识库和知识源四部分组成。
1.3 实施企业知识管理的原因
在日新月异的知识经济时代,知识的获取、整理、融合和创新成为企业发展的强大推动力,员工知识的创新和应用会使企业在竞争中不断发展壮大,立于不败之地。在不断变化的市场经济中,企业周围充满了不确定性,要想在如此艰辛的环境下生存,企业必须提高自身的竞争力,而要提高竞争力就必须掌握别的企业所没有知识,使企业从以前的单纯从外界吸取知识转化为通过整合企业内部员工的经验知识消化、吸收产生新的适用于本企业的知识,提高企业的创新能力。
实施企业知识管理的另一个原因是企业不会再像以前那样因为一个技术人员的离开而致使该方面技术的瘫痪。企业可以通过建立知识管理系统把那些隐性知识转化为显性知识,别的员工可以通过知识库学习这种技能,并且可以把自己的想法和大家分享,共同学习改进这些知识。
2 数据挖掘技术概述
2.1 数据挖掘概述
数据挖掘(DateMining)是指从大量的、不完全的、模糊的、随机的数据中揭示出隐含的、先前未知的、并有潜在价值的信息和知识的过程[4]。通过使用数据挖掘技术可以从大量的未筛选的数据中发现有价值的、可以供员工学习的信息和知识。在知识管理系统的构建中使用的数据挖掘方法有:分类、聚类、关联规则和Web页挖掘等。
分类、聚类和关联规则都是通过一定的挖掘算法把企业内部的知识进行归类,方便员工的搜索和文件的管理,是知识管理系统构建中必须拥有的。而文章所讲的Web挖掘技术是从另一个角度描述管理者通过Web日志的挖掘总结企业员工进行知识搜索的内容是什么,是关于哪方面的知识多,企业知识库中还需要添加什么新知识以满足员工的要求。
2.2 Web数据挖掘技术
Web数据挖掘(Web Data Mining)就是数据挖掘技术与Web相结合的产物,是数据挖掘的一个重要分支,是随着数据库技术、人工智能技术和网络技术的发展而出现的。Web数据挖掘是从www资源上抽取信息(或知识)的过程,是对Web资源中蕴涵的、感兴趣的、未知的、有潜在应用价值的模式的提取。根据Web挖掘的对象不同Web数据挖掘分为:Web内容挖掘、Web结构挖掘和Web日志挖掘[5]。
2.2.1 Web内容挖掘是从用户浏览文档的内容中提取有价值的知识。Web内容挖掘又分为文本挖掘和多媒体挖掘。使用Web文本挖掘可以实现对Web上大量文档集合内容的总结、分类、聚类、关联分析,以及利用Web文档进行趋势预测等。Web多媒体挖掘现在处于起步阶段,还没有深入的研究。
2.2.2 Web结构挖掘是从Web的组织结构和链接关系中推导知识[6]。它分为两大类:①文档之间的超链接结构挖掘。②Web文档内部结构挖掘。Web结构挖掘是利用用户浏览网页间的超链接信息对搜索引擎的检索结果进行相关度排序,寻找用户浏览网页间的相互关系。
2.2.3 Web日志挖掘是通过挖掘Web日志记录以发现用户访问Web页面的模式、挖掘有用模式和预测用户浏览行为的技术[7]。Robert Cooly将Web日志挖掘定义为数据挖掘技术应用在大型Web资源中以分析Web站点的使用。Web日志挖掘的结果通常是用户群体的共同行为和共性兴趣,以及个人用户的检索偏好、习惯和模式等[8]。在进行Web日志数据挖掘时可使用统计分析、关联规则和聚类等方法。
3 基于Web数据挖掘技术的企业知识管理系统模型
3.1 企业知识管理系统
企业实施知识管理就是为了实现企业内部知识的充分共享和创新,以此提高企业的核心竞争力,而要实现知识的共享就需要建立一个完整的共享系统——知识管理系统。知识管理系统是在信息管理系统的基础上发展起来的,是当代企业实施知识管理活动必需的设施。由于知识管理系统储存的内容非常多,是面对企业全体员工的系统,因此该系统应该具备良好的反应速度和稳定性,不能因部分功能的错误而整体瘫痪。简而言之,知识管理系统就是通过利用知识管理技术支持企业内部整个知识循环的过程。知识管理系统的层次机构如图1所示。
知识管理系统4个层次上的功能:①知识源。知识有隐性和显性之分,显性的知识可以通过看书阅读得到,而隐性知识一般通过师徒传授的方式进行传递,而这部分知识在企业中占有很大比例并且非常重要,是企业知识创新的源泉。知识源层就是通过企业多年积累的文档资料、电子邮件、客户知识反馈和互联网的Web页面浏览收集企业发展需要的知识,使社会上的显性知识隐性化为企业的内部知识。②知识库。知识库就是对通过知识源收集到的知识进行归类、整理。首先是从知识源中提取知识,通过加工将分散的知识聚集起来而后对这些数据进行挖掘;
通过企业既定的知识发现模式,从众多的知识中归类提取潜在的、未知的知识,并将这些知识按各自的类别储存起来,为搜索引擎奠定基础。③搜索引擎。搜索引擎就是对存放在知识库中的知识进行管理分类,根据工种、知识内容的不同进行不同的管理,如:企业的生产工作流程技术属于生产管理技术知识,企业的销售属于销售技术知识等。同时还可以对不同层次的员工授予不同的访问权限,使公司的知识发挥真正的作用,并且可以防止企业内部知识的外泄。④知识地图。知识地图就是将计算机存储的知识外化给员工浏览,是用户对知识管理系统的访问界面,员工可以通过这一层实现自己浏览知识的行为。知识地图可以包括多个模块如:新员工学习模块、部门交流模块、经验交流模块和专家咨询模块。通过知识地图员工可以快速找到自己需要的知识,并且可以实现跨部门、跨行业的知识交流,为员工提供丰富的知识共享平台。知识管理系统的四层结构的具体框架如图2所示。
知识地图是员工进入系统后的登陆界面,也是员工惟一能看到的层次。员工进入知识地图层次可以根据自己的浏览权限和知识需求进入相应的模块。搜索引擎是系统进行员工权限设置、知识类型设置和分类的内部检索性层次。知识库是系统对数据的处理层,按照一定步骤和规则挖掘有价值的知识。知识源看似没有上述三层重要,其实这层是不能小视的,它是整个系统的源泉,只有多而广的知识源才能为企业找到更多有价值的知识。
3.2 基于Web数据挖掘的企业知识管理系统模型
在上述的知识管理系统架构中可以看到知识库层也有数据挖掘,但是这个数据挖掘技术是对从数据源中提取知识后进行的纯文本挖掘,是根据企业既定的知识发现模型运用聚类算法或遗传算法进行的挖掘。而文章的重点是对企业如何获得多而准确的知识源的研究,因为企业的知识有很大一部分来自Internet,不管是员工通过浏览Web网页查询知识还是客户通过网页留言反馈知识,信息量都是很大的,如果没有先进的技术支持会浪费大量的时间并且不容易发现各网页之间的链接关系。要实现对知识源的有效丰富,就需借助Web数据挖掘技术。从前面的介绍中已经知道web数据挖掘是Internet/Intranet广泛使用的产物,通过对Web内容、结构和日志的数据挖掘发现网页之间、文本之间的知识联系,帮助企业找到员工所需求的知识和企业为满足客户而需改进的技术知识。文章从Web数据挖掘的理论意义出发,结合传统的知识管理系统,构建基于Web数据挖掘的知识管理系统模型,而对具体的挖掘算法不做介绍(如图3所示)。
使用Web内容挖掘技术中的文本挖掘对企业员工所浏览的网页文本内容和企业客户知识反馈的网页文本内容进行挖掘,这些网页文本有的是企业内部知识库中的知识,有的是员工浏览外网查询的知识,还有的是客户访问公司网页并就自己遇到的问题咨询并反馈给公司的知识。对这些网页文本使用聚类分析算法,按员工浏览的文本内容和客户反馈的内容以相似度为70%的文本聚为一类以此提取员工经常浏览知识的类别和公司需要为满足客户而让员工学习的知识类别。
3.2.2 使用Web结构挖掘技术中的文档间的超链接结构挖掘,这个挖掘主要针对员工。在Web浏览时,员工不会仅对一个页面进行浏览,当企业内相关知识不够时他会链接相关知识的网页进行搜寻。而文档间的超链接结构挖掘就是基于SCI的科学引文分析理论,通过关联规则分析员工搜索的各页面之间的链接关系及链接内容,找出哪个是相关主题的权威站点,员工喜欢浏览哪些网页、想要获取哪些知识。
3.2.3 使用Web日志数据挖掘技术。通过对员工访问Web时在服务器留下的日志数据进行访问,从中找出有价值、有意义的内容,并通过某种数据挖掘方法找出这些内容的联系。万维网中的服务器都保留有用户的访问日志(即Web服务器日志数据,记录了关于用户访问和交互的信息)。Web日志挖掘技术就是对这些数据进行分析,分析用户的行为,找出用户访问网页的相关性,进而挖掘出员工对企业内部不同知识的关注度和新知识的渴求度。这方面的研究主要有两个方向:一般的访问模式追踪和个性化的使用记录追踪。一般的访问模式追踪是通过分析使用记录来了解用户的访问模式和倾向,以改进站点的组织结构。而个性化的使用记录追踪则倾向于分析单个用户的偏好,其目的是根据不同用户的访问模式,为每个用户提供定制的站点[8]。因为企业内部的知识管理的对象不同,企业内员工受教育的水平不同,知识的掌握能力也不同,所以我们采用一般的访问模式追踪和个性化的使用记录追踪相结合的方式,反映企业大部分员工和个别员工的知识需求度。
3.2.4 将Web挖掘出的有价值的数据信息传送给企业的知识源,更新知识源。这时的知识源是经过挖掘处理后的
只包涵企业内部经验知识、电子邮件和Web挖掘出的知识,减少了信息量,使知识库的数据提取变快,加
工挖掘时间变短,间接提高了知识管理系统的更新速度。这些变化最终反映在知识管理系统的知识地图层。
3.3 未来展望
企业知识管理系统和Web数据挖掘技术衔接后,企业管理者可以快速、精确的发现员工的知识深度和知识
需求度。通过Web挖掘技术可以挖掘出企业员工经常浏览的知识网页、经常搜索的知识内容,通过聚类分
析后可以总结出企业生产发展中需要的知识种类,并且还可以发现员工在满足自己学识的情况下还对什么
比较感兴趣。当挖掘出这些内容后,服务器会自动将这些知识放入知识库并更新,对以前知识库中存储的
知识随着员工浏览次数的减少而删除以减少空间占有量。
4 总结
数据挖掘经过多年的发展其挖掘算法已经成熟,因此文章不是从挖掘算法的具体应用出发而是通过对企业
知识管理系统中知识的来源出发,思考如何利用现有资源获得更多有用的数据信息。通过对Web数据挖掘
技术理论和实际操作的研究认为使用Web数据挖掘技术就可以实现知识源的快速更新。
文章从理论应用层出发构建基于Web数据挖掘的企业知识管理系统模型,指出模型框架的层次功能而没有
就具体挖掘算法进行描述。通过分析企业知识管理系统的层次结构和企业知识的来源,构造出基于Web数
据挖掘的企业知识管理系统模型,其目的是通过查看员工浏览的网页发现员工对不同知识的需求和企业内
部需要增加的知识,及时更新企业知识库,满足员工的知识需求,进而推动企业的知识创新,提高企业核
心竞争力。
参考文献]
[1] 张少杰,王连芬.客户知识管理的数据挖掘方法[J].情报科学,2004,22(12):1413.
[2] 孙波.企业知识管理的核心问题探讨[J].科技信息,2008,(12):5.
[3] 王君,樊治平.一种基于Web的企业知识管理系统的模型框架[J].东北大学学报,2003,2(2):182. [4] 李彬.数据挖掘在知识管理中的应用[J].科技广场,2006,(5):73.
[5] Cooley R,Mobasher B,Srivastava J.Data Preparation for mining world wide web browsing patterns.Knowledge and Information System,1999,1(1):5~32.
[6] Chakrabarti S, Dom B E. Mining the Webs Link Structure [J].Computer, 1999,32(18):60~67.
[7] Pitkow J.Insearch of reliable usage data on the WWW[C].In:Proc of 6th Int"I WorldWideWeb Conf.Santa Clara.California.1997.
[8] Jaideep Srivastava,Robert Cooley,Mukund Deshpande,et al.Web Usage Mining:Discovery and Applications of Usage Patterns from Web Data[J].In Proc.ACM SIGKDD,2000,1(2):12~23.
[9] 李向云.Web日志挖掘技术的研究[D].大庆石油学院,2007.
上一篇:竞聘食堂主任助理演讲辞
下一篇:医师节演讲稿精选10篇