第二节 知识管理前沿技术
这里介绍几种知识管理的常用前沿技术。现代知识管理技术以计算机网络技术、人工智能技术为基础,主要有数据挖掘技术、群件技术、知识库与知识地图等。知识库及知识地图在第二章已作过介绍,此处不再重复。
1.数据挖掘
数据挖掘(data mining),又称为数据库中的知识发现(knowledge discovery in database,KDD),就是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程。简单地说,数据挖掘就是从大量数据中提取或“挖掘”知识。简而言之,数据挖掘是从大量的数据中,抽取出潜在的、有价值的知识(模型或规则)的过程。而这些过程,是数据库技术、人工智能和统计学无法单独完成的。数据挖掘能做以下六种不同事情(分析方法):
(1)分类(classification)。
首先从数据中选出已经分好类的训练集,在该训练集上运用数据挖掘分类的技术,建立分类模型,对于没有分类的数据进行分类。例如,①信用卡申请者,分类为低、中、高风险;②分配客户到预先定义的客户分片。要注意的是,类的个数是确定的,预先定义好的。
(2)估值(estimation)。
估值与分类类似,不同之处在于,分类描述的是离散型变量的输出,而估值处理连续值的输出;分类的类别是确定数目的,估值的量是不确定的。
例如,①根据购买模式,估计一个家庭的孩子个数;②根据购买模式,估计一个家庭的收入;③估计房产的价值。一般来说,估值可以作为分类的前一步工作。给定一些输入数据,通过估值,得到未知的连续变量的值;然后,根据预先设定的阈值,进行分类。例如,银行对家庭贷款业务,运用估值,给各个客户记分(score 0~1);然后,根据阈值,将贷款级别分类。
(3)预言(prediction)。
通常,预言是通过分类或估值起作用的。也就是说,通过分类或估值得出模型,该模型用于对未知变量的预言。从这种意义上说,预言其实没有必要分为一个单独的类。预言其目的是对未来未知变量的预测,这种预测是需要时间来验证的,即必须经过一定时间后,才知道预言准确性是多少。
(4)相关性分组或关联规则(affinity grouping or association rules)
决定哪些事情将一起发生。例如,①超市中客户在购买A的同时,经常会购买B,即A≥B(关联规则);②客户在购买A后,隔一段时间,会购买B(序列分析)
(5)聚集(clustering)。
聚集是对记录分组,把相似的记录放在一个聚集里。聚集和分类的区别是聚集不依赖于预先定义好的类,不需要训练集。例如,①一些特定症状的聚集可能预示了一个特定的疾病;②租VCD类型不相似的客户聚集,可能暗示成员属于不同的亚文化群。聚集通常作为数据挖掘的第一步。例如,“哪一种类的促销对客户响应最好?”对于这一类问题,首先对整个客户做聚集,将客户分组在各自的聚集里;然后对每个不同的聚集,回答问题,可能效果更好。
(6)描述和可视化(description and visualization)。
是对数据挖掘结果的表示方式。由于数据挖掘是一门新兴技术,只有10年的历史,而且它又是一门受到来自不同领域的研究者们关注的边缘学科,因此产生了很多不同的术语。除“数据挖掘”外,主要还有“数据发现”、“数据开采”、“知识抽取”、“信息发现”、“知识发现”、“智能数据分析”、“探索式数据分析”、“信息收获”和“数据考古”等。数据挖掘已被越来越多的领域所采用,并取得了较好效果,这些领域有科学研究、市场营销、金融投资、产品制造、通信网络管理等。例如,由加州理工学院喷气推进实验室与天文科学家合作开发的SKICAT(sky image cataloging and analysis tool)是第一个获得巨大成功的数据挖掘应用,已经帮助科学家发现了16颗极其遥远的类星体。
虽然数据挖掘已经受到许多关注,并获得了广泛应用,但它仍处于发展的早期,还有很多研究难题和面临的挑战,如数据的巨量性、动态性、噪声性、缺值和稀疏性,发现模式的可理解性、兴趣或价值性,应用系统的集成,用户的交互操作,知识的更新管理,复杂数据库的处理等。
2.群件技术
群件这个名词来源于Lotus,其创造了groupware这个单词,在我国被翻译成“群件”。
(1)群件的概念。
群体工作(work group)中,各工作者因为时间及所处地点的不一致,造成交流及协调的不便。群件就是针对群体工作而发展出来的技术产品,目的在于促进群体的交流合作及资源分享,充分提高群体的工作效率和质量。可以认为,群件是一个网络软件概念,它定义了由一组(群)人使用的应用程序,它是基于这样一个设想,因为网络连接用户,这些用户应当通过网络互相操作,作为一个整体而提高组的生产率。
可以这样定义群件:群件是以交流(communaction)、协调(coordination)、合作(collaboration)及信息共享(information sharing)为目标,支持群体工作需要的应用软件。群件的上述特征,我们称为3CIS。
群件的例子
电子函件是一个很好的群件例子。它能使用户间相互通信和协调活动。此处,群件是一个许多不同地方定义许多不同事情的术语。一个真正的群件包括允许不同系统上的用户能在一个项目上交互和协调工作。编辑一个文件,并把它发送给另一个用户观看还不是一个群体的例子,但它已经非常接近了。一个集中式网络查看组成员安排表,然后把会议安排在大家都能参与的时间片,这是一个群件的例子。
另外一个群件例子是,windows for workgroups中的对象链接和嵌入(OLE)特性,网上的不同用户为一个称为复合文档的主文档提供诸如图形、文本和电子表格信息这样的元件。复合文档里,元件维持一个到建立这个元件的工作站上文件的链路。如果工作站上的文件被改变了,复合文档里的链接至这个文件上的元件也改变。例如一个艺术家,任何时候只需简单地编辑存在他计算机上的文件就可以修改复合文档里的艺术品,下一次市场部打开复合文档时,艺术文件里的任何改动都自动地在复合文档中更新。
进一步说,一个调度应用程序可以在网上召开一次会议,参加者只需坐在自己的工作站旁,然后打开屏幕上的文档,并一起在文档上操作来协商做一个项目。当文档打开时,它会出现在所有参加者的屏幕上,文档中任意一个变化都会出现在每一个人的屏幕上。同步电话会议和电视会议可以帮助用户协调彼此的活动。实际上,运行于microsoft wind。ws下的桌面电视会议系统,可用来让用户在一个窗口上观看其他用户同时操作另一些窗口中的文档。
另外,一个令人感兴趣的群件概念是公告牌(bulletin board)和交互式会议。公告牌是一个能把信息传到其他用户观看,并能响应信息的地方。典型地,公司事务和日程可以发往公告牌区。热点标题会产生强烈响应和反响。人们可以从公告牌上读信息,并可以把自己的信息发往公告牌。当然,所有的对话都可以存储到盘上,并打印出来看。Instant documentation!
公告牌典型地进行消息会话,而一个交互会议是一个预定的事件,这个事件可以用一个发表独创意见的会议来类比。一个公司可以安排一次所有雇员都能对公司的政策和新产品开发提交文件的会议。强调一下,人们只有当信息滚动显示时,或自己参加时才能看到消息。整个会话能被存储和打印,以备将来参考。参与者不需打断会议就可以进入或退出,并且如果他们宁可匿名的话,还可以使用“操纵杆”来代替他们的名字。
一旦群件应用程序放在恰当的地方和用户开始从中获益,传统的通信方法就会弃之不用。由于旅行和不能有效地利用时间,开会看来是越来越不方便。实际上,会议成为每天都要举行的事情,与会人员在他们方便的时间用电子函件的方式参加会议。电子函件传递消息正成为一种与他人进行通信的好方法,尤其是其他人很难通过电话联系时。当用户可以把各种消息,诸如声音、图形和视频图像附加给电子消息,并即时发送它们的时候,即使是邮政快件似乎也过时了。
(资料来源:“群件系统的含义及其应用”,http://www.cnblogs.com/KevinOcean/archive)
(2)群件的分类。
按照前面的群件定义,广义上,电子邮件(E-mail)、电子布告栏(computerized bulletin board)、电视会议(video conferencing)、工作流管理(workflow management)之类软件都可以视为群件。我们按群件产品的主要功能来划分,大致有以下几类:
1)支持信息传递(messaging passing)类:以电子邮件为代表,如lotus cc:mail、microsoft mail等。
2)支持流程自动化(process automation)类:以工作流(workflow)及电子表格(spreadsheet)为代表,还有公文自动化软件。工作流软件,如IBM flowmark、workflow、floware、wang open workflow。
3)强调增进群体合作的软件:如视频会议,共享、共同编辑文件数据库等类型的软件。
4)综合性的群件开发平台:这类产品提供多项功能,包括工作流管理、信息传递和集成的数据库功能,拥有集成的用户开发环境,具备高度安全性,代表了群件发展的方向。主要产品有Lotus notes、novell group wise,以及microsoft exchange等。
上述产品,前三类只覆盖了群件的某部分功能,只有第四类才全面体现了群件的3CIS概念。因此,狭义的群件仅指这类综合性群件开发平台。
(3)群件的优势。
作为知识管理的重要技术平台,下面列出了一些群件的优点符合人们理想的期望,有助于知识管理。
1)在一个组织中,群件促进合作,并在一个联合项目中帮助人们进行通信和协作。
2)群件可协调人和过程之间的交互活动。
3)群件有助于规定文档流和完成一个项目必须做的工作。
4)群件把共享信息放进一个结构化的复合文档中,为用户提供了唯一的信息共享方法。文档成为集中存储共享信息的地方。
5)群件应能使合作项目中的每一个人,能以一种更有效的方法完成各自指定的工作。
6)群件只简单规定一些用现存应用程序来共享信息和帮助用户协作的方法,而不是来自某一供应商的特殊应用软件。
在许多商务活动中,群件系统的发展趋势是向内网和外网方向发展,内网和外网是建立在因特网协议(1IHTTP,TCP/IP)和相关的网络技术上的不同信息系统。它们使商业伙伴高效地共享资源,如信息交换、合作、记账、电子货币转账、供应链管理、文件交换、对话和讨论等。这项技术通常被称为虚拟专用网络(VPN),也就是允许借助因特网建造安全的私人网络的技术,利用特殊协议(隧道协议),通讯双方的计算机能够模拟私人线路进行数据交换。
在虚拟网络中,用于连接企业内部系统的虚拟网络称为企业内网,用于连接外部组织(如供应商、卖方、商业伙伴)的虚拟网络称为企业外网。当这些虚拟网络建成以后,企业仅需支付访问因特网的费用,而不需花费令人生畏的网络构建费用。随着商业环境和功能的演变,用于开放网络的工具和设施经过必要的改造后,都可以引到内网和外网之中。
内网与外网的建立为知识管理创造了良好的支撑条件和工作平台。利用这些条件和平台,企业不仅可能获取大量有用的知识,而且可能通过知识的共享与转移来提高创造价值的能力。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。