在我们的办公室里,小山一样堆满了数不清的文件、资料,还有大量的信息储存在我们的电脑中。而我们所需要的知识就隐藏在这庞大的资料中,我们每次都象大海捞针一样在庞大的资料堆中寻找我们需求的知识,几乎可以确定,我们的努力往往是徒劳的。
对许多知识工作者来说,在庞大的信息库中寻找需求知识的工作是一项既艰巨又严峻的任务,于是他们开始寻求专业软件的帮助。现在,知识工作者开始由软件应用转向内容管理(一个十分广泛的概念,包括文件管理的工具和技术),协同工作,检索,文档挖掘,课题分类,综合分类等。所有这些方法都基于为所有文档内容规定一定的结构,因此知识工作者可以更容易查找和检索到相关内容。
新技术的应用也带来了一定的问题。我们在为文本资料划分结构的时候,必须考虑到特殊应用者的需求。例如,报社的编辑可能需要按题目来查找文章,一定的文章可以找到相应的作者。而财经分析员需要按公司和资金来查找相应公司。
因此,我们能够应用的最好的办法是“内容管理应用”(content management appliation),模仿本领域知识工作者的工作,自动对内容进行分类,这样经过内容结构分析的文档,可以为我们在大量资料中显示出我们需要的知识信息。
知识工作者的需求
知识工作者希望内容管理应用达到什么样的效果呢?正如我们设想的那样,他们无一例外地清晰地表达出他们的4点要求。
条理化:未经整理的资料没有区别的、混乱的放在了一起。对大多时知识工作者来说,他们希望所有的资料都能按一定顺序、有条理的存放。一个知识型组织整理它的资源之前,必须先设计一个分类体系,包括各类、各级主题类别。有许多种分类体系,象文档目录、编目、类别和分类体系。不论我们怎么命名,分类是文件条理化必备工具,因此它是内容管理应用最重要的组成部分。
模仿知识工作领域:许多组织在实施内容管理软件之前,按商业流程和信息结构来整理混乱的信息资源。这些组织不愿为内容管理应用放弃和改变原有的文件结构。事实上,这种改变是完全必要的。例如,大多数市场研究公司在他们公布的研究报告中把他们的研究市场分成几个部分。这种市场划分可以作为分类系统建立的参考。目前许多组织已经在Lotus Notes或Microsoft Exchange系统中进行了文档的分类保存,还有一些公司也按一定目录对文件资料进行分类,这些都可作为分类体系设计的参考。
软件自动分类:面对海量的文档资料,知识工作者急需对他们进行分类管理。因此,要内容管理应用就需要具备自动分类的功能。分类工具能自动对分档进行分析处理,并通过语义进行分析,确定它的类别,之后在分类体系中自动添加相应词条。
展现应用门户:知识工作者愿意把公司门户作为内容管理应用的选择平台。
分类工具是知识工作者最常用的工具,公司门户界面通常会显示出分类工具。内容管理应用从文档中聚集信息。各个知识工作者的需求各不相同,公司门户可以对网站内容进行个性化处理。
综合上述四点需求,知识工作者需要对大量文档资料进行分类处理,但分类一定要符合他们的需求。他们同样需要使用软件来进行分类。另外,内容管理应用需要通过门户来展现。从中我们可以看出,所有的要求都围绕者分类体系,可见分类对内容管理应用具有的重大意义。
走两者结合的道路
在二十世纪九十年代末期,经销商大肆宣扬他们的文本提炼和自动分类工具是如此有效,可以便利的组建成一个分类体系。现在这种谎言已经被揭穿,他们不得不承认,他们的软件根本达不到普通知识工作者的手工劳动的准确率。同时,另一些利用知识工作者手工分类的公司也发现,他们根本无法应付目前大量的信息资料。这两种极端方法的失败,促使我们创造介于两者之间的新的方法——内容管理。
现在,知识工作者利用各种工具创建高质量的分类体系,并建立分类规则。
一旦分类体系建立完成,文档资料可以手工也可自动归档整理。一些组织规定所有文档必须从属一个固定的分类体系(当整个文档体系的结构是简单的、固定的),而许多组织允许分类软件自动创建新的标目。内容管理应用吸收两种方法的优点,
寻找适合本公司需求的方法
即使你同意软件自动和人工分类相结合的做法是最好的,那你也必须解决两者如何配合的问题。
快速:自动分类的好处是能快速处理大量资料,而它的缺点是准确性不高。
有效:人工分类好处在于正确性比较高,缺点是你必须雇佣大量熟练的知识工作者。
图书管理员人工操作:真正的知识型企业雇佣图书管理员设计分类体系和进行每天的分类工作。图书管理员的优势在于他们处理文件的准确性和他们对相关领域的深入理解。确定是雇佣他们昂贵的工资和他们处理文档的速度。
分类学者手工分类:从图书管理专业分离出的新的研究领域,分类学者都经过高级的专业训练,对于普通公司来说聘请如此高水平的专家是不切实际也是不现实的。分类学者通常在专门的学术研究机构工作。进行复杂的和技术性更强的分类研究工作。
由用户手工分类:一些公司知识简单的利用普通的员工进行文档分类。但大多数人不熟悉分类的专门知识,导致他们进行错误的分类。
关键词检索:检索严格来说不能作为一种分类技术,但在实际应用中经常被使用。关键词检索体系可以有效对大量文档进行处理,但因为缺少分类体系,很少能精确查找到相关信息。
概念自动分类:这种分类体系是基于概念库产生的,有利于从大量资料中查找到新的概念。但这种方法对于特定组织商业领域来说往往是无效的。
规则自动分类:许多分类编辑工具要求制定相应的分类规则来进行分类。这首先需要专业的图书管理员花费大量的时间和经历。但对今后的分类效果来说,这种努力往往是值得的。
手工—自动结合:很明显,手工和自动分类适当结合分类是实施文档内容管理的最佳方法。
为达到一定的平衡,你应该首先确定对于你的组织来说速度和效果哪一个更主要。对许多组织来说,首要问题是明确多少和什么样的错误你能容忍。一旦明确了目标,你可以决定在那些方面更多地使用机器分类,在那些方面更多地利用人力。
确定结构
根据用户的需求,分类体系是内容管理应用中最重要的组成部分,它可以使繁杂的文档资料变得有序。因此,如果分类体系不能满足用户得需求,内容管理应用也将不被采用。用户的接纳才是一个IT项目成功的基准。值得注意的是,知识工作者通常不会会费大量金钱来购买自动生成分类体系,因为自动分类工具相对手工分类和现有的体系来说,准确率太低了。
内容管理应用只有你采用正确的分类策略后才可能取得成功。
【作者】刘琳 编译 来源:www.intelligententerprise.com