进入21世纪,随着计算机技术、网络技术、通信技术的高速发展,信息的存储和处理能力得到迅速提高,信息量持续增长,纸质文档被不断转变为电子文档,可以说,我们正在被呈几何量级产生的信息所淹没。但大量的信息却因为没有经过挑...[继续阅读]
海量资源,尽在掌握
进入21世纪,随着计算机技术、网络技术、通信技术的高速发展,信息的存储和处理能力得到迅速提高,信息量持续增长,纸质文档被不断转变为电子文档,可以说,我们正在被呈几何量级产生的信息所淹没。但大量的信息却因为没有经过挑...[继续阅读]
标引(indexing),简单说是一种标识和引导,是对文献是什么信息的描述;具体是指在分析文献内容或情报问题的基础上,用某种索引语言或标识符号把文献的主题概念及其他有检索意义的特征标识出来,作为情报存储和检索的依据的处理过...[继续阅读]
标引按照使用的标引语言或标识符号的类型,可分为分类标引和主题标引;按照使用的标引设备,可分为手工标引和自动标引。1.2.2.1 分类标引分类标引,又称文献分类或信息分类,是依据特定的分类规则,对文献进行分类标识的过程。分类...[继续阅读]
自动标引的研究至今大致经历了三个阶段:第一阶段是20世纪50年代至90年代初。这个阶段主要是关于关键字提取方法的研究。第二阶段是20世纪90年代至90年代末。这个阶段传统的自动标引方法的效率已达到极限,因此自动标引方法的研...[继续阅读]
自动标引方法主要包括统计标引法、语言分析标引法、人工智能标引法、网页标引法、概率标引法、词典标引法等。下面对这些方法做一详细介绍。1.3.2.1 统计标引法在各类自动标引的方法中,出现最早且被广泛持续使用的是统计标...[继续阅读]
1.3.3.1 自动标引方法研究的不足自动标引通过近几十年的发展,已取得了长足的进步,但国内自动标引的研究仍存在不足,主要表现在以下几个方面。1.中文分词算法存在缺陷找出各知识单元,是进行标引的第一步,但由于中文的特殊性,使...[继续阅读]
标引分为分类标引和主题标引,相对应的,标引的标准也分为分类法和主题词法。1.4.1.1 分类法基于分类法的标引标准发展较早。早在1876年,杜威就创立了《杜威十进分类法》(Dewey Decimal Classfication,DDC),可以说是开辟了图书分类法的新纪...[继续阅读]
元数据,即数据的数据,是用来描述数字化信息资源并确保这些数字化信息资源能够被计算机自动辨析、分解、提取和分析归纳的一种框架或一套编码体系。④基于元数据的信息资源描述标准目前使用最广泛的有两种:一种是使用较早...[继续阅读]
随着计算机网络技术以及通信技术的发展,网络信息资源的数量呈几何级增长,已经成为信息资源的主体,因而网络信息资源标引也成为现代信息资源标引中首先要解决的问题,其标准也在传统标准的基础上产生了新的变化。1.4.3.1 MARC在...[继续阅读]