- 国外图书情报知识图谱实证研究
- 肖明
- 3387字
- 2020-06-24 23:21:44
1.2 研究内容与研究方法
1.2.1 研究内容
本书研究采取的逻辑主线是在明确国外图书馆学、情报学概念和范围的基础上,以1976年以来国外图书馆学、情报学研究的发展轨迹及其变革历程为背景,遵循“历史主线”和“动态演化”规律,以国外图书馆学、情报学期刊及其所刊载的论文及引文数据作为基础,综合运用科学计量学方法和信息可视化技术,不仅绘制了不同类型的国外图书馆学、情报学知识图谱,而且进行了认真解读和详细分析。
概言之,本书主要包括以下研究内容。
1. 知识图谱理论
知识图谱将复杂的学科知识领域通过数据挖掘、信息处理、知识计量和图形绘制而显示出来,使人们得以了解某个学科、研究领域、期刊、甚至某位学者在科学知识版图中所处的位置。知识图谱是一个多学科交叉的领域,它的兴起主要与科学计量学领域的共词分析法、社会学领域的社会网络分析法、物理学和系统科学领域的复杂网络研究以及计算机科学领域的信息可视化技术等理论与方法的兴起和发展密切相关。但遗憾的是,国内在这些方面的研究目前还不够深入。本书拟在广泛调研的基础上对此展开系统研究。
本书除了对图书馆学、情报学知识图谱的相关理论进行梳理外,还对其中涉及的多种方法以及用到的不同数据来源、可视化工具软件进行介绍和评介。
2. 知识图谱方法
绘制学科知识图谱时主要使用词频分析、共词分析、共被引分析、因子分析、多维尺度分析、聚类分析、社会网络分析等多种方法。
①词频分析法。词频分析法是文献计量学的传统分析方法之一,其中的词频统计、关键词分析经常被用来描述某学科领域的研究状况,进而揭示该领域的研究热点和发展轨迹。
②共词分析法。共词分析法是一种内容分析技术,它利用文献集中的词汇对或是名词短语共同出现的情况,来确定该文献集所代表学科中各个主题之间的关系。一般认为词汇对在同一篇文献中出现的次数越多,则代表这两个主题的关系越紧密。因此,统计一组文献的主题词之间两两在同一篇文献中出现的频率,就可以形成一个由这些词对关联所组成的共词网络,网络内节点之间的远近便可反映主题内容之间的亲疏关系。共词分析正是以此为原理,将文献主题词作为分析对象,利用包容系数、聚类分析等多种统计分析方法,将众多分析对象之间错综复杂的共词网状关系简化为以数值、图形等形式直观表示出来的过程。共词分析同样也可以用来分析作者合作等情况。
③引文分析法。引文分析法是指对大量的引文数据进行定量分析研究,即利用各种数学和统计学方法以及比较、归纳、抽象、概括等逻辑方法,对科学期刊、论文、著者等各种分析对象的引用与被引用频率等进行分析,以便揭示其数量特征和内在规律。概言之,引文分析追寻的是文献的引用和被引用之间重要的关联关系,通过找到一系列内容、主题相关的文献,就可以探测某些学科观点的演化发展脉络,以及学科发展的动态轨迹、走向和演化规律。
④共引分析法。共引分析法是指两篇或两篇以上的文献同时被其他文献引用。共引分析最大的优势是其客观性、分类原则的科学性以及数据的有效性。共引分析还可以进一步细分为文献共引分析、期刊共引分析、作者共引分析、学科共引分析等子类型。
⑤多元统计分析法。多元统计分析法是对若干(可能)相关的随机变量观测值的分析。“维度降低技术”是多元统计分析的一个重要特征,它主要包括因子分析(主成分分析)、多维尺度分析以及聚类分析。
⑥社会网络分析法。社会网络分析法也称为“结构分析”,并不是一种正式的理论,而是一个广义的研究社会结构的战略,起源于人类学家对复杂社群中人际关系的探讨,是对社会关系结构及其属性加以分析的一套理论和方法。在科学合作网络中,如果两位科学家共同发表了一篇合作文献,就可以界定他们之间存在着联系,能够组成一个适度规模的合作网络。例如,在本书研究中,笔者就以图书馆学、情报学论文的合著者作为分析对象,将他们之间的关系视为科研合作网络关系,并进行相应的社会网络分析。
3. 知识图谱应用
在本书研究中,笔者以国外图书馆学、情报学期刊及其所刊载的论文及引文数据作为基础,综合运用科学计量学方法和信息可视化技术,分别绘制包括国外图书馆学、情报学发展轨迹、研究领域、研究前沿、合作网络等在内的不同知识图谱,试图描述不同时段的国外图书馆学、情报学特点。
①国外图书馆学、情报学发展轨迹知识图谱。先将不同时段论文的关键词进行规范化、标准化处理,然后运用词频分析、共词分析、多元统计分析等方法,以这些关键词之间关联关系的强弱来挖掘学科知识结构之间的亲疏程度,从而将海量的文献数据转换成可视化的知识图谱,客观、形象地展示出不同时期高频关键词所代表的研究热点的变迁,为考察国外图书馆学、情报学的学科演进全景提供一个新的视角。
②国外图书馆学、情报学研究领域知识图谱。首先在国外引文数据库中下载作者的引证数据,分析国外图书馆学、情报学高影响力作者及其影响力变化。然后,运用作者共被引分析法,绘制国外图书馆学、情报学研究领域的知识图谱,从而揭示国外图书馆学、情报学研究领域的演进,即通过国外图书馆学、情报学领域作者的共被引情况,分析和发现国外图书馆学、情报学的研究领域及其特点。
③国外图书馆学、情报学研究前沿知识图谱。通过对国外图书馆学、情报学文献的参考文献进行文献同被引分析,分别利用CiteSpace等软件来展示国外图书馆学、情报学文献共被引的群体网络结构及其变化,科学、直观地识别学科前沿的演进路径以及学科领域的经典基础文献,从而揭示国外图书馆学、情报学的研究前沿及演化过程。
④国外图书馆学、情报学合作网络知识图谱。利用社会网络分析方法,对论文的作者及其所属机构进行定量分析,以可视化的知识图谱来展示国外图书馆学、情报学的作者合作网络以及机构合作网络,展现出由核心合作者和典型机构等构成的国外图书馆学、情报学合作网络结构。
1.2.2 研究方法
在科学研究领域,研究方法是打开科学宝库的钥匙,是驶向真理彼岸的航船。
本书研究是在传统文献研究法和比较分析法的基础上,采用科学计量学方法与可视化方法相结合的知识图谱绘制方法,将定量分析结果与前人定性研究的结论进行比较,以验证结论的有效性,并结合定性分析的方法,深入诠释不同知识图谱的定量分析结果。
1. 文献研究法
文献研究方法主要是指搜集、鉴别、整理文献,通过对文献的加工形成对事实的科学认识这样一种方法。本书通过对已有资料进行阅读和分析,全面、系统地归纳国外图书馆学、情报学的学科要素、历史脉络和研究方法。同样,本书归纳了知识图谱的构建方法、可视化软件及其应用领域,这个归纳过程本身就是对已有知识再造的过程,同时也为本书的进一步研究提供了坚实的理论依据和方法基础。
2. 比较分析法
比较是人类认识事物的一种基本方法。马克思和恩格斯在《德意志意识形态》中指出,比较解剖学、比较植物学、比较语言学“这些科学正是由于比较和确定了被比较对象之间的差别而获得了巨大的成就,在这些科学中比较具有普遍意义(28)”。
本书拟运用比较分析的方法,绘制国外图书馆学、情报学在不同历史阶段的发展轨迹、研究领域、研究前沿、合作网络等知识图谱,分析其变迁特征,并用可视化手段来展示国外图书馆学、情报学的学科全景,为进行科学合理的学科布局、把握重点研究方向、选择前沿课题奠定实证基础。
3. 科学计量学方法
科学计量学方法是一种基于数学和统计学的定量分析方法。它以各种科学文献的外部特征作为研究对象,以输出量是量化的信息内容为主要特点,采用数学与统计方法来描述、评价和预测科学技术的现状与发展趋势。科学计量学方法研究的对象可以是一切与文献有关的媒介以及特征(例如,引文、所属学科、主题词、关键词、作者所属的机构、地区和国家等)。本书研究中应用的科学计量学方法主要包括词频分析法、共词分析法、共被引分析法等,这些方法需要与信息可视化方法进行融合,才能以人们容易辨识的知识图谱方式展现出来。
4. 信息可视化方法
信息可视化方法是指将抽象数据以可视化形式表示出来,以利于进行数据分析、规律发现和决策制定,其内涵就是将数据通过图形形象直观地展现出来,并且找出数据背后蕴含的信息。该方法能够实现对海量信息数据的分析和提取,并将原始数据间的复杂关系、潜在信息以及发展趋势,以图形或图像等为人们所容易辨识的方式展现出来。本书应用的信息分析方法主要包括聚类分析(29)、因子分析(30)、多维尺度分析(31)、社会网络分析(32)等,这些信息分析方法之间需要进行有机的融合,才能绘制出主题研究等知识图谱。