您现在的位置: 论文网 >> 公共管理论文 >> 图书馆管理论文 >> 基于大数据的数字图书馆信息服务研究论文

基于大数据的数字图书馆信息服务研究

出处:论文网
时间:2015-12-31

基于大数据的数字图书馆信息服务研究

  中图分类号:G250.76 文献标识码:A 文章编号:1007-9416(2015)07-0000-00

  1 概述

  随着数字化信息的增多,以及用户本身上传、下载等操作所产生的大规模的数据,使数字图书馆逐渐呈现“大数据”的特征。用户获取信息的方式的变化,也对数字图书馆的信息服务提出了更高的要求,想从结构复杂,种类繁多的大量数据中,快速获取用户需求的有价值的信息,就需要大数据处理技术的支撑,如云计算等。大数据具有规模性、多样性和高速性的特征。大数据的数据结构就包括结构化的数据,半结构化的数据和非结构化的数据,能大规模快速处理数据流,能满足用户的个性化信息需求,这就是大数据和数字图书馆的契合点。将大数据对数据处理技术应用于数字图书馆,数字图书馆的大数据的架构主要从数据采集、数据存储、数据处理,数据分析及数据应用四个层面进行如图1所示。

  2 基于大数据的数字图书馆的数据信息服务内容

  基于大数据的数字图书馆信息服务内容将从信息资源的发现,信息资源存储,信息资源组织和信息资源检索四个方面进行探索,研究大数据对数字图书馆信息服务的影响。

  2.1 信息资源发现

  在大数据环境下,数字图书馆的信息资源丰富,数字资源存储在结构不同的数据库中,分布广泛,数字图书馆信息服务就是利用大数据技术挖掘分布广泛的大量异构的数据信息资源之间的关系,为用户提供满足其所需信息资源。首先要利用大数据技术发现和处理数字化信息资源,包括馆藏信息资源和用户信息资源。对用户行为信息和用户信息需求进行挖掘,挖掘出用户的信息行为与数字化信息资源之间的潜在关系,从而为用户提供更好的信息服务。在大数据环境下,数字图书馆的信息资源发现有用户行为发现和用户信息需求发现。数字图书馆的信息资源发现模式如图2所示。

  对用户行为的发现通过用户网站注册的信息,如用户的姓名、性别、年龄、知识结构等信息,通过对这些信息的发现、采集、去重等处理后获取用户的信息,也可以通过与用户实时交流沟通获取用户的信息,填写问卷调查表获取用户的信息,将用户的这些信息录入数据库中,为用户建立用户个人信息库存储在服务器上。

  对用户信息需求的发现。对用户信息需求的发现是建立在对用户行为的基础上。可以利用大数据挖掘技术对用户的行为如浏览的网站、检索留下的痕迹、下载的数字化信息资源、分享的信息资源、评价信息等挖掘,发现用户真实的信息需求和潜在的信息需求,并为用户建立用户需求匹配资源库,通过分析为用户提供页面定制、信息推送服务、学术信息导航服务和参考咨询服务等个性化的信息服务。在大数据环境下,数字图书馆海量的数字信息形成了庞大的数据仓库,根据用户访问的系统日志,通过数据挖掘技术和数据分析技术找出用户对不同主题的信息资源的需求,大数据能实现对实时动态的数据进行处理和分析。对用户在网络上的浏览历史、检索关键词等信息进行分析和挖掘,发现用户个性化的信息需求。有助于图书馆对读者的信息需求和信息个性化服务,真正实现用户个性化信息服务和定制化信息推送。

  2.2 信息资源的存储

  在大数据环境下,如何解决呈爆炸式增长的数字化信息资源数据的存储问题,更好的满足用户的个性化信息服务。由于海量数据信息的数据结构不同,应用云计算平台的数据存储技术可以解决异构的数据存储问题。它的存储空间是无限制的,可以实时更新数据。

  2.3 信息资源组织

  海量的数字图书馆信息资源包括馆藏实体信息资源、虚拟信息资源和网络信息资源等。数字图书馆作为一种可检索复用的庞大信息系统,海量的数字图书馆信息资源为用户提供可检索和操作的入口,从而达到利用数字资源的效果。为了便于用户获取有效信息资源,进行信息共享,面对多种结构的数据信息,需要对数据进行处理,将搜集的信息经过科学的优化、加工和分析整序,使数据呈现出一定规律便于有效利用。可以利用流处理和批处理方式来进行信息资源组织。大数据信息资源组织流程如图3所示。

  2.4 信息检索

  基于大数据的数字图书馆如何快速高效地检索信息,为用户提供个性化的信息需求服务是目前研究的一个难点。大数据环境下,数字图书馆的数字化信息数量大,种类多,数据价值联系低,就要求搜索引擎实现智能化实时优化需求,个性化搜索,满足移动搜索的需求。准确定位用户真正的信息需求,真正实现用户个性化信息检索。在大数据的平台中数据会实时更新,搜索引擎要具备当这些大数据引进时能实时自我补充和完善,保持相关数据的动态更新,从而确保检索结果的准确性,全面性,实时性,提高用户信息检索的满意度。

  3 基于大数据的数字图书馆的信息服务模式

  为了能满足用户的个性化信息需求,需要挖掘用户的实际信息需求和潜在的信息需求,并通过可视化技术将挖掘到的信息反馈给用户。通过提高对用户信息需求的预测判断能力,实现为用户提供定制化的信息服务模式。基于大数据的数字图书馆的信息服务具有主动服务意识、构建交互式共享平台、个性化信息推送服务的特征。建立在大数据技术上的数字图书馆信息服务模式为面向数据提供服务。从数据、信息、知识、智慧四个层次展开服务。主要包括一站式资源服务、学科知识服务、信息可视化服务和智慧服务。

  3.1 基于数据整合的一站式资源服务

  在大数据环境下,数字化的信息资源是庞大的,数据结构复杂、数据类型多,一个图书馆要收集到全部的信息资源从理论上看是可以实现的,但实际操作却是非常困难的。因为这些信息资源包括现实馆藏资源和虚拟馆藏资源。实际馆藏资源包括本馆自建的数字化信息(馆藏书目数据库、特色馆藏数据库、电子出版物、网上采集并下载到本地服务器中的信息资源);虚拟馆藏资源包括网络数据库、在线出版物、网络动态信息。由于这些数据来源于不同的数据库和知识库,尤其是用户通过社交网络产生的信息资源,将这些信息资源整合在一起需要大数据技术。图书馆可以采取措施提高用户对各种信息资源的开放式存储,使用户由被动的信息接受者向主动的信息发布者转变。大数据是基于云计算等技术, 实现从海量复杂的数据中及时快速的采集、抽取与集成,将这些大量的,结构复杂的数字化信息资源整合在一起,去除重复的数据得到可信赖的数据,并将它们存储到不同的数据库,或虚拟存储空间,通过大数据的智能化检索技术为用户提供一站式的资源服务。   3.2 基于数据分析的学科知识服务

  在大数据环境下,数字图书馆逐渐形成了学科生态系统,为用户提供信息资源平台,能为教师,学生和科研人员提供相关的学科专业知识服务,通过不同用户对同一个学科的信息资源检索浏览下载的频率进行分析,找出某段时间内用户对学科的哪些主题感兴趣,并通过数据挖掘和各种分析方法预测出学科研究的热点和学科与学科之间的交叉主题的研究。通过数字图书馆的借阅系统对用户借阅数据的统计和图书馆流通日志进行挖掘,发现用户,图书,信息资源之间的知识网络。通过构建知识网络来更好地为用户提供学科知识服务。

  3.3 基于数据应用的信息可视化服务

  信息可视化是将抽象的数据通过技术处理形成可以直接观看的形式。在大数据中,隐藏着大量的信息,通过hadoop技术、云计算等对大数据进行分析,在大数据中挖掘出可以利用的信息。数字图书馆在大数据环境下的数据结构复杂,分布广,将信息可视化技术应用到数字图书馆的数据分析上,可以很好的解决异构数据的问题。通过可视化的方法将数据集中的数据和没有看见的抽象数据的语义关系表示出来,反馈给用户。用户可以通过信息可视化技术发现这些数据集中有用的潜在的信息资源,为用户在获取,整合,处理和利用信息方面提供便利。在大数据环境中,为了更好的满足用户的个性化信息需求,数字图书馆为用户提供基于数据应用的信息可视化服务,是图书馆未来信息服务的发展趋势。

  3.4 基于数据挖掘的智慧服务

  面对海量信息资源,要实现个性化的信息服务,基于数据挖掘的智慧服务通过对用户的信息需求进行分析,处理,提供专业化,智能化的信息服务。主动为用户提供定制化服务。通过将大数据的挖掘技术应用到数字图书馆的信息服务中,提高用户对信息服务的满意度,从而实现基于数据挖掘的智慧化服务。

  4 结语

  将大数据的数据处理技术应用到数字图书馆对信息资源处理中。构建基于大数据的数字图书馆信息服务的模式,来实现信息资源的共享,从海量数据中实现快速对信息资源进行定位。为用户提供全面准确的信息资源。使用户获取知识更便捷,获取形式更丰富多彩,并为用户提供可视化的信息资源。

基于大数据的数字图书馆信息服务研究

论文搜索
关键字:馆信息 数字图书 基于 数字 数据 研究
最新图书馆管理论文
浅谈图书馆在数字人文服务研究中的实践与优
网络环境下优化图书馆阅览服务探讨
浅析高校图书馆读者服务管理
浅析计算机管理系统在校园图书馆中的应用
高校图书馆红色文献阅读推广研究
图书馆智慧媒资管理平台建设实践研究
图书馆图书资料信息化管理研讨
试论如何加强图书馆人力资源管理与创新
试论高校图书馆动态化管理建设
物联网技术在图书馆管理中的运用探讨
热门图书馆管理论文
浅谈数字图书馆建设
走向公共管理的治理理论
知识经济时代的图书馆人力资源管理创新
网络环境下我国图书馆服务模式的演变
创新:迈进新世纪的图书馆管理
地方高校图书馆数字化建设若干问题的探析
新公共管理:当代西方公共行政的新趋势
高校图书馆如何为高等函授教育服务
信息资源:特点·价值·机制
浅析高校图书馆的管理创新