您现在的位置: 论文网 >> 公共管理论文 >> 图书馆管理论文 >> 数字图书馆中的关联书目检索推荐方法改进与设计论文

数字图书馆中的关联书目检索推荐方法改进与设计

出处:论文网
时间:2019-01-20

数字图书馆中的关联书目检索推荐方法改进与设计

  中图分类号: TN914.3?34; TP391 文献标识码: A 文章编号: 1004?373X(2017)14?0072?03

  Abstract: Aiming at poor timeliness and low accuracy of association books bibliography retrieval caused by the increase of bibliographic resources in digital library, a recommendation retrieval method of association bibliographic in the digital library is put forward, which is based on similarity label index and association rules mining. The similarity label information parameters of correlation book bibliography in the digital library are calculated. Semantic analysis of book retrieval is conducted in combination with the similarity label index. The association rules mining is used to realize information fusion and collaborative recommendation of similar users and similar bibliography in the semantic ontology model, and improve the retrieval efficiency of digital library. The simulation test result show that the recommended method has higher accuracy, compared with the traditional methods.

  Keywords: digital library; association rule mining; information fusion; bibliography retrieval

  0 引 言

  数字图书馆资源作为一种开放性的公共资源,随着大数据的更新和图书出版的增多,数字图书馆馆藏的书目规模不断增多。图书馆馆藏资源的增加和大数据信息规模的增大具有关联关系。在进行数字图书馆的资源检索和图书借阅中,需要有效的检索方法,结合图书馆管理系统的有效推荐,提高对图书资源的准确检索和获取能力,对数字图书馆的关联图书的可靠性检索成为评价图书馆的智能化和个性化服务水平的重要参考标准。研究图书馆的图书个性化推荐服务模型,对解决图书的过载借阅和用户不能有效获取有用图书之间的矛盾关系[1?2]同样具有重要意义。本文对当前国内外图书馆推荐模型研究的基础上,以协同过滤推荐和内容推荐模型为基础,提出一种基于相似度标签索引和关联规则挖掘的数字图书馆中的关联书目检索推荐方法,实现图书资源的个性化推荐。

  1 图书关联书目的相似度计算

  为了实现对数字图书馆中的关联书目检索推荐,需要分析标签的上下文信息,这就需要进行图书管关联书目的相似度计算,用户相似度计算方法包括皮尔逊相关系数法、向量余弦法、斯皮尔曼相关系数法等[3?4]。采用不同的方法计算用户的不同关联信息特征,图书检索用户在进行图书检索中,备选标签集特征向量是依赖于其所有邻居节点,对用户文档进行分析,显性特征?稻荼硎疚?:

  式中:表示用户对数字图书馆中的关联书目的推荐评分;表示用户对数字图书馆中的关联书目推荐已给出的评分;是利用式(1)求得的歧义标签的权值。则用户u对图书馆关联书目推荐的语义相关度矩阵可表示为:

  基于同义词和歧义词的协作过滤,提高推荐的可靠性,更好地反映图书内容和用户兴趣,采用余弦相似度进行图书推荐过程中的同义词过滤,余弦相似度计算式描述为:

  式中:sim(i,j)表示浏览图书的关键词和图书之间的相似度;和表示被同一用户评分同义词和歧义词的评分向量。

  采用皮尔逊相关系数(Pearson Correlation Coefficient)方法分析对图书检索中的语义隐形特征数据挖掘用户之间的关联性[5],皮尔逊相关系数相似度计算为:

  式中:表示关联规则挖掘中待推荐的图书组合集合;表示WordNet词汇本体的推荐结果平均评分。在皮尔逊相关系数约束下,得到基于相似度标签索引的关联书目推荐的皮尔逊准则为:

  分析标签的上下文信息进行图书数目的关联行为替换,构建图书馆关联书目相似度约束下的优先级列表见表1。

  通过表1所示的相似度约束下的优先级列表进行书目检索的协同过滤推荐控制,确定一个标签的涵义,根据优先级列表,分析标签的上下文信息,采用皮尔逊相关系数相似度算法,进行推荐模型的积极评估和消极评估。   2 基于关联规则挖掘的推荐方法实现

  根据上述关联规则设计方案,在语义本体模型中通过关联规则挖掘实现对相似用户和相似书目的信息融合和协同推荐,计算相似用户对图书检索中的语义信息的相似度。用表示用户感兴趣的图书集,间的相似度,其值在0和1之间变化,相似用户对图书感兴趣时,,否则。最终的推荐图书包含在图书集,中,语义本体为,其中的计算公式为:

  式中:和分别表示用户感兴趣的图书集的目标用户相似的用户集数目;表示推荐图书的公共结点数目。的计算公式为:

  式中:表示相似用户集中相似标签之间的词义消岐向量;,分别表示图书书目集,中推荐结果生成器对备选标签集的数目。

  计算相似标签之间的相似度,计算完和后,对结果进行综合,并对每个语义返回相似度值,形成语义相似度,如下:

  式中,当时,查询图书标签有最高的相似度值,在协同过滤推荐模块中计算中的连接度如下:

  式中,表示图书集中选出相似用户感兴趣的图书。根据用户查询请求,从WordNet词汇本体数据库中提取标签信息进行查询索引,从而将经过过滤的图书集推荐给目标用户,实现关联书目的检索推荐。

  3 实验结果分析

  在Matlab仿真软件中进行数字图书馆关联书目检索推荐的仿真分析,实验采用大型网络数字图书馆的BookCrossing数据集作为测试集,测试数据[6]有1 000 000条,使用爬虫程序采集图书标签数据进行语义分析和信息加载,关联规则的阈值设定为:规则1,0.033 5;规则2,0.045 5;规则3,0.054 59;规则4,0.290 9;规则5,0.098 5;规则6,0.089 76;规则7,0.087 53;规则8,0.257 8。以图书书目检索推荐准确率(Precision,Pr)、召回率(Recall,Re)、准确率和召回率的相关性关系R为测试指标,R值越大,表示推荐的可靠度越高,采用不同推荐算法在三组实验中取平均值,得到不同方法进行图书推荐的测试结果见表2。

  为了更好地直观分析,对上述数据进行绘图处理,得到不通推荐模型进行图书推荐的准确性和召回性对比结果如图1所示。

  分析上述实验结果得知,采用本文方法进行数字图书馆的关联书目推荐,准确度较高,可靠度较好,表明本文方法具有优越性。

  4 结 语

  为了提高数字图书馆的图书推荐和检索能力,本文提出一种基于相似度标签索引和关联规则挖掘的数字图书馆中的关联书目检索推荐方法。首先在传统的内容推荐和协同过滤推荐的基础上,计算数字图书馆中的关联图书书目的相似度标签信息参量。然后在相似度便签索引下进行图书检索的语义分析,在语义本体模型中通过关联规则挖掘实现对相似用户和相似书目的信息融合和协同推荐,提高了对数字图书馆的检索效能。研究得出。本文提出的推荐方法相比于传统方法具有较高的推荐准确性和可靠性。

数字图书馆中的关联书目检索推荐方法改进与设计

论文搜索
关键字:馆中 数字图书 关联 书目 检索 数字
最新图书馆管理论文
图书馆图书资料信息化管理研讨
试论如何加强图书馆人力资源管理与创新
试论高校图书馆动态化管理建设
物联网技术在图书馆管理中的运用探讨
高校图书馆管理人员素质提升影响因素探讨
知识管理与高校图书馆服务创新的构想
新媒体时代公共图书馆信息化发展存在的问题
试论数字环境中图书馆管理创新策略
高校图书馆书库管理与读者借阅服务探讨
论乡村文化振兴视域下乡镇图书馆的建设
热门图书馆管理论文
浅谈数字图书馆建设
走向公共管理的治理理论
知识经济时代的图书馆人力资源管理创新
网络环境下我国图书馆服务模式的演变
创新:迈进新世纪的图书馆管理
地方高校图书馆数字化建设若干问题的探析
新公共管理:当代西方公共行政的新趋势
高校图书馆如何为高等函授教育服务
信息资源:特点·价值·机制
浅析高校图书馆的管理创新