〔摘要〕现有个性化图书推荐没有考虑受纸质图书的复本,构建读者及纸质图书属性矩阵、读者借阅偏好矩阵,定义基于页数的借阅时间、新书、图书类别的借阅权重。建立读者借阅偏好矩阵和读者属性矩阵的关联、读者借阅偏好矩阵和纸质图书属性矩阵的关联。根据教育部对高校大学生专业课程设置的特点、读者借阅记录的统计,在图书馆书库存在复本的情况下区分专业、非专业纸质图书推荐。在真实的借阅记录数据集上,实验验证提出方法的有效性。
〔关键词〕读者属性;纸质图书属性;读者借阅偏好;专业纸质图书推荐;非专业纸质图书推荐
〔中图分类号〕tp393.1〔文献标识码〕a〔文章编号〕1008-0821(2013)08-0068-05
随着高校数字图书馆图书的增多,读者不知道如何在几十万、几百万的馆藏图书中快速找到自己偏好的图书。于是出现了个性化图书推荐系统,通过web服务器收集图书信息[1]、借阅时间评分[2]、类别[3]、图书和用户多特征[4]、聚类[5]等推荐技术,分析读者的借阅记录、行为,获取读者的借阅偏好,向读者推荐图书,实现个性化服务。
例如:针对目前个性化推荐服务推荐质量不高的问题,将数据挖掘中的关联规则应用到真实的借阅记录[5]。根据读者对图书借阅记录,建立读者——图书借阅网络、读者——读者借阅网络,将不同背景的读者联系,构建个性化图书借阅推荐系统[6]。研究图书和作者推荐,提出一种组合两种基于项目协同过滤算法来预测读者所喜欢的图书和作者,扩展作者预测到图书列表,帮助读者决定要看哪种书,并在litrec数据集中测试提出的算法。为处理大学图书馆信息超载问题[7]。文献考虑读者借阅图书的主要目的是课程学习和学术研究,根据图书馆借阅日志,提出基于项目分类的协同过滤算法和基于概率的算法[8]。认为文学阅读或休闲阅读不同于科学阅读,因为读者寻找图书的目的不仅仅是图书的主题,还包括作者、图书的写作风格。在litrce数据集中证实了图书的写作风格影响读者选择图书,图书的目录、写作风格特点可用于提供图书推荐效果[9]。在图书馆整合基于问题的学习(pbl)模式和图书资源,提出一种新的智能手机位置感知的图书推荐系统(imlbrs),使用地图导航和图书推荐功能搜索图书[10-11]。针对数据稀疏性问题,把读者——资源交互作为图来分析,在网络模型中采用链路预测方法推荐图书[12]。针对推荐系统不能分析图书的信息、缺乏反馈信息给读者、不能为读者提供足够的信息决定是否图书的问题[13]。利用聚类,为背景相异的读者提供电子图书个性化推荐、个性化荐购[14]。
另外,传统基于协同过滤的电子商城商品推荐思想:如果一些用户与目标用户对某些商品的评分比较相似,认为这些用户是目标用户的最近邻居,目标用户对未评分商品的偏好等同于最近邻居对该商品的偏好。推荐方法面临用户评分数据稀疏时用户共同评分项目很少的问题。电子商品、电子图书没有受到复本的限制,同一时间允许购买、借阅的次数不受限制。但高校图书馆的馆藏纸质图书受到复本的限制,每种纸质图书的复本数一般为2~5册,若纸质图书推荐仍然单纯以电子商品推荐中的共同评分的项目集合为依据,将导致同一时间段能借阅同一种纸质图书的共同读者更加少。若要推荐给读者的某种纸质图书的复本在某个时间段全部被外借(即该种纸质图书没有复本在架),则需要借阅该种图书的读者只能等到该种图书的复本归还后才能借。而当该类图书的复本归还图书馆时,之前想借阅该书的读者可能已经不需要借阅该书,或已经忘记要借阅该书了,这影响图书馆对读者的服务。
通过对读者借阅不同类图书的偏好进行统计,发现借阅专业类图书、h(语言文学)类图书的时间比较长,借阅其他类的时间短[17]。因为学习专业类、语言类图书,需要读者花费很多的时间去理解、记忆很多内容,而其他类图书只需要大致的阅读即可。但现存的图书推荐技术,单纯的把读者借还图书的时间间隔作为读者对图书的偏好,没有考虑到相同页数不同类别的图书对需要阅读时间的差别。通过对读者成绩排名与读者借阅专业图书的偏好情况进行研究,发现大部分的读者,越偏好于借阅专业图书,成绩排名越靠前[18]。现存的推荐方法只追求推荐的准确率、覆盖率,不区分专业图书与非专业图书推荐对读者成绩的影响。
文章以高校本科生作为读者借阅偏好的研究对象。首先建立读者属性矩阵
、纸质图书属性矩阵、读者借阅偏好矩阵。通过借阅证号建立读者借阅偏好矩阵和读者属性矩阵的关联,通过索书号建立读者借阅偏好矩阵和纸质图书属性矩阵的关联。定义页数的借阅时间权重、出版年份的新书权重、图书类别的借阅权重。最后,根据大学阶段课程设置的特点、读者借阅偏好,分别向读者推荐有复本在架的专业纸质图书和非专业纸质图书。
2纸质图书推荐
2.1专业图书借阅偏好
高校大学专业课程的设置由教育部规定,同一专业不同届但相同年级的学生授课内容基本一样,并且遵循先开设基础课、简单到难遵循渐进的原则。如计算机专业的学生,大学一年级阶段一般都开设《计算机应用基础》、《c语言程序设计》等基础课程,大学二年级才能开设《数据结构》课程。因为学习《数据结构》需要学生掌握计算机基本操作、程序设计的内容。到更高年级的时候,只有学习《数据结构》的知识,才能开设《算法设计与分析》等更专业的课程。由此可见,同一专业不同年级的读者开设的课程往往不一样,但同一专业同一年级的读者开设的课程基本一样,对专业图书的借阅偏好也相似。
4结语
本文以高校本科生作为读者借阅偏好的研究对象,提出复本受限下高校读者借阅偏好的纸质图书推荐。分别构建读者和纸质图书属性矩阵、读者借阅偏好矩阵,分别定义基于页数的借阅时间权重、基于出版年份的新书权重、基于图书类别的借阅权重。由读者借阅证号建立读者借阅偏好矩阵和读者属性矩阵的关联,由索书号建立读者借阅偏好矩阵和纸质图书属性矩阵的关联。根据大学专业课程设置的特点,区分专业纸质图书和非专业纸质图书。在真实的借阅记录数据集上,实验验证提出方法的有效性。 下一步的研究包括:专业图书、非专业图书的不同推荐类数、册数对不同专业、不同性别的读者推荐影响,并将云计算模型的不确定性、模糊聚类应用于读者借阅偏好的随机性、盲目性中。
参考文献
[1]李克潮,黎晓.个性化图书推荐研究[j].图书馆学研究,2011,(10):65-69.
[2]景民昌,于迎辉.基于借阅时间评分的协同图书推荐模型与应用[j].图书情报工作,2012,56(3):117-120.
[3]罗喜军,王韬丞,杜小勇等.基于类别的推荐——一种解决协同推荐中冷启动问题的方法[j].计算机研究与发展,2007,44:290-295.
[4]李克潮,梁正友.基于多特征的个性化图书推荐算法[j].计算机工程,2012,38(11):34-37.
[5]丁雪.基于数据挖掘的图书智能推荐系统研究[j].情报理论与实践,2010,(5):107-110.
[6]燕飞,张铭,孙韬,等.基于网络特征的用户图书借阅行为分析——以北京大学图书馆为例[j].情报学报,2011,30(8):875-882.
[7]p.c.vaz,d.m.de matos,b.martins,et al.improving an hybrid literary book recommendation system through author ranking[c].in proceedings of the 12th acm/ieee-cs joint conference on digital libraries,jcdl12,new york,ny,usa,2012:387-388.
[8]chong chen,liya zhang,huan qiao,et al.recom mendation based on book-loan logs[j].the outreach of digital libraries:a globalized resource network lecture notes in computer science,2012,7634:269-278.
[9]p.c.vaz,d.m.de matos,b.martins.stylometric relevance-feedback towards a hybrid book recom-mendation algorithm[c].in cikm books online,2012:13-16.
[10]chih-ming chen.an intelligent mobile location aware book recommendation system that enhances problem based learning in libraries[j].interactive learning environments,2011,(1):45-51.
[11]chin-ming chen,yu-chieh yang.an intelligent mobile location-aware book recommendation system with map-based guidance that enhances problem-based learning in libraries[j].advances in neural network research and applications lecture notes in electrical engineering,2010,67:853-860.
[12]z.huang,x.li,h.chen.link prediction approach to collaborative filtering[c].in proceeding of the 5th acm/ieee-cs joint conference on digital libraries,2005:141
-142.
[13]b cui,x chen.an online book recommendation system based on web service[c].fuzzy systems and knowledge discovery,2009,(7):520-524.
[14]唐小新,李高虎,唐秋鸿,等.高校图书馆个性化电子图书荐购系统的设计和实现[j].现代图书情报技术,2012,(3):83-88.
[15]j herlocker,j a konstan,j riedl.an empirical analysis of design choices in neighborhood based collabo-rativealgorithms[j].information retrieval,2002,retrieval,2002,5(4):287-309.
[16]dietmar jannach,markus zanker,alexander felfernig,et al.recommender systems:an introduction[m].new york:cambridge university,2011.
[17]马家伟.图书借阅统计剖析高校的读者需求——以沈阳药科大学图书馆为例[j].农业图书情报学刊,2012,24(4):119-121.
[18]张保华.数据挖掘技术的研究及在图书借阅系统的应用[d].南京:南京大学,2008.
[19]孙书霞.基于数据分析的中文图书采购工作优化——以首都师范大学图书馆为例[j].图书馆建设,2010,(12):37-39.
[20]曾怡.大学图书馆借阅制度动态管理模式研究[d].重庆:西南大学,2009.