研究前沿

甘明鑫:多粒度关系融合的微博信念网络检索模型

研究成果:多粒度关系融合的微博信念网络检索模型

作者:张雄涛,甘明鑫,李硕

发表期刊:管理科学(FMS T1

微博检索系统是微博平台实现个性化信息过滤的重要工具,建立合理的微博检索模型不仅有利于满足用户的个性化信息需求,而且有利于提升微博平台的信息服务水平。与传统文本检索相比,微博检索面临两方面挑战,一是较短的微博查询语句难以准确表达用户的检索需求,二是较短的微博文档难以充分表现微博的语义特征。这使查询语句与文档之间难以准确进行匹配计算,致使微博检索性能受限。

结合微博术语和文档的特点,将术语关系和文档关系融入信念网络检索模型,提出多粒度关系融合的微博信念网络检索模型。首先,基于混合语义信息和时间信息对微博术语关系进行量化,以更准确地建立微博术语之间的相关性;其次,基于混合语义信息和作者信息对微博文档关系进行量化,以更准确地建立微博文档之间的相关性;最后,结合量化的术语关系和文档关系,在基本信念网络检索模型的基础上,给出微博信念网络检索模型的概率推导过程。采用网络爬虫工具,从新浪微博平台获取真实的微博数据,对微博信念网络检索模型的有效性和合理性进行验证。

研究结果表明,微博术语之间存在语义相关性和时间相关性;微博文档之间不仅存在语义相关性,还存在作者信息相关性;与主流的微博检索模型相比,微博信念网络检索模型在多项信息检索指标上体现出较优的检索性能。消融实验结果表明,微博术语之间存在语义相关性和时间相关性;微博文档之间不仅存在语义相关性,还存在作者信息相关性;与仅考虑单一粒度关系或不考虑任何关系的信念网络检索模型相比,融合多粒度关系的信念网络检索模型体现出较优性能。

聚焦于微博检索情景,综合查询语句扩展和文档扩展的优势实现微博检索,有效克服了微博检索面临的挑战,显著提升了微博检索的性能。在信息过载的背景下,微博信念网络检索模型不仅有助于进一步提升社交媒体平台的信息服务水平,也可以为社交媒体平台开发合理的检索系统提供借鉴。

文献来源:张雄涛;甘明鑫;李硕. 多粒度关系融合的微博信念网络检索模型 [J]. 管理科学, 2022, 35 (05): 67-79.