基于眼动特征与DeepFM的直播购物兴趣度预测模型
这是一篇关于眼动数据,兴趣度模型,注意力机制,多模态信息的论文, 主要内容为网上直播购物现已成为人们日常购物获取信息的渠道之一。了解用户对直播过程的感兴趣程度,不但能够改进商家直播策略、提升用户观看直播的满意度,而且能够帮助设计者开发更人性化的直播交互方式,提升用户体验,为企业产生更大的经济收益。研究用户观看购物直播的兴趣度并构建一个稳定的兴趣度预估模型对互联网公司和店家直播部门都有着重要的现实意义。兴趣度模型通常考虑用户的行为特征,直播过程中的眼动特征可以体现人们对商品的关注度,是一个很重要的行为特征,但是由于设备采集困难等原因,现有的兴趣度模型并未考虑眼动特征。为了更有效地获取用户对商品的兴趣度,论文在基于Deep FM架构设计的兴趣度模型中,引入了体现眼动特征的若干关键指标作为重要因子,并通过提升数据维度、增加多模态知识图谱与注意力机制模块来改进模型。在多个数据集上与现有模型进行对比实验,结果表明本文提出的改进模型具有更低的Logloss值和更优越的AUC性能,论文最后还基于该模型设计并实现了一个眼动数据获取及兴趣度预估系统。具体来讲,本文的研究成果主要包括以下四个方面:(1)针对现有眼动仪不能自动处理全部维度眼动数据的缺陷,设计了一套眼动数据采集系统FDIMP来自动提取时间率等眼动参数。首先,在视频第一帧中框定跟踪目标区域,然后利用改进的深度学习模型DIMP对视频中后续每一帧跟踪目标的位置进行跟踪定位;然后,通过关注时长程序统计整个过程中的关注时长;最后,最终输出时间率及其它眼动维度参数。(2)提出了一个新的兴趣度模型EDIPDF模型。Deep FM模型难以关注到不同维度数据中所存在的一些关联,在特征信息种类较多的情况下难以突出重要特征。为了解决上述问题,本文提出EDIPDF兴趣度模型,通过在Deep FM基础上增加多模态知识图谱模块来融合多类别信息,引入注意力机制来有效地学习重要特征。(3)基于两个不同的数据集,将本文所提出的EDIPDF模型和其它多种经典模型进行了对比试验,实验结果显示本文所提出的EDIPDF模型较之于其它模型在准确率上得到了提升。其中相比于原生Deep FM算法,AUC值最高改进了9.32%。本文还就不同改进点对模型性能的影响进行了实验,同时分析了全连接层和迭代次数对于模型性能的影响。(4)基于EDIPDF模型设计并开发了眼动数据获取及兴趣度预估系统。本文详细地论述了该系统所使用的前后端框架及相关技术,并展示了各模块的页面图片与功能。
融合知识图谱的多模态虚假新闻检测研究
这是一篇关于虚假新闻检测,知识图谱,多模态信息,深度学习的论文, 主要内容为随着互联网的广泛普及,人们从网络社交媒体上获取新闻比其他传统媒体更便利。然而,在缺乏有效监督和监管情况下,开放的互联网助长了大量虚假新闻的传播。社交媒体中虚假新闻以极低的成本在互联网中快速扩散,将会给社会和人们的日常生活带来显著的负面影响。因此,设计针对虚假新闻的自动检测模型具有重要现实意义。传统单模态虚假新闻检测模型一方面仅仅聚焦于挖掘新闻文本自身的统计学和语言学特征,通过挖掘出来的特征进行机器学习或者深度学习建模对虚假新闻进行检测,另一方面这些模型主要采用图像统计学和图像分布式表示特征,没有深层次挖掘图像背后所表达的文字语义和知识等含义。针对现有方法存在的不足之处,本文开展了如下工作:(1)提出了一个融合知识图谱的虚假新闻检测模型,该模型通过引入外部知识库对虚假新闻检测任务提供支撑,对抽取出新闻文本的三元组生成向量表示,并采用cosine计算三元组间的相似度,最后利用该相似度信息进行虚假新闻检测。(2)提出了一个融合知识图谱和图像描述的深度学习框架下多模态虚假新闻检测模型,该模型不仅抽取出新闻文本中的三元组形式知识图谱,同时也融合了图像生成的描述文本,同时采用BERT框架将原文本、三元组、图像描述文本加以集成。在基准汉语虚假新闻语料库上的实验结果表明了该模型显著优于现有代表性方法。
基于知识图谱的推荐算法研究
这是一篇关于推荐系统,知识图嵌入,多模态信息,特征交叉的论文, 主要内容为随着技术革命和工业变革的加速推进,信息呈现爆炸式的增长。推荐系统的诞生,为信息爆炸问题的解决提供了强有力的工具。它仅通过分析用户的历史行为,就可以为用户推送可能感兴趣的信息,这在一定程度上帮助用户节省了寻找信息的时间。推荐系统中,因子分解机等推荐算法对不同特征进行交叉组合,孤立地对待每一用户-物品交互信息,即无法显式地利用用户与用户之间、物品与物品之间隐含的关联。这导致得到的特征嵌入不是最优的,无法克服物品冷启动问题。因此,本文提出基于多模态知识图嵌入的神经因子分解机(MKGNFM),模型由多模态知识图嵌入部分和推荐部分组成,采用联合训练的方式,将多模态特征输入到下游推荐任务中,预测用户-物品交互概率。多模态知识图嵌入部分旨在获取丰富的特征嵌入,克服特征交叉模型孤立对待样本问题。首先针对结构化知识,本文采用知识图嵌入模型Hole,在取得实体和关系嵌入的同时,保留知识图谱中的结构信息。其次,考虑到多模态知识图中数据类型的多样性,本文基于Glove算法训练得到的词向量,采用SIF算法计算语料库中句子词向量的加权平均数,并以此作为文本知识嵌入特征。推荐部分采用神经因子分解机模型,它兼具因子分解机模型二阶交叉线性和深度神经网络高阶交叉非线性优势,其特征交叉池化层可以很好地集成多模态知识图嵌入部分生成的两种模态特征。为了验证模型的有效性,本文结合Movie Lens-1M数据集和IMDB网站上爬取的电影简介信息对推荐算法进行实证研究。分别进行了MKGNFM模型与基线模型的对比试验、不同模态数据对推荐结果影响的消融试验以及模型推荐模块的超参数试验。本文采用ROC-AUC和PR-AUC作为评价指标,试验结果表明MKGNFM模型超越了一般基线模型,多模态知识图信息的嵌入在一定程度上提升了特征交叉模型的效果,模型的架构具备一定的合理性和可行性,模型对推荐系统性能的提升是有效的。
基于眼动特征与DeepFM的直播购物兴趣度预测模型
这是一篇关于眼动数据,兴趣度模型,注意力机制,多模态信息的论文, 主要内容为网上直播购物现已成为人们日常购物获取信息的渠道之一。了解用户对直播过程的感兴趣程度,不但能够改进商家直播策略、提升用户观看直播的满意度,而且能够帮助设计者开发更人性化的直播交互方式,提升用户体验,为企业产生更大的经济收益。研究用户观看购物直播的兴趣度并构建一个稳定的兴趣度预估模型对互联网公司和店家直播部门都有着重要的现实意义。兴趣度模型通常考虑用户的行为特征,直播过程中的眼动特征可以体现人们对商品的关注度,是一个很重要的行为特征,但是由于设备采集困难等原因,现有的兴趣度模型并未考虑眼动特征。为了更有效地获取用户对商品的兴趣度,论文在基于Deep FM架构设计的兴趣度模型中,引入了体现眼动特征的若干关键指标作为重要因子,并通过提升数据维度、增加多模态知识图谱与注意力机制模块来改进模型。在多个数据集上与现有模型进行对比实验,结果表明本文提出的改进模型具有更低的Logloss值和更优越的AUC性能,论文最后还基于该模型设计并实现了一个眼动数据获取及兴趣度预估系统。具体来讲,本文的研究成果主要包括以下四个方面:(1)针对现有眼动仪不能自动处理全部维度眼动数据的缺陷,设计了一套眼动数据采集系统FDIMP来自动提取时间率等眼动参数。首先,在视频第一帧中框定跟踪目标区域,然后利用改进的深度学习模型DIMP对视频中后续每一帧跟踪目标的位置进行跟踪定位;然后,通过关注时长程序统计整个过程中的关注时长;最后,最终输出时间率及其它眼动维度参数。(2)提出了一个新的兴趣度模型EDIPDF模型。Deep FM模型难以关注到不同维度数据中所存在的一些关联,在特征信息种类较多的情况下难以突出重要特征。为了解决上述问题,本文提出EDIPDF兴趣度模型,通过在Deep FM基础上增加多模态知识图谱模块来融合多类别信息,引入注意力机制来有效地学习重要特征。(3)基于两个不同的数据集,将本文所提出的EDIPDF模型和其它多种经典模型进行了对比试验,实验结果显示本文所提出的EDIPDF模型较之于其它模型在准确率上得到了提升。其中相比于原生Deep FM算法,AUC值最高改进了9.32%。本文还就不同改进点对模型性能的影响进行了实验,同时分析了全连接层和迭代次数对于模型性能的影响。(4)基于EDIPDF模型设计并开发了眼动数据获取及兴趣度预估系统。本文详细地论述了该系统所使用的前后端框架及相关技术,并展示了各模块的页面图片与功能。
基于知识图谱的推荐算法研究
这是一篇关于推荐系统,知识图嵌入,多模态信息,特征交叉的论文, 主要内容为随着技术革命和工业变革的加速推进,信息呈现爆炸式的增长。推荐系统的诞生,为信息爆炸问题的解决提供了强有力的工具。它仅通过分析用户的历史行为,就可以为用户推送可能感兴趣的信息,这在一定程度上帮助用户节省了寻找信息的时间。推荐系统中,因子分解机等推荐算法对不同特征进行交叉组合,孤立地对待每一用户-物品交互信息,即无法显式地利用用户与用户之间、物品与物品之间隐含的关联。这导致得到的特征嵌入不是最优的,无法克服物品冷启动问题。因此,本文提出基于多模态知识图嵌入的神经因子分解机(MKGNFM),模型由多模态知识图嵌入部分和推荐部分组成,采用联合训练的方式,将多模态特征输入到下游推荐任务中,预测用户-物品交互概率。多模态知识图嵌入部分旨在获取丰富的特征嵌入,克服特征交叉模型孤立对待样本问题。首先针对结构化知识,本文采用知识图嵌入模型Hole,在取得实体和关系嵌入的同时,保留知识图谱中的结构信息。其次,考虑到多模态知识图中数据类型的多样性,本文基于Glove算法训练得到的词向量,采用SIF算法计算语料库中句子词向量的加权平均数,并以此作为文本知识嵌入特征。推荐部分采用神经因子分解机模型,它兼具因子分解机模型二阶交叉线性和深度神经网络高阶交叉非线性优势,其特征交叉池化层可以很好地集成多模态知识图嵌入部分生成的两种模态特征。为了验证模型的有效性,本文结合Movie Lens-1M数据集和IMDB网站上爬取的电影简介信息对推荐算法进行实证研究。分别进行了MKGNFM模型与基线模型的对比试验、不同模态数据对推荐结果影响的消融试验以及模型推荐模块的超参数试验。本文采用ROC-AUC和PR-AUC作为评价指标,试验结果表明MKGNFM模型超越了一般基线模型,多模态知识图信息的嵌入在一定程度上提升了特征交叉模型的效果,模型的架构具备一定的合理性和可行性,模型对推荐系统性能的提升是有效的。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设客栈 ,原文地址:https://bishedaima.com/lunwen/56238.html