推荐6篇关于文本特征的计算机专业论文

今天分享的是关于文本特征的6篇计算机毕业论文范文, 如果你的论文涉及到文本特征等主题,本文能够帮助到你

融合多因素信息的神经协同过滤推荐模型研究

这是一篇关于推荐系统,神经协同过滤,文本特征,标签信息,邻域信息的论文, 主要内容为推荐系统(Recommendation System,简称RS)利用用户-项目历史交互记录来学习用户潜在个性化偏好以及项目潜在属性特征,从而帮助用户准确快速地定位到目标内容信息。协同过滤是在推荐领域应用中应用最早、影响范围最广泛的方法,其中,矩阵分解算法是协同过滤推荐中最具有代表性的算法,矩阵分解技术将用户和项目的信息映射到同一维度的潜在因子向量空间中,通过内积的形式来结合用户以及项目的潜在特征,然而通过内积来拟合用户偏好与项目特征之间的关系在一定程度上限制了模型的表现力。神经协同过滤使用神经网络结构来建模用户和项目的潜在特征,神经网络结构代替内积,可以从数据之中学习任意函数,突破了内积所带来的限制,从而提高了模型的非线性建模能力。辅助信息在推荐系统完善用户-项目交互起着至关重要的作用,如能将更多的辅助信息引入到神经协同过滤模型中,则可以从更多的维度完善项目的属性特征,建立更具语义、更准确、更个性化、有效缓解冷启动问题的推荐模型。如,邻域信息在电影推荐中可以帮助用户发现新的题材或新演员及导演的电影,基于邻域信息的方法通常简单、有效,并且能够提供准确及个性化的推荐,而广泛用于协同过滤推荐中。因此,我们考虑将邻域信息融入到神经协同过滤系统中。标签信息既可以反映出用户的兴趣特征,又能够描述资源本身具备的特点。基于标签的算法会为推荐的物品提供标签说明来解释推荐行为,同时,项目自带的标签是对新项目内容属性的粗粒度描述,因此在一定程度上能够缓解模型的冷启动问题。因此,我们考虑将标签信息融合到神经协同过滤模型中。新项目附带的项目描述文本是对项目内容的概要说明,能够反映项目的内容特征,是对项目内容更细粒度的刻画。本文利用卷积神经网络来挖掘项目描述文本中的属性特征,并融入到神经协同过滤模型中,从而更进一步缓解模型地冷启动问题。在本文中,我们不仅考虑了邻域因素对结果的影响。还重点研究对项目辅助信息的挖掘,包括文本信息,标签信息等,旨在充分完善项目的属性特征。本论文主要的创新点及研究成果如下:(1)基于邻域的方法通过寻找用户或项目之间的相似性,挖掘出用户与用户、项目与项目之间的内在关联,从而完成推荐。基于邻域的方法已被广泛地应用于经典的协同过滤推荐方法中,然而在神经协同过滤模型中却鲜有应用,为了增强神经协同过滤模型的个性化和准确性推荐能力,我们开展的第一部分工作,是将邻域信息引入神经协同过滤模型中。(2)考虑到项目的标签信息能够粗粒度的描述项目内容特征,为推荐的物品做出标签说明来解释推荐行为,从而增强了模型的语义可解释性,同时标签的引入能够缓解模型的冷启动问题。为了有效提升神经协同过滤模型推荐结果的语义可解释性并缓解模型的冷启动问题,我们第二部分工作是将将标签信息引入神经协同过滤模型中。(3)一个新项目在进入多媒体资源平台时通常都会附带相关项目的描述文本,该文本主要是对项目内容的概括说明,能够反映项目的内容特征。我们第三部分工作将利用卷积神经网络对项目描述文本进行处理,并引入到神经协同过滤模型中。由于项目描述文本能够高度概述文本内容信息,因此可更细粒度的刻画项目内容属性特征,更进一步缓解项目冷启动问题。(4)基于上述三部分工作,最终我们提出了一个全新的推荐模型TTNNCF(Text,Tag,and Neighborhood-based Neural Collaborative Filtering Model),并针对不同的冷启动场景以及一般场景,在真实数据集上进行了多角度实验评估。实验结果表明,在不同的实验场景,对比现有的优秀模型,TTNNCF能够进行更有效的项目推荐,并能更有效缓解推荐所面临的冷启动问题。

基于混合特征的双通道图卷积网络研究

这是一篇关于图卷积网络,注意力机制,门控机制,结构特征,文本特征的论文, 主要内容为现实生活中的许多场景都可以用图数据建模,例如社交网络等。由于图数据的普遍存在性,图数据的研究具有重要意义。传统的图数据分析方法大部分依赖于统计学或人工提取方法,在大多数情况下表达能力不足且计算复杂度太高。过去几年,卷积神经网络的快速发展,借由其强大的建模能力引起广泛关注。因此,利用卷积神经网络处理图数据成为了图研究的热点,并由此产生图神经网络概念。图神经网络在推荐系统等领域取得成功,但对于网络中拥有的复杂信息,需要更有效的方式抽取其中有用的信息,现有的单特征图神经网络无法完整地刻画网络中的相关特性。在网络表示学习任务中,通过浅层神经网络将文本特征和结构特征联合建模的研究较多,其结果证明,混合特征建模能够在下游机器学习任务中性能更优。在图神经网络中,结构和文本联合建模的工作非常少,借鉴文本和结构联合建模的网络表示学习算法,可以提升利用图神经网络对结构与文本联合建模的性能。此外,由于残差网络等深层卷积神经网络的出现,使图像分类等任务的效果得到巨大的提升。但是图卷积网络增加图卷积层的数量到达一定程度后会发生过平滑现象,其特征表达能力不增反降。为了避免该现象,本文利用残差连接构建深度双通道图卷积网络。因此,本文的研究工作如下:(1)提出基于混合特征的双通道图卷积网络模型,利用图卷积网络解决结构和文本特征联合建模的问题。并且借鉴注意力机制和门单元来设计聚合函数,选择性地聚合节点的文本特征,增强节点的特征表达能力。为了使特征之间互相补充,通过一种向量的融合机制生成混合特征用于节点分类任务。通过对比实验和消融实验证明,基于混合特征训练的图卷积网络比单特征图卷积网络的节点分类效果更好。(2)通过将残差连接迁移到基于混合特征的双通道图卷积网络,构建图卷积网络的深度结构,使得节点可以与距离较远的弱关联节点进行特征信息传递来避免过平滑问题。通过对比实验证明,利用残差连接构建深度图卷积网络在节点分类任务中效果更好,并且图卷积网络的深度可以达到16层。本文的研究证实了图神经网络可以从节点的文本中学习到有用的特征,提升模型学习性能,也可以为后续的图神经网络应用提供理论基础和技术支撑。

基于混合特征的双通道图卷积网络研究

面向实验检测交流平台的文本推荐方法研究与应用

这是一篇关于推荐系统,协同过滤,距离分解,文本特征,样本填充的论文, 主要内容为石油勘探领域的现场报告和科研文献等研究资料极具科研价值,将其共享至网络平台供科研人员使用,有助于提高资料利用率。随着研究资料的逐年增加,本文关注信息获取,开展个性化推荐系统研究,实现资料的筛选和过滤。针对协同过滤推荐方法中存在的稀疏性、冷启动和样本不平衡等问题,提出改进协同过滤方法和正例样本填充方法,并应用于实验检测网络交流平台,设计实现研究资料推荐子系统。首先,针对FML(Factorized Metric Learning)推荐方法中存在的数据稀疏性、研究资料冷启动和样本不平衡问题,提出基于文本特征和距离分解的推荐方法RTDF(Recommendation method based on Textual feature and Distance Factorization)。RTDF利用文本主题特征构建研究资料的先验位置,增加对模型的约束,并在损失函数中添加用户活跃度的置信项。实验结果表明,RTDF方法能有效提升研究资料的推荐效果。其次,针对低活跃度用户推荐精度不高问题,提出基于标签信息的正例样本填充方法PFT(Positive sample Filling method based on Tag information)。对于低活跃度用户,PFT采用“用户-研究资料-标签”三元关系计算用户对研究资料的兴趣,用于从未标记样本中筛选潜在正例样本进行填充。实验结果表明,PFT方法可以有效提高低活跃度用户的推荐精度。最后,将上述方法应用于实验检测网络交流平台,设计并实现研究资料推荐子系统,帮助科研人员筛选有价值的研究资料。

多模态特征融合的视频记忆度预测研究

这是一篇关于视频记忆度,文本特征,深度视觉特征,光流特征,多模态特征融合的论文, 主要内容为随着网络视频的爆炸式增长,各种各样的视频出现在互联网共享平台。有研究表明人类对所观看视频的记忆程度并不一样,一些视频可以被记住很长时间,而另一些视频转瞬即忘。视频记忆度是衡量一个视频令人难忘程度的指标,设计自动预测视频记忆度的计算模型有广泛的应用前景。因此如何有效地预测视频的记忆度是本文研究的主要内容。记忆度是图像的固有属性,人类在记忆上有共同的喜好。与图像不同的是,视频是图像、声音、文字、运动信息等维度的综合表现形式,传达了更丰富的媒体内容,因此视频记忆度预测任务受到了更多因素的影响。由于单模态的预测模型无法全面地描述视频的记忆度,导致实际应用中视频的记忆度预测性能不佳。因此本文以视频为研究对象,探索了视频的文本标题、图像深度、运动信息等维度的特征对视频记忆度的影响。构建有效的视频记忆度预测模型来提高视频记忆度的预测性能是本文的主要工作,具体的研究内容如下:(1)为了研究视频标题和图像深度信息对视频记忆度的影响,提出了一个融合文本和深度视觉特征的视频记忆度预测模型。首先利用TF-IDF算法从视频的描述性标题中提取文本特征,并给予对视频记忆度有影响的单词一定的权重。其次对视频进行分帧预处理,利用深度估计模型提取深度图作为视频的深度信息,利用预训练的Res Net-152网络来提取视觉特征,并利用深度图数据集微调Res Net-152网络模型来提取深度特征,将深度特征和视觉特征进行拼接得到深度视觉特征。然后将文本特征和深度视觉特征分别使用回归算法来预测视频记忆度分数,利用晚融合中的加权平均法进行模态融合。最后在公开的数据集上进行相关方法的对比实验,在短期和长期记忆度预测任务中分别达到了0.547和0.260的Spearman秩相关性,证明了模型的有效性。(2)为了解决现有的视频记忆度预测模型无法很好的描述运动信息对视频记忆度的影响,进一步提高视频记忆度的预测效果,在现有的融合文本和深度视觉特征的视频记忆度预测模型中添加了运动特征维度,通过光流的形式进行运动信息的描述,进而提出了一个融合文本、图像深度和光流信息的多模态视频记忆度预测模型。首先利用光流估计模型来提取光流图,并利用光流图数据集微调Res Net-152网络模型来提取光流特征,然后将三个维度的特征在单模态下利用回归算法来预测视频记忆度分数,最后对三种模态的记忆度分数进行晚融合处理,在公开的数据集上开展了一系列对比实验,在短期和长期记忆度预测任务中分别达到了0.567和0.272的Spearman秩相关性,证明了多模态特征融合方法在视频记忆度预测任务中的提升效果。(3)将本文提出的多模态特征融合的视频记忆度预测模型应用于某企业的网络编码推流器,进行广告记忆度的预测。对广告记忆度预测模块进行了分析与设计,以手机广告为例进行了视频记忆度预测实验,并对实验结果进行了分析,证明了本文提出的模型可以有效预测不同广告的记忆度。

基于纽马克文本类型理论的《ClearVue系列医用超声系统用户手册》英汉翻译实践报告

这是一篇关于英译汉,医疗器械翻译,文本类型理论,文本特征,翻译技巧的论文, 主要内容为近年来,随着全球医疗支出的不断增加,中国的医疗设备市场发展迅速,目前已成为世界第二大市场。因此,对英文医疗设备技术文本的翻译有着迫切的需求。医疗设备技术文本翻译的准确性和规范性直接关系到医疗设备产品的安全性和有效性。该类文本的英译汉实践具有较高的挑战性,同时对于医学领域科技文本英译汉技巧的探讨也具有实用价值。Clear Vue系列医用超声系统用户手册是技术产品手册之一,其编写具有很强的实用性和可操作性,并与多个学科相交叉。笔者根据委托要求翻译了医用超声机器系统的操作安全、诊断系统的使用、保养和维护,并选取13000字译文进行分析。本报告以纽马克的文本类型理论为指导,从词汇、句法和语篇三个层面进行具体分析:在词汇层面,主要运用了增译、减译和词性转换的翻译方法;在句法层面,采用了主被动转换和拆译合译的翻译技巧;在语篇层面,运用了增加连词和衔接词、调整语篇结构的方法。本报告旨在探讨该类文本的文本特征、翻译中遇到的难点以及为确保译文准确得体而采用的翻译技巧。本报告共分为五个部分。第一章是本次翻译实践的背景简介和意义。第二章介绍了文本类型理论及应用。第三章讨论了该医疗器械技术文本在词、句、语篇和论述方面的特点以及一般的翻译过程,简要分析了翻译中的困难,包括商标和半专业名词的不确定性等问题。第四章研究了纽马克文本类型理论视角下翻译技巧在实践中的应用,以进一步论证技术产品手册的一般翻译规则。最后对本次翻译实践的完成过程进行了简要总结,以期对从事医学领域科技文本翻译的译者提供一定借鉴与启发。

本文内容包括但不限于文字、数据、图表及超链接等）均来源于该信息及资料的相关主题。发布者：源码客栈网，原文地址：https://bishedaima.com/lunwen/52583.html