电商平台用户评论的分析及应用
这是一篇关于电商用户评论,商品指标体系,TF-IDF,Snownlp,LSTM,CNN,Word2vec,数据应用的论文, 主要内容为随着电子商务的迅速发展,越来越多的用户通过电商平台进行网络购物,并在电商平台上留下了大量的用户评论。这些用户评论数据中蕴藏着大量的用户体验感受,对企业了解用户心声,快速的挖掘用户的关注点和需求点,有着重大的数据价值。因此,本文以京东平台的儿童电话手表行业为例,通过数据采集与清洗、指标关键词短句提取及情感分析、评论数据的分析和应用这三个环节来研究分析用户评论对企业的应用价值。首先本文通过网页爬虫从京东电商平台中采集儿童电话手表行业的用户评论及其相关内容。由于采集的数据存在不规范性,因此要对其进行品牌归整和用户评论清洗。清洗后的用户评论数据如何应用是本文研究的重点,也是企业迫切需要解决的问题。本文通过搭建商品指标体系,对用户评论进行指标化,快速分析挖掘用户对商品和服务的观点,其中商品指标体系的搭建包含商品指标的设计、指标关键词的提取、关键词短句的提取及情感分类这三部分。通过对用户评论进行分词,并根据用户提及词频及商品自身属性参数形成商品指标,同时通过TF-IDF关键词提取算法从用户评论中进行关键词提取,由指标关键词结合正则表达式从用户评论中抽取出关键词短句,最后通过对Snownlp分类模型、Sklearn下的各分类算法以及Keras下的LSTM、CNN模型分别进行关键词短句的情感分类及其效果评估,从中选择了关键词短句情感分类效果最佳的CNN模型。同时在指标关键词的提取过程中,为了解决语言表达多样化的问题,通过Word2vec将用户评论的词汇进行向量化,将与指标关键词的词向量相似度较高的词汇进行抽取,实现指标关键词的扩展。通过对用户评论进行数据清洗、指标体系搭建后,形成指标化的用户评论。我们通过数据分析方法及维度形成不同的数据应用模块,并以实际案例进行分析。了解到目前儿童电话手表行业整体的情况,包括龙头品牌有哪些,市场是否有机会点。同时通过品牌和商品指标之间的对比,可知道用户最为关注的是儿童电话手表的电池容量和续航能力,不同品牌在同一指标间表现有所差异。同时企业可根据分析结果,对用户评论中用户较为关注的点,但表现较差的产品优先进行改善优化,并通过持续监控方式来形成产品闭环管理,以此提升产品后的市场竞争力,进一步扩大企业的市场份额。
基于PCA-CNN-IGRU的股票收盘价预测系统的设计与实现
这是一篇关于PCA,CNN,IGRU,股票收盘价预测,上证指数的论文, 主要内容为随着股票市场的发展,股票投资成为当今社会最受欢迎的投资方式之一,精准的股票价格预测对于促进市场监管和协助投资者规避风险具有重要意义。股票价格预测是一个典型的非线性的时间序列预测问题,股票价格变化受多种因素的影响,然而,过多的影响因素将造成预测模型输入冗余,导致模型的计算量增加。随着神经网络的提出和发展,其逐渐被应用于股票价格预测中并取得了较好的效果。因此,本文提出了一种基于PCA(Principal Component Analysis,主成分分析)、CNN(Convolutional Neural Networks,卷积神经网络)和IGRU(Improved Gated Recurrent Unit,改进的门控循环单元)的股票收盘价预测模型:PCA-CNN-IGRU。PCA通过降低输入数据的维度来减少模型输入冗余和神经网络的计算量,进而提高模型计算效率。CNN能够提取数据的重要特征,IGRU是一种GRU(Gated Recurrent Unit,门控循环单元)的改进模型,其通过在重置门后引入DCM(Data Conversion Module,数据转化模块)进一步缓解梯度爆炸和梯度消失问题,进而使模型能够更好的学习数据之间的长期依赖关系,提高模型的预测精度。本文以上证指数为研究对象,选取1991年7月15日至2022年12月30日的上证指数历史交易数据和同时期的纳斯达克指数、道琼斯工业平均指数、恒生指数、深证成分指数收盘价作为实验数据。选取SVR(Support Vector Regression,支持向量回归)、LSTM(Long Short-Term Memory,长短期记忆)、GRU、IGRU、PCA-LSTM、PCA-GRU、PCA-IGRU、PCA-CNN-LSTM和PCA-CNN-GRU共9种模型作为对比模型进行股票收盘价预测实验。实验结果表明,PCA-CNN-IGRU模型相比于其他模型有着更高的预测精度。本文以此模型为基础完成了股票收盘价预测系统的设计与实现,实现了股票数据查询和股票收盘价预测等功能,能够为用户提供有效的参考。
基于注意力机制改进U-Net算法的桥梁裂缝检测
这是一篇关于桥梁裂缝检测,深度学习,CNN,Transformer,U-Net,注意力机制的论文, 主要内容为公路桥梁是现代交通网络的重要组成部分。因使用年限的增加与交通运输量的大幅增长,部分桥梁进入了养护关键期,亟需监测评估和维护保养。进入数字化、信息化时代,桥梁健康监测不再满足于人工检测等低效的方式,转而对病害检测的技术和手段提出了新的要求。在桥梁健康检测的过程中,裂缝是重点的考察对象,它是桥梁最常见的病害,若不及时进行处理,不仅会影响桥梁的舒适性与美观性,严重时还将导致安全事故的发生。是以对桥梁裂缝进行准确、快速的检测是桥梁工程亟待解决的问题,具有重要的研究意义和实用价值。本文基于计算机视觉与深度学习的相关理论,对基于CNN和Transformer的语义分割算法进行了迁移运用和性能对比,并基于算法特点、数据特征和检测结果对U-Net网络进行了优化,实现了对桥梁裂缝形态的精确提取,主要研究内容如下:1、将Transformer应用到桥梁裂缝检测领域中。土木工程现存的视觉图像类病害检测研究多基于卷积神经网络CNN类算法,本文引进计算机视觉类Transformer算法,通过理论分析和实验论证,探索了Transformer应用于桥梁裂缝检测的可行性。介绍了CNN和Transformer的组成结构和计算原理,对比分析了CNN的卷积运算机制与Transformer的自注意力机制在裂缝特征提取中的差异,为算法应用及算法优化奠定了理论基础。2、使用CNN类算法U-Net、Transformer类算法SETR和CNN+Transformer类算法Trans UNet在自建桥梁裂缝数据集上完成了深度学习语义分割在桥梁裂缝检测中的应用。遵循“数据采集-预处理-数据标注与增强-搭建平台与网络-预训练与迁移学习-调节超参数-训练网络-查看指标”的实验流程,将经Mask匀光预处理、Lableme标注、Augmentor数据增强的1000张448×448像素三通道RGB图像和1000张对应的黑白单通道二值标签图在pytorch深度学习框架下进行多组训练。采用统一的深度学习模型评价指标定量比较算法性能,通过调节超参数提取算法内的最优设置,纵向比较配置出各算法的最优超参数组后作算法间的横向对比,综合检测效果与评价指标,选出针对桥梁裂缝分割任务的相对最优算法U-Net。3、可视化U-Net网络的各层特征图,综合桥梁裂缝图像特点分析了U-Net在桥梁裂缝分割任务中的适应性。通过引入注意力机制和替换损失函数改进U-Net网络。分别在网络指定特征层的通道、空间方向上和特征融合处提取注意力权重,让网络自发地加强对裂缝部分的学习,提出基于不同注意力机制改进的U-Net CA、U-Net SA、U-Net CASA、U-Net GA网络;通过提升二分类任务中裂缝部分在损失函数中的权重,加大对裂缝识别错误的惩罚力度,对比使用WCE Loss、Dice Loss和使用BCE Loss情况下网络精度的差异。最终选择使用Dice Loss的U-Net GA网络提高了分割精度。4、将改进后的网络用于实桥实验并与改进前的网络进行对比,以验证本研究的有效性与实用性。将旧数据训练得到的模型作为迁移学习的来源,分别使用U-Net GA和U-Net在部分标注的新数据上进行训练,随后对剩余的新数据进行检测。改进后的网络表现优于原网络且得到了较高的检测精度,解决了实际工程中数据量少、数据集差异大带来的检测精度下降问题。在完成分割任务的基础上,对比了语义分割和目标检测在桥梁裂缝检测不同场景中的应用情况,提出其各自适用的范围,为使用深度学习算法实现多场景多样化的智能裂缝检测提供了理论支持。
融合多元评论信息的用户情感分类方法研究
这是一篇关于情感分类,图文评论信息,图片分类,限定主题,BERT,CNN,LDA的论文, 主要内容为随着电商经济迅猛发展,各类电商平台为提升服务品质非常重视对用户评论信息的收集、分析和利用,并从中挖掘出具有巨大潜在价值的用户情感信息来促进平台服务质量的提升,以及引导用户的消费。近年来,该方面的研究成果层出不穷,但经汇总分析后在以下两方面仍然存在问题:一是用户评论中存在无效评论,如虚假评论、默认好评和无情感评论等信息。虚假评论、默认好评使用户情感分类算法难以获得用户的真实情感,影响分类结果的准确性;而使用无情感评论信息进行用户情感分类时,不仅无法从中提取用户情感特征,而且还降低情感分类算法的效率;二是现有算法未充分利用评论中上传的图片信息,以及追加评论信息,这导致用户情感分类效果不佳。为了更好地获得用户的真实情感,本文对无效评论识别和用户情感分类进行研究,提出一种融合多元评论信息的用户情感分类方法。该方法主要包括以下两个方面工作:(1)结合无效评论识别和主题识别的数据预处理方法,针对虚假评论、无情感评论信息等无效评论影响用户情感分类准确性和效率的问题进行改进。首先,本文使用识别无效评论的卷积神经网络算法对用户上传图片的特征加以识别并过滤虚假评论;再通过限定主题的LDA算法获取评论文本主题,保留对”商品-物流-服务”的评价,剔除无情感的评论信息,以完成对图文评论数据的预处理工作。(2)融合多元评论信息的多通道BERT算法,针对现有用户情感分类算法未充分利用多元评论信息而导致的用户情感分类结果不准确的问题进行改进。本文在进行用户情感分类时,将用户上传的评论文本和图片分不同通道输入到用户情感分类模型中,融合评论中的多元情感特征实现用户情感的多分类。最后,本文通过对比实验对所提方法的性能进行验证,实验结果表明使用经识别无效评论的卷积神经网络算法和限定主题的LDA算法处理过的图文评论数据集能提高用户情感分类的准确性和效率;融合多元评论信息的多通道BERT算法在进行用户情感分类时从多个维度提取用户的情感特征,使情感分类的结果更加准确可信。同时,本文所提方法可以指导电商平台调整主推商品策略吸引更多的用户,为商家增加经济效益和用户黏度,因此具有良好的应用前景。
自学习驱动下随机场与CNN协同的遥感影像语义分割
这是一篇关于遥感影像,CNN,Markov随机场,自学习,数据-知识双驱动,语义推断的论文, 主要内容为遥感技术的不断发展使得人们可以获得空间分辨率更高、波段更多、回访周期更短的遥感影像.充分利用遥感影像中的信息并对其进行精确分类,在精细农业、目标识别、灾害监测等领域均有着重要意义.近年来卷积神经网络(Convolutional Neural Networks,CNN)在遥感影像中广泛应用于语义分割,取得了巨大的成功.然而,在异质性的地球表层系统中,同类地物特征往往具有地域性,会随着区域的变化而发生改变,有些地物特征也会随时间变化而改变,这使得CNN在大区域上的应用表现不佳.并且CNN是一种数据驱动的模型,缺乏足够的数学理论做支撑,因此它还存在着模型可解释性差的问题.为了突破CNN面临的瓶颈,地学知识信息被用来辅助CNN模型进行语义推断.地学知识推理是指从地学知识图谱中地物目标实体概念间的关系出发,经过计算机推理,建立地物目标间的新关联,发现地学新知识.利用地学知识进行辅助推断,能弥补CNN模型可解释差的弱点,增强CNN在大区域上的应用表现.目前统计推理是常用的知识推理方法,而Markov随机场(Markov Random Field,MRF)是一种概率图模型,具有坚实的统计理论基础.它从统计学的角度来描述影像中空间上下文关系,利用似然函数和联合概率描述数据特征信息和地学知识推理,基于贝叶斯定理,通过最大化后验概率的方式优化语义分割结果.因此本文考虑借助MRF,将以数据为驱动的CNN方法和遥感影像中的地学知识进行联合建模,设计了两种随机场与CNN协同的数据-知识双模块驱动的语义分割算法,优化了语义分割结果.本文开展的研究如下:由于遥感影像中陆地物体空间分布的多样性,很难有效地学习一般的地理规律并将其应用于特定的影像.为了更有效地利用地理知识,本文的第一项工作提出了一种随机场与CNN协同的模型(SLU-CNN).该模型根据CNN的预测结果学习不同对象之间特定空间依存关系,并利用MRF将其与CNN的结果相结合,通过统计推断的方式进行语义推理.SLU-CNN主要涉及两个模块.首先,利用均值漂移算法从CNN提供的预测结果中生成推理单元.其次,通过自学习基于推理单元之间的空间依存关系,以建立特定的适应性地理关系.最后,选择对数函数将这种地理关系转化为一个自适应的各向异性矩阵,嵌入到一个基于对象的MRF模型中,用统计推断的方式,实现CNN结果与语义推理之间的协作.通过在高分2号和哨兵2号的数据集上进行实验,并与不同的CNN方法进行比较,验证了该方法的有效性.随着遥感影像的空间分辨率越来越高,里面包含的语义信息越来越丰富,只利用一层语义信息难以满足分割任务的需求.因此本文的第二项工作将前面的模型进行了拓展,设计了一个能处理包含双层语义信息遥感影像的算法(SLU-MLS-CNN).该算法设计一个具有双层语义结构的概率图模型并建立了一个混合标记场,以向量的形式建模双层语义,并设计了一种新的联合分布,来捕获混合标签场同一语义层内的各向异性空间相互作用,以及不同语义层间的各向异性空间相互作用,在高层语义信息和低层语义信息的交互迭代优化,最终为两个语义层都提供一个更优的预测结果.该方法在具有5类和15类两个语义层的高分2号数据集上进行实验,其结果验证了该方法的有效性.
面向知识图谱的实体对齐和知识补全
这是一篇关于实体对齐,知识图谱补全,摘要文本,WMD,TransH,CNN的论文, 主要内容为随着人工智能技术的快速发展,知识图谱作为该领域内的重要基础技术,其重要程度也日益提升。各大企业和研究机构纷纷推出了自己的知识图谱。知识图谱的构建以相关语料库为基础,但仅仅使用单一语料库会导致信息的覆盖面较低,存在信息丢失的情况。因此需要对多个语料库进行融合,从而构建一个完备的知识库,进而可以有效解决信息缺失的问题。而有效的实体对齐技术正是数据融合的关键所在。另一方面,知识图谱一般将实体表示为网络中节点,关系表示为节点之间的边。我们可以通过现有知识去推论潜在知识,进而补全知识图谱。现有的知识图谱补全大多采用以翻译模型为代表的知识表示学习模型,但翻译模型没有充分利用知识库自身实体三元组结构外的实体描述文本,而这些实体的描述文本也可以为知识图谱补全提供大量的信息。本文从以上两个方面出发进行了深入研究,主要研究内容如下:(1)针对目前中文百科实体对齐方法中忽略非结构化摘要文本的语义信息的问题,通过引入改进的WMD(词移距离模型)算法,提出一种基于实体属性和摘要文本信息的中文百科实体对齐方法。本文首先对实体属性的属性名和属性值进行规范化处理后,通过编辑距离算法计算属性相似度。其次,对摘要文本通过改进的WMD算法计算摘要文本的语义相似度。在综合两个相似度之后来完成实体对齐任务。最终,通过实验证明,该方法较好的提升了实体对齐的效果。(2)由于现有的表示学习模型未能充分利用实体的描述文本,为此,本文提出了一种融合文本信息的知识表示学习模型。通过使用深度卷积神经网络来对实体的描述文本进行编码,进而得到文本表示语义信息,同时使用Trans H模型对头尾实体进行映射建模,然后基于两者建立了一种联合学习模型。实验证明,相较于原有的知识表示模型,该模型具有更为良好的表现。(3)构建一个小型的千岛湖旅游知识图谱。在爬取、存储了携程、艺龙、大众点评等网站的千岛湖景点、酒店、餐饮的相关旅游信息之后,通过上述设计的实体对齐算法将多源的数据信息进行融合对齐。其次,使用融合文本信息的知识表示学习模型对融合后的知识库进行补全,进一步丰富了千岛湖旅游知识图谱。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码海岸 ,原文地址:https://bishedaima.com/lunwen/47928.html