唐璜故事的主题学意义及其现代性
这是一篇关于唐璜,主题,现代性的论文, 主要内容为唐璜故事的主题学意义,主要是指唐璜故事题材的演变史及其主题的演变史。从题材演变的角度讲,唐璜主题走过了它的古典高峰期(古典主义时代)、发展期(十八世纪)、现代繁盛期(十九世纪)。本文以主题学为理论依据,旨在通过对各个时期具有代表性的文本——蒂尔索的《唐璜》、希科尼尼的《唐璜》、莫里哀的《唐璜》、莫扎特的《唐璜》、梅里美的《炼狱里的灵魂》、拜伦的《唐璜》进行详细地分析和比较,清理出一条唐璜主题发展的历史脉络。通过对各个历史时期唐璜作品的分析,在大的历史背景下考查不同文学家的创造目的与作品主题,从而揭示这个较长持续期的主题如何不断地修正和调整自己以保持其鲜活性。
基于Python的新闻个性化推荐系统优化与实现
这是一篇关于智能推荐,个性化,主题,系统的论文, 主要内容为智能推荐随着互联网的飞速发展已经成为日常生活中不可或缺的技术,人们越来越习惯于通过手机在线阅读来了解新闻热点。然而各种网络新闻每天都在以亿万计的数量递增,且每个人都有自己的兴趣爱好和阅读习惯;那么在如此庞大数量的新闻消息中,如何让用户及时浏览到自己感兴趣的新闻消息,成为当前大数据行业研究的热点。媒体企业希望通过相关大数据算法结合用户的行为数据与新闻的文本主题信息来给用户做个性化推荐。本论文根据市场上新闻智能推荐系统的技术难点及系统弱点,改进并设计出一套新闻个性化智能推荐系统。首先,根据以往新闻推荐系统难以掌握用户实时准确的兴趣爱好这一难点出发,通过改进设计,采用从多角度采集用户行为数据这一重要环节:改进一,系统结合相关机器学习算法,通过分析企业从用户手机端获取的用户日常行为数据,得到用户特征画像;改进二,通过分析用户实时阅读行为数据,预测用户实时兴趣爱好;系统最后结合用户画像和用户实时兴趣爱好进行推荐。其次,系统将新闻网提供的实时新闻数据,利用先进文本处理算法并结合系统通过大量新闻训练出的主题模型,准确提取新闻主题类型,再结合用户的兴趣爱好,将用户感兴趣的新闻及时推荐给他们。最后,本系统相比以往新闻推荐系统增加了用户阅读行为数据反馈环节,系统在给用户推荐的实时新闻后,将用户对该新闻是否阅读、评论、分享、转载以及阅读时长等进行实时反馈,通过反馈的客户阅读行为数据对系统内原预测的客户兴趣爱好进行实时修正和更新,有效避免因为用户兴趣爱好随时间的迁移而改变导致新闻推荐的不合理性,实现真正的新闻个性化推荐。
基于Python的新闻个性化推荐系统优化与实现
这是一篇关于智能推荐,个性化,主题,系统的论文, 主要内容为智能推荐随着互联网的飞速发展已经成为日常生活中不可或缺的技术,人们越来越习惯于通过手机在线阅读来了解新闻热点。然而各种网络新闻每天都在以亿万计的数量递增,且每个人都有自己的兴趣爱好和阅读习惯;那么在如此庞大数量的新闻消息中,如何让用户及时浏览到自己感兴趣的新闻消息,成为当前大数据行业研究的热点。媒体企业希望通过相关大数据算法结合用户的行为数据与新闻的文本主题信息来给用户做个性化推荐。本论文根据市场上新闻智能推荐系统的技术难点及系统弱点,改进并设计出一套新闻个性化智能推荐系统。首先,根据以往新闻推荐系统难以掌握用户实时准确的兴趣爱好这一难点出发,通过改进设计,采用从多角度采集用户行为数据这一重要环节:改进一,系统结合相关机器学习算法,通过分析企业从用户手机端获取的用户日常行为数据,得到用户特征画像;改进二,通过分析用户实时阅读行为数据,预测用户实时兴趣爱好;系统最后结合用户画像和用户实时兴趣爱好进行推荐。其次,系统将新闻网提供的实时新闻数据,利用先进文本处理算法并结合系统通过大量新闻训练出的主题模型,准确提取新闻主题类型,再结合用户的兴趣爱好,将用户感兴趣的新闻及时推荐给他们。最后,本系统相比以往新闻推荐系统增加了用户阅读行为数据反馈环节,系统在给用户推荐的实时新闻后,将用户对该新闻是否阅读、评论、分享、转载以及阅读时长等进行实时反馈,通过反馈的客户阅读行为数据对系统内原预测的客户兴趣爱好进行实时修正和更新,有效避免因为用户兴趣爱好随时间的迁移而改变导致新闻推荐的不合理性,实现真正的新闻个性化推荐。
面向中文产品评论的情感分析研究
这是一篇关于文本分类,词向量,情感分析,深度学习,主题的论文, 主要内容为在Web2.0时代,用户是创造信息的主体。随着社交媒体和电商平台的急速发展,每天都有海量用户参与到人物、事件、产品的评论中来,这些信息有效传达了人们各种各样的观点和情感倾向。海量的中文产品评论数据为快捷、高效和科学获取用户对于产品的情感满意度提供了可能。然而,人工方法很难科学合理地对海量文本评论进行归纳和整理和应用。如何从这些非结构化的数据中挖掘出潜在的价值成为互联网产业的迫切需求。基于自然语言处理的文本情感分析技术主要是在大数据领域相关技术方法获取和处理中文用户评论数据的基础上,针对如何快速实现用户评论数据的自动分类、检测和归纳,快捷、高效和科学地评估用户满意度进行研究与应用。然而,针对具体主题领域的数据,传统文档级情感分析方法对数据的多维度认知尚存在一定程度的不足,亟待从属性角度寻求新的技术方法。针对大数据时代海量中文产品评论的情感分析问题,在对国内外情感分析技术和方法研究和分析的基础上,采用同一数据集,对传统通用情感词典进行性能测试,并通过情感分析实验对比分析基于情感词典与基于机器学习的情感分析方法的性能和特点。对Word2Vec词向量分布式表示模型和BERT语言表示模型的结构、建模思想、表义能力等方面进行深入研究,最后提出主题属性级别的细粒度情感分析方法,以实现用户评论数据的自动分类、检测和归纳,为快捷、高效和科学地评估用户满意度提供一种可能和选择。主要研究内容与结果如下:(1)传统的情感分析方法实验与测试选择了三种通用情感词典,设计实验分别测试其标注准确率和领域情感词覆盖度,使用中文酒店评论数据进行了基于词典的情感分析实验,大连理工情感词典表现出了最佳的性能;提取了多种离散特征将文本向量化,并在多个分类器上进行了情感分析实验,然后引入了基于卡方检验信息量的方法进行特征选择。结果显示以7500个信息量丰富的所有词和双词搭配,以多项式朴素贝叶斯作为分类器的模型获得了0.852的准确率,远远高于大连理工情感词典0.746的准确率,表明采用离散表示的方法可以捕捉更多的统计学和语言学特征,从而获得更好的情感分类表现。(2)基于分布式表示的情感分析方法研究使用Word2Vec和BERT两种文本分布式表示的方法来将评论文本向量化,并完成下游的情感分析任务。其中Word2Vec-Xgboost模型的情感分析准确率达到了0.866,比基于离散表示的方法准确率提升了0.014,而BERT-BiLSTM模型的准确率则高达0.890,比Word2Vec-Xgboost模型的准确率提升了0.024。结果表明,使用分布式文本表示方法可以提取出更多的语义信息和文本顺序特征,而其中的BERT模型所有层级联合调节参数的特性可以进一步处理一词多义的问题,捕获更多深层的语义和语法特征,提高情感分析的准确率。(3)基于表示学习的情感词典扩充方法研究提出了一种基于表示学习的方法来扩充情感词典,加入更多的领域相关的情感词,优化情感词典的性能。结果显示,采用Word2Vec词向量表示学习的情感词典,其总体标注准确率达到了0.855,领域情感词覆盖度达到了0.883,远超大连理工情感词典的表现,表明在进行情感分析任务时,可以使用该方法扩充情感词典,构建领域相关的情感词典和规则库。(4)主题属性级情感分析系统设计与实现设计了一个面向携程网酒店评论情感分析的系统,通过网络爬虫采集评论数据,对中科院停用词表、哈工大停用词表,四川大学智能实验室停用词库进行了融合,并结合情感分析领域的先验知识去除了去除了其中的情感词、程度副词和否定词,构造了新的停用词表并清洗了分词后的评论语料,在对文本进行向量化表示后,进行LDA主题建模,使用已经标注语料重新训练SnowNLP中情感分类模型,并对向量化表示后的文本进行情感分析,绘制了主题-情感极性分布图,并结合爬取的旅行方式、入住时间等数据,在web上进行了数据可视化。结果表明,该系统能够帮助酒店商家从多维度了解用户评价,并对经营管理策略进行优化,提升服务质量。综上所述,本文研究的情感分析方法,有效地解决了针对中文用户评论数据的自动分类、检测和归纳,快捷、高效和科学地评估用户满意度等问题,在多种文档级情感分析方法对比分析研究的基础上,提出实验基于主题和属性级的细粒度情感分析方法,并讨论了各种情感分析方法的优势以及面临的问题。在实际应用场景中,情感分析主要集中在电商、酒店、餐饮、汽车等行业。针对这些领域的特点,采用主题属性级的细粒度情感分析能帮助商家更加直观地认识用户评论数据,发现商家经营管理中的问题,从而优化产品和服务,提升行业竞争力,可以为文本情感分析技术领域提供新的技术参考,具有一定的应用和推广价值。
面向中文产品评论的情感分析研究
这是一篇关于文本分类,词向量,情感分析,深度学习,主题的论文, 主要内容为在Web2.0时代,用户是创造信息的主体。随着社交媒体和电商平台的急速发展,每天都有海量用户参与到人物、事件、产品的评论中来,这些信息有效传达了人们各种各样的观点和情感倾向。海量的中文产品评论数据为快捷、高效和科学获取用户对于产品的情感满意度提供了可能。然而,人工方法很难科学合理地对海量文本评论进行归纳和整理和应用。如何从这些非结构化的数据中挖掘出潜在的价值成为互联网产业的迫切需求。基于自然语言处理的文本情感分析技术主要是在大数据领域相关技术方法获取和处理中文用户评论数据的基础上,针对如何快速实现用户评论数据的自动分类、检测和归纳,快捷、高效和科学地评估用户满意度进行研究与应用。然而,针对具体主题领域的数据,传统文档级情感分析方法对数据的多维度认知尚存在一定程度的不足,亟待从属性角度寻求新的技术方法。针对大数据时代海量中文产品评论的情感分析问题,在对国内外情感分析技术和方法研究和分析的基础上,采用同一数据集,对传统通用情感词典进行性能测试,并通过情感分析实验对比分析基于情感词典与基于机器学习的情感分析方法的性能和特点。对Word2Vec词向量分布式表示模型和BERT语言表示模型的结构、建模思想、表义能力等方面进行深入研究,最后提出主题属性级别的细粒度情感分析方法,以实现用户评论数据的自动分类、检测和归纳,为快捷、高效和科学地评估用户满意度提供一种可能和选择。主要研究内容与结果如下:(1)传统的情感分析方法实验与测试选择了三种通用情感词典,设计实验分别测试其标注准确率和领域情感词覆盖度,使用中文酒店评论数据进行了基于词典的情感分析实验,大连理工情感词典表现出了最佳的性能;提取了多种离散特征将文本向量化,并在多个分类器上进行了情感分析实验,然后引入了基于卡方检验信息量的方法进行特征选择。结果显示以7500个信息量丰富的所有词和双词搭配,以多项式朴素贝叶斯作为分类器的模型获得了0.852的准确率,远远高于大连理工情感词典0.746的准确率,表明采用离散表示的方法可以捕捉更多的统计学和语言学特征,从而获得更好的情感分类表现。(2)基于分布式表示的情感分析方法研究使用Word2Vec和BERT两种文本分布式表示的方法来将评论文本向量化,并完成下游的情感分析任务。其中Word2Vec-Xgboost模型的情感分析准确率达到了0.866,比基于离散表示的方法准确率提升了0.014,而BERT-BiLSTM模型的准确率则高达0.890,比Word2Vec-Xgboost模型的准确率提升了0.024。结果表明,使用分布式文本表示方法可以提取出更多的语义信息和文本顺序特征,而其中的BERT模型所有层级联合调节参数的特性可以进一步处理一词多义的问题,捕获更多深层的语义和语法特征,提高情感分析的准确率。(3)基于表示学习的情感词典扩充方法研究提出了一种基于表示学习的方法来扩充情感词典,加入更多的领域相关的情感词,优化情感词典的性能。结果显示,采用Word2Vec词向量表示学习的情感词典,其总体标注准确率达到了0.855,领域情感词覆盖度达到了0.883,远超大连理工情感词典的表现,表明在进行情感分析任务时,可以使用该方法扩充情感词典,构建领域相关的情感词典和规则库。(4)主题属性级情感分析系统设计与实现设计了一个面向携程网酒店评论情感分析的系统,通过网络爬虫采集评论数据,对中科院停用词表、哈工大停用词表,四川大学智能实验室停用词库进行了融合,并结合情感分析领域的先验知识去除了去除了其中的情感词、程度副词和否定词,构造了新的停用词表并清洗了分词后的评论语料,在对文本进行向量化表示后,进行LDA主题建模,使用已经标注语料重新训练SnowNLP中情感分类模型,并对向量化表示后的文本进行情感分析,绘制了主题-情感极性分布图,并结合爬取的旅行方式、入住时间等数据,在web上进行了数据可视化。结果表明,该系统能够帮助酒店商家从多维度了解用户评价,并对经营管理策略进行优化,提升服务质量。综上所述,本文研究的情感分析方法,有效地解决了针对中文用户评论数据的自动分类、检测和归纳,快捷、高效和科学地评估用户满意度等问题,在多种文档级情感分析方法对比分析研究的基础上,提出实验基于主题和属性级的细粒度情感分析方法,并讨论了各种情感分析方法的优势以及面临的问题。在实际应用场景中,情感分析主要集中在电商、酒店、餐饮、汽车等行业。针对这些领域的特点,采用主题属性级的细粒度情感分析能帮助商家更加直观地认识用户评论数据,发现商家经营管理中的问题,从而优化产品和服务,提升行业竞争力,可以为文本情感分析技术领域提供新的技术参考,具有一定的应用和推广价值。
分布式电商主题搜索引擎研究
这是一篇关于电商,主题,搜索引擎,Nutch,Solr,Hadoop,MapReduce的论文, 主要内容为当前互联网信息规模正在不断的增长,互联网已经进入了大数据时代。人们在互联网如此海量的数据中查找到自己所需的信息变得越来越困难。人们越来越趋向于使用搜索引擎来搜索信息,而且多数情况下,人们的搜索目的往往趋向于某个特定的领域。当前互联网上的搜索引擎多数都是通用的搜索引擎,搜索的内容主题不明确,内容广泛,对于用户特定领域信息的搜索需求已经显得力不从心。随着互联网信息数据的迅速增长,主题化、智能化、个性化已经慢慢的成为搜索引擎发展的方向,特别是基于某种特定主题的搜索引擎是其中的研究热点。当前消费者获取电商产品信息依赖于电商门户网站,而无法通过搜索引擎来进行查询搜索,而且以电商为主题的搜索引擎为消费者提供相关商品信息的研究还比较少。本文针对通用搜索引擎搜索无法为用户提供深入商品信息的问题,设计开发基于电商主题的搜索引擎系统,方便用户快速准确地查询到相关的商品信息。本文以电商搜索为主题,结合实际应用需求,研究基于Hadoop的分布式主题搜索引擎以及其相关的技术原理。首先深入分析搜索引擎相关的技术原理,如网络爬虫,数据索引,中文分词,网页分类,搜索评分等主题搜索引擎必须的技术,为本文的研究打下结实的基础;然后深入剖析分布式计算框架MapReduce和分布式文件系统HDFS,引入基于MapReduce编程模型的设计方案。完成了在Hadoop平台上的系统架构设计,系统功能划分,网页爬虫流程、索引流程以及搜索流程的分析和设计,完成了三个子系统的实现与改进。在系统实现过程中引用Nutch作为网页爬虫的基本框架,引用Solr作为搜索框架,同时引入中文分词器(IK-Analyzer)来处理中文内容。在基于Nutch的网络爬虫中针对当前电商网络爬虫存在的问题做了分析并提出了解决方案。最后部署实现了4个节点的分布式搜索引擎系统,并以京东、天猫为例,对本系统进行搜索查询测试与评价。
2000年以后美国教育研究主题的特点研究——以《美国教育研究杂志》为例
这是一篇关于教育研究,知识图谱,主题,《美国教育研究杂志》的论文, 主要内容为美国教育研究在某种程度上具有代表性,因而对美国教育研究的内容进行探析具有重要的意义。本研究基于文献分析的角度,采用科学知识图谱的文献计量学的方法,以《美国教育研究杂志》期刊为研究对象,对其2001-2016年所刊载的490篇文章进行数据处理与分析,以揭示美国教育研究的主题及其变化,并对其相关内容进行反思。本研究主要从美国教育研究的关键词分析入手,从而确立美国教育研究的研究内容及主题,以此为依据来探究美国教育研究主题的内容以及特点,并从中获得一些启示。本研究共分为四个部分。第一部分为引言。作者在引言部分陈述了本研究的背景、研究意义、研究对象、研究问题与研究设计,阐述研究的思路框架,同时对选用《美国教育研究杂志》这一期刊的原因进行了说明,并对前人的研究做了简要的综述。第二部分为高频共现关键词的简要分析。作者基于《美国教育研究杂志》的文本,对2000年以后美国教育研究的高频共现关键词进行呈现和简要分析。根据可视化结果发现:美国教育研究的热点关键词主要有成就、学生、教师、学校、教学、数学、教育,并通过对相关文献的查阅分析,发现这些关键词彼此之间的相互联系。第三部分为美国教育研究的特点呈现与分析。作者根据可视化结果以及对具体文本的查阅分析,对美国教育研究的内容进行归纳整理,主要包括学生成就、种族;教师专业发展、教学工作;学校管理与学校改革;教育改革与政策、教育平等这四个方面,并根据具体的文章、联系美国的教育现实,分别对其所呈现的特点进行分析,探究呈现这些研究特点的原因。第四部分为本研究的结论与启示。作者结合美国教育的现状,总结了美国教育研究的内容及其特点,阐述相关特点形成的原因,并探析美国教育研究的发展趋势,对我国教育发展提出了相关的建议。
我国研究生教育研究主题的研究——基于1998年以来《学位与研究生教育》的文本分析
这是一篇关于研究生教育,主题,知识图谱,《学位与研究生教育》的论文, 主要内容为自改革开放以来,我国研究生教育取得了巨大的成就,适时的对研究生教育的发展经验进行有效的梳理和总结,是促进研究生教育适应社会经济新发展的重要步骤。本研究基于文献分析的角度,采用科学知识图的文献计量学的方法,以《学位与研究生教育》期刊为研究对象,对研究生教育1998年以来的研究主题进行分析,以揭示研究生教育研究主题发展的样态和特征,并对研究生教育发展的主题及其相关内容进行反思。本研究主要从研究生教育研究主题的作者的分析、研究主题的主要内容的分析、研究主题的知识基础的分析,三个角度来揭示研究生教育研究的主题。全文主要分为五个部分。第一部分是关于研究生教育研究主题的研究设计。研究设计的内容主要包括研究对象的选择、研究时间的确定、研究样本的筛选以及研究工具的操作。第二部分是关于研究生教育研究主题的作者的分析。包括宏观上对整个研究主题的作者的可视化呈现和微观上对研究主题作者的所在机构、分布地区、核心作者以及作者群的分析。通过对研究生教育研究主题的作者的宏观和微观两个角度的分析得出,研究生教育研究主题的作者在数量已经初具规模,研究主题的作者的队伍其稳定性和持续性有待提高。研究生教育研究主题的作者以学校的管理者为主,其研究机构主要分布在经济发达的地区和一些研究实力强的大学之中。整个研究生教育研究主题的作者队伍的质量有待于提高,作者间的合作度有待于加强。第三部分关于是研究生教育研究主题的主要内容的分析。以《学位与研究生教育》为载体的研究生教育研究主题的主要内容,在整体上涵盖了研究生教育的大部分内容,同时又重点集中在研究生教育的规模和结构、专业学位、培养机制改革和创新能力几个主题之上。总体上,研究生教育研究主题的主要内容与研究生教育的实践发展密切相关。经验总结式的研究多于理论总结性的研究,对研究生教育外在规律的探索多于内在规律的探索。第四部分是研究生教育研究主题的知识基础的分析。研究生教育研究的知识基础是研究生教育研究主题得以开展的基础,可以说有什么样的知识基础就有什么样的研究主题。本研究生通过可视化软件对研究生教育研究主题的知识基础进行可视化的呈现。从宏观角度对研究生教育的知识图谱进行了整体上的分析和通过几个高频次和高中心性的共被引文献对研究生教育进行了微观的分析。通过对研究生教育研究主题的知识基础的研究发现,研究生教育研究主题的知识基础在类型上已经具有了一定的多样性,但主要的被引文献比较单一,且知识基础对研究生教育研究主题内容的支持性不强。研究生教育的研究应进一步加强对研究生教育理论基础的探讨,增强研究生教育研究的理论性。第五部分是对研究生教育研究的主题的反思。通过对研究生教育研究主题的作者、主要内容以及知识基础的分析发现,研究生教育的整个研究与我国研究生教育的实践密切相关,研究生教育研究已经开始由经验的总结向规律的探讨迈进。同时还要看到现有的研究生教育的研究缺乏对研究生教育规律的探索,研究生教育研究的理论水平有待于进一步的提升。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕业设计客栈 ,原文地址:https://bishedaima.com/lunwen/52143.html