舆情监控系统中语义网络的构建及其应用的研究
这是一篇关于舆情监控,语义网络,信息建模,用户建模的论文, 主要内容为现代商业竞争激烈,企业需要及时地把握行业动态。信息数量大、种类多且质量参差不齐,对企业有效使用信息造成了巨大的困难。舆情监控系统可以监控、分类、推荐和分析舆情。目前多数舆情监控系统因为缺乏对领域知识概念的相关考虑,所以对舆情信息中相关概念的识别较为困难。因此,在舆情信息分类的过程中,难以有效利用信息中的概念进行分类。同时,在舆情信息推荐方面,由于较难识别用户关注的信息中的概念,影响了对用户的关注点的发现与判断,不利于个性化推荐。针对上述问题,本文研究面向舆情监控的语义网络的构建与应用。主要的工作内容包括:(1)针对舆情监控系统较少考虑到领域知识的问题,提出并构建面向舆情监控的语义网络。通过对公开知识图谱进行扩展,增加概念的数量以及概念间的量化关系,改善领域知识考虑不足的问题。(2)基于面向舆情监控的语义网络,提出一种针对舆情信息和用户的建模方法,强化了识别概念、发现隐含概念和突出主题的能力。(3)利用基于语义网络构造的舆情信息模型,提升了舆情信息在主流分类器下的分类效果;提出一种基于语义网络中概念间距离的相似度计算方法,有效衡量“信息-信息”和“信息-用户”的相似度,从而更好地向用户推荐舆情。(4)将上述研究应用于DETC舆情监控系统,构建了面向舆情监控的语义网络,设计并实现了舆情分类、舆情推荐、舆情分析和预警模块。
基于元搜索引擎的主题导向网络舆情采集系统研究与设计
这是一篇关于舆情监控,舆情采集,爬行策略,网页解析,SSH框架的论文, 主要内容为随着互联网的高速发展,“以用户为中心,用户参与”的开放式构架理念已深入人心,互联网用户逐渐由被动地接收网络信息向主动创造网络信息转变。门户网站、论坛、微博等网络媒介已经成为人们发布、传播和获取评论信息、表达情感、发表观点的重要平台。同时,互联网也逐渐成为舆情信息传播的重要渠道。网络媒介中的大量评论和观点等主观性文本,蕴藏着重要的经济价值和社会价值,同时也引导着社会舆论的方向。它是民众对网络事件的刺激所产生的情感、认知、态度以及行为倾向性的集合,并通过互联网传播。网络舆情的采集、监控对社会安全部门及时获取用户情感倾向、发掘、跟踪网络热点事件等方面具有重大的研究意义和现实意义。因此,众多研究机构、社会企业甚至政府单位都针对网络舆情进行了大量研究分析,欲对其进行监控、利用。本文主要以南华大学高校网络舆情监控平台为基础,对网络舆情信息采集策略进行研究,并以此设计采集系统。采取以理论研究指导实践的方法进行系统设计,首先研究了网络舆情的结构和特征,对主要的舆情采集空间和来源进行分析,结合当前国内外舆情研究的发展现状,针对当前舆情采集广泛存在的采集效率不高、目标局限性强的问题,提出一种可用户个性化主题设置的基于元搜索引擎的舆情采集策略。通过主题关键字匹配、正则表达式过滤和基于域名限定爬取的策略,保证系统爬取数据的主题相关性,过滤冗余数据,提高系统运行效率。将舆情信息的来源设定为公众集中反映意见、态度和观点、倾向的各大新闻门户网站、博客论坛、网络社区、以及微博等新兴媒介。本文研究旨在设计出一套适应高校的网络舆情监控的舆情信息采集系统,做到实时高效地挖掘出互联网中相对于高校敏感的舆论信息,对获取的数据进行清理和结构化处理,为舆情数据的倾向性分析、热点事件的发现与事件跟踪做准备。实现的主要成果有:(1)对网络舆情结构特征、采集来源进行具体研究,结合国内外舆情采集系统研究的现有技术和模式,根据南华大学网络舆情监控平台的实际需求,进行系统分析、设计;(2)分别实现对不同舆情采集来源的网页进行解析,对网页不同标签重要程度进行分析,提取相关舆情要素;(3)实现用户对舆情主题和舆情采集来源的可配置性,用户可基于主题关键字和域名对舆情信息来源进行爬取URL源设置,实现个性化舆情采集;(4)对网络舆情的爬行策略进行分析,基于元搜索引擎进行数据爬取,采用多线程并行爬取实现实时高效爬取;(5)基于JAVA开源SSH框架实现系统整体架构,将应用分为表现层、控制层、业务逻辑层和数据访问层,降低各层之间的耦合度。实现了系统的开发和测试,为整个监控系统的后续工作做好准备。
网络舆情监测系统设计
这是一篇关于舆情监控,数据采集,数据挖掘,J2EE的论文, 主要内容为舆情研究是调查和研究社会现状,了解民情的重要途径之一。舆情研究具有重要的意义,能够帮助政府相关职能机构及时了解民意,把握社会舆论走向,辅助政府决策。同时,舆情监测也可以帮助企事业单位了解客户需求,获得客户意见和投诉,有助于改进产品和服务质量,以便在激烈的市场竞争中立于不败之地。近年来,随着计算机软件技术和网络技术的快速发展,建立基于互联网的网络舆情监测系统已成为发展趋势。网络舆情监测系统是利用搜索引擎、数据挖掘和网络爬虫等先进的技术,实现对网络舆情信息的自动采集、自动分析,并开发基于web应用的网络舆情信息自动分类、舆情预警、舆情跟踪等。通过建立舆情监测平台,能及时了解最新舆情及其动向,有助于相关部门快速作出反应,及时引导舆论走向,对建设和谐社会,了解民意,具有重要的参考价值。本文是在充分了解网络舆情监测的需求和相关技术后,通过阅读国内外大量的资料和对相关软件技术和知识充分研究的基础上进行的设计。本系统在研究过程中,对近年来网络舆情监测系统建设中存在的主要问题和解决办法进行了深入研究,确定了系统建设的原则和目标。基于对舆情系统功能的要求和满足系统运行性能的充分考虑,系统主要分为舆情采集、舆情分析和基于web的舆情应用开发三个子系统。充分利用网络爬虫技术和数据挖掘技术在处理海量数据的优势,将采集到的网络信息进行分析处理,以获得我们需要的信息,并通过web应用展示出来。系统的实现将对网页、新闻、贴吧、论坛、博客等媒体进行全方位的监控,提供对重点舆情以邮件、短信息等方式进行预警,舆情信息的统计,舆情周报、月报的自动生成等相关应用服务。
网络舆情监控系统关键技术研究
这是一篇关于舆情监控,网络爬虫,文本分类,倾向性分析的论文, 主要内容为互联网及移动互联网的飞速发展,使得互联网成为信息传播和碰撞的一个重要媒介与平台。网络舆情作为社会舆情在网络中的延伸,能够充分并真实地反应社会中存在的各类问题。因此对网络舆情及其相关技术的研究对于了解和解决社会各类问题具有非常重要的意义。本文重点研究了舆情监控的相关技术和算法,设计了一套环保网络舆情实时监控系统。主要工作概括如下:一、介绍了环保网络舆情及舆情监控系统的相关知识及国内外的研究发展现状。二、研究了网络爬虫的相关技术,根据环保舆情信息源的特点设计了一个分布式爬虫系统,该系统利用异步非阻塞I/O技术实现并发,并针对不同的舆情源设计了不同的数据爬取策略,实现数据信息的更快更准确获取。三、研究了文本分类的关键技术,针对环保舆情对相关分类算法进行实验,并根据实验结果最终选用支持向量机算法对环保舆情文本进行分类。四、研究了观点倾向性词典构建的相关算法,设计了一种基于观点倾向性权重的特征词权重计算方法,实验证明该方法能够有效提高文本倾向性判断的性能。五、设计了一套环保网络舆情监控系统。该系统可以自动的从系统指定的数据源实时的采集和整理舆情信息,识别预定义的敏感主题相关的环保文本,做出倾向性检测、识别,并对得到的信息进行分析,将分析结果清晰的展示给用户,便于有关部门第一时间掌握舆情信息。
基于元搜索引擎的主题导向网络舆情采集系统研究与设计
这是一篇关于舆情监控,舆情采集,爬行策略,网页解析,SSH框架的论文, 主要内容为随着互联网的高速发展,“以用户为中心,用户参与”的开放式构架理念已深入人心,互联网用户逐渐由被动地接收网络信息向主动创造网络信息转变。门户网站、论坛、微博等网络媒介已经成为人们发布、传播和获取评论信息、表达情感、发表观点的重要平台。同时,互联网也逐渐成为舆情信息传播的重要渠道。网络媒介中的大量评论和观点等主观性文本,蕴藏着重要的经济价值和社会价值,同时也引导着社会舆论的方向。它是民众对网络事件的刺激所产生的情感、认知、态度以及行为倾向性的集合,并通过互联网传播。网络舆情的采集、监控对社会安全部门及时获取用户情感倾向、发掘、跟踪网络热点事件等方面具有重大的研究意义和现实意义。因此,众多研究机构、社会企业甚至政府单位都针对网络舆情进行了大量研究分析,欲对其进行监控、利用。本文主要以南华大学高校网络舆情监控平台为基础,对网络舆情信息采集策略进行研究,并以此设计采集系统。采取以理论研究指导实践的方法进行系统设计,首先研究了网络舆情的结构和特征,对主要的舆情采集空间和来源进行分析,结合当前国内外舆情研究的发展现状,针对当前舆情采集广泛存在的采集效率不高、目标局限性强的问题,提出一种可用户个性化主题设置的基于元搜索引擎的舆情采集策略。通过主题关键字匹配、正则表达式过滤和基于域名限定爬取的策略,保证系统爬取数据的主题相关性,过滤冗余数据,提高系统运行效率。将舆情信息的来源设定为公众集中反映意见、态度和观点、倾向的各大新闻门户网站、博客论坛、网络社区、以及微博等新兴媒介。本文研究旨在设计出一套适应高校的网络舆情监控的舆情信息采集系统,做到实时高效地挖掘出互联网中相对于高校敏感的舆论信息,对获取的数据进行清理和结构化处理,为舆情数据的倾向性分析、热点事件的发现与事件跟踪做准备。实现的主要成果有:(1)对网络舆情结构特征、采集来源进行具体研究,结合国内外舆情采集系统研究的现有技术和模式,根据南华大学网络舆情监控平台的实际需求,进行系统分析、设计;(2)分别实现对不同舆情采集来源的网页进行解析,对网页不同标签重要程度进行分析,提取相关舆情要素;(3)实现用户对舆情主题和舆情采集来源的可配置性,用户可基于主题关键字和域名对舆情信息来源进行爬取URL源设置,实现个性化舆情采集;(4)对网络舆情的爬行策略进行分析,基于元搜索引擎进行数据爬取,采用多线程并行爬取实现实时高效爬取;(5)基于JAVA开源SSH框架实现系统整体架构,将应用分为表现层、控制层、业务逻辑层和数据访问层,降低各层之间的耦合度。实现了系统的开发和测试,为整个监控系统的后续工作做好准备。
网络舆情监控系统关键技术研究
这是一篇关于舆情监控,网络爬虫,文本分类,倾向性分析的论文, 主要内容为互联网及移动互联网的飞速发展,使得互联网成为信息传播和碰撞的一个重要媒介与平台。网络舆情作为社会舆情在网络中的延伸,能够充分并真实地反应社会中存在的各类问题。因此对网络舆情及其相关技术的研究对于了解和解决社会各类问题具有非常重要的意义。本文重点研究了舆情监控的相关技术和算法,设计了一套环保网络舆情实时监控系统。主要工作概括如下:一、介绍了环保网络舆情及舆情监控系统的相关知识及国内外的研究发展现状。二、研究了网络爬虫的相关技术,根据环保舆情信息源的特点设计了一个分布式爬虫系统,该系统利用异步非阻塞I/O技术实现并发,并针对不同的舆情源设计了不同的数据爬取策略,实现数据信息的更快更准确获取。三、研究了文本分类的关键技术,针对环保舆情对相关分类算法进行实验,并根据实验结果最终选用支持向量机算法对环保舆情文本进行分类。四、研究了观点倾向性词典构建的相关算法,设计了一种基于观点倾向性权重的特征词权重计算方法,实验证明该方法能够有效提高文本倾向性判断的性能。五、设计了一套环保网络舆情监控系统。该系统可以自动的从系统指定的数据源实时的采集和整理舆情信息,识别预定义的敏感主题相关的环保文本,做出倾向性检测、识别,并对得到的信息进行分析,将分析结果清晰的展示给用户,便于有关部门第一时间掌握舆情信息。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码码头网 ,原文地址:https://bishedaima.com/lunwen/45648.html