微博网站的设计与实现
这是一篇关于SNS,微博,非关系数据库,Cassandra的论文, 主要内容为在2010年左右,Web2.0网站以及社会网络服务网站(简称SNS)在国内开始兴起,网站对数据库高并发读写的需求,对海量数据的高效率存储和访问的需求以及对数据库的高可扩展性和高可用性的需求都在日益增加,微博就是其中的代表者。目前主流微博主要使用的是Mysql数据库的分布式实践来提供数据支持。但是目前来看,仍有几个问题没有很好的解决就是如何实现系统易于扩展、低延迟、高可用和异地分布、可监控以及去中心化。为了解决这几个问题,本文在综合分析几个非关系数据库的特点后,决定使用非关系数据库Cassandra作为数据存储的解决方案。通过Spring、Struts和Hector组建MVC架构,搭建一个允许大数据量同时进行读/写操作的微博系统。使用Cassandra数据库作为数据存储,因为它具有模式灵活(特别在大型部署上)、真正的数据可扩展性、多数据中心识别等特点;而且它还提供范围查询、列表数据结构和分布式写操作,这更让它比其他传统数据库在性能上有竞争力。本文将在Cassandra中构建7个列族,通过对它们的增、删和更新操作,实现基本的微博功能如:发布微博、评论、转发微博以及关注用户。对于仅使用单个Cassandra数据库服务器的系统,它的数据处理能力跟使用关系型数据库相差不大,受实验条件的限制,无法提供具体性能数据作参考。由于非关系数据库没有了关系数据库的约束,数据的组织允许相对零散,处理数据的能力强而且允许对数据进行分析挖掘。希望以此作为一个开始,未来非关系数据库能有广阔的发展空间。
基于深度学习的微博短文本情感倾向分析
这是一篇关于数据采集,微博,情感分析,深度学习的论文, 主要内容为随着社交网络媒体的不断快速发展与进步,互联网上的文字信息急剧膨胀。微博作为目前中国最受欢迎的微博客服务,每时每刻都在产生海量的数据,这些数据包含了大量的有关网民情绪与态度的信息。如果将情感分析技术应用到微博的海量数据上,可以从海量数据中发掘出价值,利用这些数据,将有助于完善互联网的舆情监测系统,以检测物理世界中的异常或意外事件。本文将主要研索目标设定为中文短文微博,为此,本文主要做了关于以下方面的研究工作:(1)在微博数据的获取方面,本文设计了一个爬虫架构,并基于该架构实现了一个使用python语言编写的微博数据采集系统。该系统使用selenium通过模拟人工操作浏览器解决微博的身份认证问题。同时,参考聚焦爬虫的设计模式,有针对性地采集微博数据。该爬虫系统解决了逆向微博工程量大实现复杂,完全使用浏览器模拟操作文本采集过慢的问题,在理想情况下该爬虫系统的单线程采集速率可以达到每分钟约800条。(2)在情感分析方面,考虑到情感词对文本情感表达的积极影响,本文整合了几个在中文情感分析领域常用的情感词典,设计了使用情感词对词向量进行权值调整的策略。为了验证该方法的有效性,本文通过将未调整的词向量和调整过的词向量分别输入TEXTCNN和LSTM,通过多次试验比较,结果表明在使用情感词对词向量进行调整之后,TEXTCNN在情感二分类任务上达到最高分类准确度84.1%,比未进行词向量调整时分类准确度提高了2.1%,证明对词向量的调整在微博情感分类问题上有正向积极影响。(3)整合上述研究成果,对微博情感分类的系统进行了设计并对系统后台进行了实现。系统提供了对微博用户个人信息采集的接口与对关键字信息采集的接口,并且提供了对微博进行情感分析的接口,可以实现对微博数据的高效获取与对微博情感的简单分类,这为后续的研究打下良好铺垫。
基于Struts架构的校园微博系统的设计与实现
这是一篇关于微博,Struts,Memcached,jQuery的论文, 主要内容为自2006年Twitter出现以来,微博在世界范围内正处于井喷式发展时期。微博,即"微型博客(Micro Blog)",是一个基于用户关系的信息分享、传播、以及获取的平台。微博兴起于web2.0,是一种可即时发布消息的微型博客系统。其最大特征是发帖字数简短,限制在140字左右。微博平台具有用户量大,传播速度快,用户技术要求低等特点,受到大量用户的欢迎。校园微博可以用于支持教育信息资源的共享与聚合;拓展教育教学中的对于知识讨论的广泛性;提高校园官方所发布信息的易传递性;增进师生间的交流。本文主要描述了东北大学校园微博系统的设计与实现,给出了一种基于Struts、jQuery、Memcached、JSP、MySQL等相关技术的微博系统的实现。其中,Struts作为该项目的MVC框架,在此基础上,易于实现微博系统的维护和拓展;jQuery作为JavaScript框架在web2.0中具有较大的使用价值,便于实现用户与系统间的交互;Memcached作为系统缓存,在降低MySQL数据库并发访问压力、提高客户端浏览器访问速度上都具有很大作用。通过对大学信息发布方式、师生交流问题以及学生接收消息通知等方面的调查,结合微博系统在传递信息等多方面的优势,微博系统在校园教育和交流上具有一定可应用性。本文所描述并实现的微博系统具有时尚性、简洁性、互动性、响应速度快等特点,易于在校园中推广使用。
基于.NET的微博设计与实现
这是一篇关于.NET,MVC,微博,PUSH/PULL技术的论文, 主要内容为随着计算技术的发展,网络社交已经成为人们生活中重要的社会活动。微博(microblog,micro-blogging)是现在互联网浪潮中最热门的网络社交工具,然而到目前为止面向企业的微博几乎都是产品展示,客户服务类的,作为企业内部工作交流用的微博几乎没有,针对此问题,本文设计了一种能满足企业要求的微博系统,让微博在企业管理中发挥作用又能保证企业信息的安全。本文首先介绍了微博的特点和发展现状及企业内部社交的需求和重要性,然后针对企业内部信息交流的特点,提出在Visal Studio.Net 2005开发平台和数据库SQL SERVER 2005上,运用MVC的开发模式,用asp.net开发视图层,c#开发控制层,开源i Batis框架开发数据访问层,搭建企业微博系统的方案,文中详细介绍了asp.net,c#,ajax,i Batis,消息队列等web开发相关技术,为系统开发作好准备,并从技术,经济和维护管理等多方面进行可行性分析,经过论证此方案切实可行。本文的重点是企业微博系统的开发过程,通过对企业内部信息交流的需求分析,提炼出系统需要实现的功能和技术要求,在此基础上进行详细设计,将系统分为用户模块,微博模块,推送模块和后台管理四个功能模块,并详细阐述了各系统模块的功能,关键技术和实现方法。同时给出了系统的数据库结构。本系统是不同与公众化微博系统的封闭性的信息交流平台,它防止了企业内部信息外泄,将企业信息和指示分享落实到实处,促进企业内部互动,信息知识循环,支持团队协作,积累沉淀企业智慧,加快形成企业文化。在技术上引入队列服务器,将微博推送处理异步化。同时优化处理过程,将用户分为在线用户和离线用户,分别处理。这两项创新方法大大提高了系统处理效率,改善了用户体验。本文最终编写的程序,通过测试,并且能够成功发布在服务器上运行,本系统实现了微博系统的基本功能。
多媒体通讯平台构建及应用研究
这是一篇关于通讯,统一,多媒体,IM即时通讯,微博,SIP的论文, 主要内容为随着互联网通讯技术的不断发展,当前的通信领域涌现语音、视频、即时通讯、短信、微博、微信等众多通讯工具,而各种通讯工具都是提供的单项通讯服务,从而使通讯工具逻辑整合成为一项迫切的需求。 本文以多媒体通讯平台的构建及应用为研究对象,探索通讯使用者在统一的通讯平台上实现多种通讯方式的融合,目标是形成一个具备集成性、单点登录、统一通讯的软件通讯平台,增强人与人之间沟通的便捷性;本文依据CMM3、软件工程方法学、SIP最新规范、腾讯最新开放接口标准、新浪最新开放接口标准,围绕平台构建的需求搜集、需求分析、系统设计、应用开发、测试等几个方面展开描述,主要研究成果是: 1.根据软件工程方法学与CMM3要求,开展了软件的分析、设计、代码开发及测试工作,构建了以Java与C++结合的软件架构,实现了前台用户体验与后台性能保障的兼顾,为软件体系的扩展铺垫了重要基础。 2.研究了各种通讯工具提供的开放式接口标准,采用SIP协议使各种通讯工具可以进行无缝的对接,使多媒体通讯平台具备接入QQ、微博、微信、语音呼叫中心的能力,并且在后续的研发计划中将逐步使各通讯工具统一集成到多媒体通讯平台中。 3.构建了统一的通讯平台,使单点登录、统一通讯、个人通讯数据集成成为可能,这将势必促成通讯效率的提升、通讯数据的整合。 本论文致力于商业应用与科研相结合,从多媒体通讯平台的技术背景、实际应用的相关性进行分析,结合国内外该领域现状,研究多媒体通讯平台的构建目的及范围,阐述关键技术,并结合实际案例展示研究对象在商业应用中的价值。通过构建与研究过程的呈现,我们可以看到多媒体通讯平台具备整合通讯工具、整合通讯信息的重要意义,为企业深化研发该平台提供了理论指导。同时在企业营销与售后服务业务领域都会带来重要的技术提升与效率提升,具备广泛的推广价值。
基于社交关系的职位推荐系统的架构与实现
这是一篇关于职位,求职,招聘,社交网络,搜索引擎,中文分词,推荐系统,微博的论文, 主要内容为近年来,业界都在关注传统行业与互联网行业的结合点,网络招聘正是其中一个风口。社交网络的兴起对网络招聘既带来了机会,又带来挑战,一方面越来越多的企业尝试通过社交网络招聘来节省成本,但这些活跃的企业大量发布的招聘信息,对求职者来说形成了信息过载,无法快速找到合适的职位。另一方面,当人们寻找工作机会时,相较于陌生公司,社交好友所在的公司往往运营状况,薪酬待遇更加透明,所以更受青睐,而公司也乐于采用内部推荐这种成本低廉的招聘方案,但目前求职者并没有这样好的工具找到这样的机会。通过对以上问题的分析和对推荐系统的研究,本文提出了构建基于社交关系的职位推荐系统,给用户推荐其好友工作过的公司正在招聘的职位,来解决职位相关度不足和过载的问题。系统在对分布式数据抓取,短文本语义分析,搜索引擎及推荐引擎的研究基础上,通过搭建分布式数据采集系统对新浪微博上的微博数据,用户好友关系和职业信息进行采集,利用中文分词工具和自行研发的布尔逻辑组合分析微博语义,挖掘出属于职位信息的微博数据作为系统职位数据源,对用户好友关系及职业信息进行预处理,作为推荐职位的依据。通过构建职位索引来搭建搜索引擎对社交网络职位关键字搜索,再利用对用户好友的公司集合的分析,建立推荐引擎为用户推荐与自己好友公司相关的职位。最后搭建网站端和Android及i OS移动端,让用户随时随地,无缝的搜索和订阅社交网络上的职位,得到个性化的职位推荐。同时在本系统的搭建过程中,我也发现了在用户社交关系和职业信息获取,职位数据源的丰富,社交职位分析的准确性和此类职位推荐产品商业模式方面还有很多问题值得深入探索。
“双微”运用下江苏监狱系统狱务公开研究
这是一篇关于狱务公开,微信,微博,监狱的论文, 主要内容为为了加强狱务公开的影响力和舆论引导力,2015年司法部出台《进一步深化狱务公开的意见》,要求进一步深化狱务公开,创新狱务公开手段,充分利用微博、微信(简称为“双微”)等新兴媒体。因此,监狱系统的微信公众号、微博号等自媒体如雨后春笋般遍地开花。由于监狱涉足自媒体领域仅有五六年,对于狱务公开自媒体的研究不多,大部分监狱自媒体号仍在探索阶段。通过研究“双微”运用下的狱务公开,为狱务“双微”的高效运行提出可行的建议和方法,将对“双微”平台狱务公开的健康发展提供一定的帮助,对监狱系统进一步深化狱务公开工作有比较好的参考意义和价值。本文综述了国内外政务公开和狱务公开研究的主要方向和内容,以及自媒体应用研究现状。概述了江苏监狱在“双微”运用下狱务公开的情况,从“双微”的特性、狱务公开特点出发,肯定了“双微”对于深化狱务公开所达到的成效。以新公共服务理论为指导,从公民知情权、公共服务、公共利益的角度出发,指出江苏监狱“双微”运用下狱务公开存在的主要问题,即公开内容不全面、内容发布不及时、受众反馈机制不灵活、狱务公开服务不便捷等,究其原因有利用“双微”深化狱务公开的重视度不够、公民知情权意识的淡薄、公共服务意识不强、缺少统一具体的狱务公开制度规范、人力资源保障不足等。在此基础上,基于公共服务视角,运用新公共服务理论、知情权理论、议程设置理论和“使用与满足”理论,结合实际情况及其他政务“双微”的实践经验,提出了对策建议,包括确立狱务“双微”的规范程序、加强组织领导和团队建设、严格工作考核和监督、优化“双微”服务功能、打造监狱“双微”特色内容、借助他方力量宣传和传播监狱“双微”等,以期提高“双微”上的狱务公开成效,增强执法公信力。
基于云计算的微博推荐系统研究与实现
这是一篇关于微博,推荐,云计算,Hadoop的论文, 主要内容为目前,随着互联网的发展、网络应用和手机应用的普及,微博平台用户越来越多,产生的数据量也越来越多。随着数据量的增加,传统的数据处理方式很难满足人们的需求,网民需要速度更快、效率更高的数据处理方式。网民对于现状的不满足,促使了云计算和推荐系统的发展。 为了解决上述问题,本文主要进行了一下工作: 1.介绍了云计算的概念,部署模式以及SPI服务模式和目前国内外研究现状,重点分析了Apache社区组织提供的开源Hadoop云计算并行编程框架系统,并通过积极努力尝试,成功搭建Hadoop分布式云计算平台,为后面的实验提供了基础设施保障。 2.介绍了推荐系统的相关技术,针对各种不同的推荐算法的推荐过程、特点和关键技术进行了详细分析。重点剖析了基于用户和基于项目的协同过滤推荐算法,并分析比较了目前解决冷启动问题的各种算法,指出了各自的优缺点。针对数据稀疏问题,论文提出了混合协同过滤微博推荐算法。基于用户的协同过滤对于用户之间的相似度非常依赖,同理基于项目的协同过滤对于项目之间的相似度会非常依赖。混合推荐算法,它结合两种协同过滤推荐算法,避免过分依赖用户或者项目属性。 3.分析了微博平台的特征以及微博用户的特征,对用户进行分类,将用户分为:新用户、老用户两大类。老用户又分为:关注量多、粉丝量多两类。根据分类对不同的用户采用不同的推荐算法。新用户根据用户自定义的标签,采用标签推荐算法;老用户根据自己的粉丝量和关注量的比值来选择采用哪种推荐算法,当关注量多时,选择基于用户的协同过滤推荐算法,当粉丝数量多时,选择基于项目的协同过滤推荐算法。 4.结合具体的实验,来混合协同过滤微博推荐算法的优越性。在推荐质量方面,将混合协同过滤微博推荐算法与基于用户的系统过滤推荐算法、基于项目的协同过滤推荐算法进行比较,实验证明混合协同过滤微博推荐算法的推荐质量更高。在响应时间方面,实验从输入数据的大小与分布式环境中节点数量的多少两方面验证了混合协同过滤微博推荐算法的优越性。 5.将混合协同过滤微博推荐算法与云平台——Hadoop相结合。设计并实现了一个以新浪微博数据为数据集的推荐系统。该系统利用Hadoop高效的运算速度,无限的存储容量等优点,优化推荐算法。使得推荐系统面对庞大的数据量能够快速、高效的处理。也使得推荐系统在并行计算、容错性和可扩展性方面都有所提高。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码助手 ,原文地址:https://bishedaima.com/lunwen/46137.html