面向商品用户评论的检索系统设计与实现
这是一篇关于Web开发,商品评论,检索,机器学习的论文, 主要内容为随着互联网和大数据的日益发展,网络购物在人们日常生活中扮演越来越重要的角色。信息检索成为网络购物进行商品筛选的一种有效手段。近年来,针对消费者的网购调查发现消费者在购物时最关注商品的用户评论这类信息。商品的用户评论可以具体反映出消费者对商品的切实感受,有助于评判商品的综合质量。本文旨在构建一个面向商品用户评论的检索系统。该系统能有效地利用商品的用户评论,通过文本或图像检索商品评论,辅助用户更好地选购商品。具体而言,本文从实用性出发,结合Web应用开发技术和机器学习等技术,设计得到便捷性以及适用性都相对较好的商品用户评价检索系统。本系统涵盖六项功能:注册/登录功能、用户信息管理功能、用户评论检索功能、数据收集功能、数据分析处理功能和系统管理功能。本文检索系统由两个子系统构成:Web子系统、数据收集与处理子系统。Web子系统负责与用户的接口,为用户提供注册、登录、个人信息管理以及界面展示等功能。它包括网站前端、网站后端、数据存储三个模块。Web子系统使用数据收集与处理子系统的加工数据执行工作。数据收集与处理子系统负责从网络获取商品数据完成基于文本或图像的评论检索。它包括数据收集和数据处理两个模块。数据收集模块从电商平台上爬取商品图片及相应评论,然后交给数据处理模块。针对商品评论进行去冗余处理,然后采用循环神经网络构建情感分析模型,确定评论的情感极性。采用搜索树算法建立以文搜图的评论检索方法;采用卷积神经网络进行特征提取,利用K-Means聚类算法建立以图搜图的评论检索方法。数据收集与处理子系统为Web子系统提供了应用数据。测试表明该系统能够完成用户注册/登录、用户信息管理、系统管理等系统功能,而且能够完成对商品评论的情感极性分析,在此基础上可以及时响应基于图或文到商品用户评论的检索。
基于分布式的搜索引擎技术研究与设计
这是一篇关于分布式计算,搜索引擎,爬行,索引,检索,Hadoop,PageRank的论文, 主要内容为随着计算机技术、互联网技术的快速发展,网络上的信息几乎是呈现爆炸式增长,这对传统的搜索引擎技术带来不小的挑战。面对海量数据的处理和存储,人们对搜索引擎的需求,不仅仅局限于能够尽可能地获取准确的检索结果,还需其具有更好的时效性,更高的可扩展性,更低的故障率。大数据时代,对数据的处理能力要求越来越高,随着分布式计算技术的不断发展,以及云计算的不断普及,基于分布式的搜索引擎无疑会成为未来发展的趋势。本论文针对基于分布式的搜索引擎,论述了国内外对搜索引擎的研究现状以及未来发展的趋势,分析了搜索引擎的工作原理,详细介绍了分布式搜索引擎涉及的相关理论技术。对主要的几种分布式搜索引擎方案进行对比分析,研究改进措施,提出了基于Hadoop的分布式搜索引擎技术方案。根据搜索引擎本身特点,将搜索引擎分为爬行、索引、检索三个子模块,对系统的每个子模块进行详细设计并实现,将Hadoop的Map/Reduce模型和分布式文件系统HDFS应用在整个搜索引擎中。在原有PageRank算法基础,进行优化,添加用户访问反馈影响因子,提出一种基于用户访问反馈的PageRank算法,来对网页进行评分。利用轻量级Web应用框架SpringMVC对检索子模块进行构建,视图层采用新一代Java模板引擎jetbrick-template替代Jsp,提高了页面加载速度,提升搜索引擎的时效性。最后,对实验环境进行介绍和部署,搭建分布式搜索引擎系统,对实现的搜索引擎系统从功能、可靠性、可扩展性几个方面分别进行了测试。对实验结果进行对比和分析,论证了基于Hadoop的分布式搜索引擎技术方案的可行性。
基于分布式的搜索引擎技术研究与设计
这是一篇关于分布式计算,搜索引擎,爬行,索引,检索,Hadoop,PageRank的论文, 主要内容为随着计算机技术、互联网技术的快速发展,网络上的信息几乎是呈现爆炸式增长,这对传统的搜索引擎技术带来不小的挑战。面对海量数据的处理和存储,人们对搜索引擎的需求,不仅仅局限于能够尽可能地获取准确的检索结果,还需其具有更好的时效性,更高的可扩展性,更低的故障率。大数据时代,对数据的处理能力要求越来越高,随着分布式计算技术的不断发展,以及云计算的不断普及,基于分布式的搜索引擎无疑会成为未来发展的趋势。本论文针对基于分布式的搜索引擎,论述了国内外对搜索引擎的研究现状以及未来发展的趋势,分析了搜索引擎的工作原理,详细介绍了分布式搜索引擎涉及的相关理论技术。对主要的几种分布式搜索引擎方案进行对比分析,研究改进措施,提出了基于Hadoop的分布式搜索引擎技术方案。根据搜索引擎本身特点,将搜索引擎分为爬行、索引、检索三个子模块,对系统的每个子模块进行详细设计并实现,将Hadoop的Map/Reduce模型和分布式文件系统HDFS应用在整个搜索引擎中。在原有PageRank算法基础,进行优化,添加用户访问反馈影响因子,提出一种基于用户访问反馈的PageRank算法,来对网页进行评分。利用轻量级Web应用框架SpringMVC对检索子模块进行构建,视图层采用新一代Java模板引擎jetbrick-template替代Jsp,提高了页面加载速度,提升搜索引擎的时效性。最后,对实验环境进行介绍和部署,搭建分布式搜索引擎系统,对实现的搜索引擎系统从功能、可靠性、可扩展性几个方面分别进行了测试。对实验结果进行对比和分析,论证了基于Hadoop的分布式搜索引擎技术方案的可行性。
基于.NET的有色冶金信息化服务平台及一种网络爬虫的研究与实现
这是一篇关于AJAX,有色冶金,信息化,检索,网络爬虫的论文, 主要内容为我国有色冶金行业大部分处在信息闭塞的偏远地区,他们要想获取比较先进的工艺或设备等来改进生产十分不容易。因此实现出能集中收录有色冶金相关信息的有色冶金信息化服务平台,为有色冶金行业提供信息共享服务很有必要。 本文通过对我国有色冶金行业现状进行分析,提出了构建有色冶金信息化服务平台来集中收录有色冶金行业动态、新工艺、新设备、生产流程、文献期刊等信息为有色冶金企业提供信息共享服务,以帮助其解决信息不畅的问题。平台还可以为从事有色冶金行业研究工作的单位或机构提供信息支撑,为行业的建设和相关学科的发展起到积极推动作用。 平台由十二个子库组成,分别为有色冶金金属知识库、有色冶金生产流程库、有色冶金专利库、有色冶金设备库、有色冶金企业库、有色冶金论文库、有色冶金图书库、有色冶金科技动态库、有色冶金行业专家库、有色冶金法律法规库、有色冶金业高校科研所库及在线服务模块。文章首先阐述了平台的整体建设目标,介绍系统中各个子库的功能。然后以其中的设备库和论文库为重点进行需求分析,并搭配例图和框图对平台的结构设计、数据库的设计和其他功能模块的设计进行了描述。平台以C#作为ASP.NET页面的开发语言、SQL Server2008作为后台数据库系统,三层体系结构作为实现架构。由于论文库的实现涉及的知识较多,且较为典型,因此文章以论文库的实现为例阐述平台的具体实现。在对论文库中的数据进行索引创建的过程中,采用了一种能充分利用现代多核计算机性能的多核并行算法来提高索引的创建效率。对于数据库连接与操作部分,实现并封装了一种不依赖于某种具体数据库类型的类库来完成数据库的访问与操作来降低平台与数据库的耦合度。又以数据自动提示与自动验证为例介绍了AJAX技术在本平台中的应用等。 由于平台的主要任务是集中收录有色冶金行业的相关信息为行业提供信息共享服务,那么网络作为信息载体之一,若想将里面蕴藏的丰富信息采集回来为平台所服务就不能仅仅凭借人力。为了解决平台的这一数据收集问题,文中实现了一种能适应AJAX页面信息采集的网络爬虫系统来自动收集平台所需的相关信息。该系统是用C#语言编写的winform程序。系统通过结合协议驱动采集与事件驱动采集两种网页信息采集方式,根据采集内容的特征区分采集方法,然后通过匹配规则模板来实现信息的快速采集,在结尾处还对爬虫系统功能进行了验证。
基于CAD平台的建筑设计院电子图档管理系统的设计与实现
这是一篇关于工程图纸,图档管理,检索,Autocad,二次开发的论文, 主要内容为设计企业的主要技术文件是工程图纸,它不仅是企业多年技术研发与实践的积累,还是未来抢占市场,提高综合竞争力的重要基础。尽管随着智能设备的引入,当下很多企业都采用电脑来存储设计电子文档,然而分散存放在设计人员个人计算机中的电子图档巨大数量,无法实现统一管理。企业缺乏针对电子图纸统一管理的有效手段,致使电子图档不断地流失。但是在工程设计过程中,经常会出现由于各种原因需要查阅一些老工程的设计的图纸。当下设计院的查图工作主要依靠人工来完成,因为设计图的归档版本众多,而且经常是多个CAD图存在于一个DWG文件中,致使图档查询的速度低下,准确率低,大量的物、财、人力被浪费掉。对于这种状况,设计院急切需要一种可以在设计者出图的时候实现自动将其dwg文件内的图签信息给予提取,并自动存放归档,与此同时,院内的相关人员的能够查询下载电子图纸的图档管理系统。本设计的主要内容包括针对图签内的关键信息,针对工程图纸的管理的数据提取,并且可以对所提取数据的数据库展开管理。全部系统在Autocad平台上采用object arx当作开发工具,实现操作SQL数据库管理系统。设计本着面向对象程序的开发方式,经过对图纸信息自动提取技术的分析和研究,设计了根据建筑设计院的标准图签中内容,达成对工程图纸信息的采集。提取到的图档相关信息都将被自动存到关系数据库。最后利用数据库的有关操作手段达成了对采集出的工程图纸资料信息进行高效的精确的查找。本方案针对建筑设计院的电子图档存储管理的实际情况立题,达成解决建筑设计院电子图档存储管理过程中的数据统计、查询和汇总的实际要求,是对产品数据管理(PDM)系统实现重要补充。
基于CAD平台的建筑设计院电子图档管理系统的设计与实现
这是一篇关于工程图纸,图档管理,检索,Autocad,二次开发的论文, 主要内容为设计企业的主要技术文件是工程图纸,它不仅是企业多年技术研发与实践的积累,还是未来抢占市场,提高综合竞争力的重要基础。尽管随着智能设备的引入,当下很多企业都采用电脑来存储设计电子文档,然而分散存放在设计人员个人计算机中的电子图档巨大数量,无法实现统一管理。企业缺乏针对电子图纸统一管理的有效手段,致使电子图档不断地流失。但是在工程设计过程中,经常会出现由于各种原因需要查阅一些老工程的设计的图纸。当下设计院的查图工作主要依靠人工来完成,因为设计图的归档版本众多,而且经常是多个CAD图存在于一个DWG文件中,致使图档查询的速度低下,准确率低,大量的物、财、人力被浪费掉。对于这种状况,设计院急切需要一种可以在设计者出图的时候实现自动将其dwg文件内的图签信息给予提取,并自动存放归档,与此同时,院内的相关人员的能够查询下载电子图纸的图档管理系统。本设计的主要内容包括针对图签内的关键信息,针对工程图纸的管理的数据提取,并且可以对所提取数据的数据库展开管理。全部系统在Autocad平台上采用object arx当作开发工具,实现操作SQL数据库管理系统。设计本着面向对象程序的开发方式,经过对图纸信息自动提取技术的分析和研究,设计了根据建筑设计院的标准图签中内容,达成对工程图纸信息的采集。提取到的图档相关信息都将被自动存到关系数据库。最后利用数据库的有关操作手段达成了对采集出的工程图纸资料信息进行高效的精确的查找。本方案针对建筑设计院的电子图档存储管理的实际情况立题,达成解决建筑设计院电子图档存储管理过程中的数据统计、查询和汇总的实际要求,是对产品数据管理(PDM)系统实现重要补充。
基于.NET的有色冶金信息化服务平台及一种网络爬虫的研究与实现
这是一篇关于AJAX,有色冶金,信息化,检索,网络爬虫的论文, 主要内容为我国有色冶金行业大部分处在信息闭塞的偏远地区,他们要想获取比较先进的工艺或设备等来改进生产十分不容易。因此实现出能集中收录有色冶金相关信息的有色冶金信息化服务平台,为有色冶金行业提供信息共享服务很有必要。 本文通过对我国有色冶金行业现状进行分析,提出了构建有色冶金信息化服务平台来集中收录有色冶金行业动态、新工艺、新设备、生产流程、文献期刊等信息为有色冶金企业提供信息共享服务,以帮助其解决信息不畅的问题。平台还可以为从事有色冶金行业研究工作的单位或机构提供信息支撑,为行业的建设和相关学科的发展起到积极推动作用。 平台由十二个子库组成,分别为有色冶金金属知识库、有色冶金生产流程库、有色冶金专利库、有色冶金设备库、有色冶金企业库、有色冶金论文库、有色冶金图书库、有色冶金科技动态库、有色冶金行业专家库、有色冶金法律法规库、有色冶金业高校科研所库及在线服务模块。文章首先阐述了平台的整体建设目标,介绍系统中各个子库的功能。然后以其中的设备库和论文库为重点进行需求分析,并搭配例图和框图对平台的结构设计、数据库的设计和其他功能模块的设计进行了描述。平台以C#作为ASP.NET页面的开发语言、SQL Server2008作为后台数据库系统,三层体系结构作为实现架构。由于论文库的实现涉及的知识较多,且较为典型,因此文章以论文库的实现为例阐述平台的具体实现。在对论文库中的数据进行索引创建的过程中,采用了一种能充分利用现代多核计算机性能的多核并行算法来提高索引的创建效率。对于数据库连接与操作部分,实现并封装了一种不依赖于某种具体数据库类型的类库来完成数据库的访问与操作来降低平台与数据库的耦合度。又以数据自动提示与自动验证为例介绍了AJAX技术在本平台中的应用等。 由于平台的主要任务是集中收录有色冶金行业的相关信息为行业提供信息共享服务,那么网络作为信息载体之一,若想将里面蕴藏的丰富信息采集回来为平台所服务就不能仅仅凭借人力。为了解决平台的这一数据收集问题,文中实现了一种能适应AJAX页面信息采集的网络爬虫系统来自动收集平台所需的相关信息。该系统是用C#语言编写的winform程序。系统通过结合协议驱动采集与事件驱动采集两种网页信息采集方式,根据采集内容的特征区分采集方法,然后通过匹配规则模板来实现信息的快速采集,在结尾处还对爬虫系统功能进行了验证。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设港湾 ,原文地址:https://bishedaima.com/lunwen/46785.html