给大家推荐5篇关于抽取的计算机专业论文

今天分享的是关于抽取的5篇计算机毕业论文范文, 如果你的论文涉及到抽取等主题,本文能够帮助到你

基于网络爬虫的基金信息抽取与分析平台

这是一篇关于网络网虫,抽取,J2EE,报表的论文, 主要内容为随着信息技术的普及与发展,计算机应用作为现代社会一个不能缺少的工具已渗透到日常生活的每一个角落。在日常的计算机应用中,尤其是金融行业中基金公司的信息系统中,涉及到大量数据的处理。目前,基金公司的应用系统都是根据公司现有数据库的数据来开发应用系统。本文针对系统后台数据的获取以及系统前台数据处理进行展现,设计出基于网络爬虫的基金信息的抽取与分析平台。该系统具有良好的稳定性、可扩展性、跨平台性,不仅仅只适应于基金公司,而且只要进过简单修改就能适应于各行各业。具体工作包括系统后台的网页抓取与网页的抽取,以及系统前台J2EE三层架构设计与系统报表的实现。系统后台网页的抓取采用Heritrix网络爬虫实现,并对保存到文件系统的网页利用HTMLParser进行信息数据抽取,作为公司的数据库数据来源,能实时地获取到互联网数据,具有解决实时网络数据埋没的优点。在系统的前台是基于Hibernate、Struts、Spring开源框架搭建三层松散的J2EE架构模型,并在JSP页面中获取查询请求条件进行数据业务逻辑的处理,在前台利用Open Flash Chart、JS Chart动态生成报表,以一种直观、易理解的方式展现给用户。在对系统的需求、研究、实现的基础上,给出了基于互联网上的网页经过该系统后,展示出来的是有参考价值的数据报表模型,并在最后给出了系统的实现过程。

基于网络爬虫的基金信息抽取与分析平台

基于深度学习的中文人物关系抽取模型研究与应用

这是一篇关于中文语料,人物关系,抽取,预训练,BERT的论文, 主要内容为实体关系抽取是自然语言处理领域的一个重要下游任务,其中人物之间的关系抽取任务是实体关系抽取中的典型任务。对语料中的人物关系进行识别和抽取,可以为构建人物社会关系网、生成用户画像以及搭建专家推荐系统提供帮助和支持。针对中文语料人物关系抽取这一课题,本文在分析了人物关系抽取的研究背景、研究现状以及相关技术之后,从标注数据集预处理,再到使用深度学习网络模型完成了中文语料人物关系抽取任务,最后搭建了一个人物关系知识图谱原型系统,期间主要开展了以下两个方面的工作:首先,本课题在大规模的中文语料人物关系抽取标注数据匮乏的情况下,在小规模标注数据集(数据量大约为30000条)上取得了良好的人物关系抽取效果。本研究基于预训练双向语言模型BERT强大的语言表征能力和特征提取能力,提出了有监督的流水线关系抽取模型。为得出最佳的模型组合以及说明模型的优越性,本研究设计了三组对比试验,实验一对比Bi LSTM和Bi GRU在捕获双向语义依赖上的表现,得出Bi GRU综合性能更优的结论;实验二对比带有不同头数的句子级的自注意力对模型性能的提升,得出带有12头注意力机制的模型的综合效果更佳的结论;实验三在实验一和实验二的基础上得出的最佳模型组合BERT＿Bi GRU＿ATT(12)＿FC,对比该模型与其他经典关系抽取方法在本研究数据集上的表现。实验表明本文提出的模型在F1值或其他指标上均优于其他经典模型,有力地验证了本研究所提出的抽取模型在中文语料人物关系抽取任务上的有效性。其次,根据本研究提出的关系抽取模型BERT＿Bi GRU＿ATT(12)＿FC,搭建了基于B/S架构的中文人物关系知识图谱原型系统。笔者在文中介绍了需求分析、系统设计、系统实现和系统测试,将学术研究付诸于实际应用。