基于Python的Django框架实现的人物信息检索系统

代码向导 • 2024年05月14日 11:27 • 其他源码 • 阅读 8

基于Python的Django框架实现的人物信息检索系统 1 简介这是一个利用Django搭建的一个人物信息检索系统，大约从Wikipedia爬取了10000 个人物信息

本文包含相关资料包-----> 点击直达获取<-------

基于Python的Django框架实现的人物信息检索系统

1 简介

这是一个利用Django搭建的一个人物信息检索系统，大约从Wikipedia爬取了10000 个人物信息，并且提取了其中 Infobox 的对应信息。

对于 Wikipedia 中爬取的信息，我们重新组织了其格式并且进行显示。

左侧为搜索页面，右侧为搜索结果，匹配的字段被高亮显示。

对于已经爬取的信息，我们提供了一个对其进行搜索的页面，可以根据关键词在其中搜索，并且还可以根据原先 Infobox 中的标题进行特定字段的查询（例如 Born、 Died、Name、Nationality 等），同时还可以让用户自行添加可以查询的字段。

搜索的结果按照匹配的关键字个数从高到底排序后显示，如果结果过多将会分页显示。同时匹配的关键字会被高亮标出。

左侧为搜索结果过多时的分页显示效果，右侧为按照字段搜索 Born 中含 1997 的人物结果。

Alan Turing 信息的展现。

2 部分实现

爬虫部分利用 BeautifulSoup 来处理获取的页面，提取 Infobox 中的信息。

具体来说，人物超链接的爬取是通过寻找 ID 为 mw-content-text 的元素下所有 li 标签的第一个超链接来实现的。在爬取完毕后检查是否存在 infobox，如果存在则开始提取信息。由于其中信息具有一定规律（例如大部分信息是以标题、内容的形式来组织的），只需要用 BeautifulSoup 提取相应的以及部分即可。前端界面利用 Bootstrap 来优化显示效果。

关于数据的存储，在提取出信息后利用 JSON 来保存在 sqlite 数据库中，并且额外提取出一个关键字字符串用于搜索。对于每个人物都会分配一个唯一的 ID 以方便索引。分页功能利用了 Django 自带的 Paginator 类。查询关键词的高亮以及自定义字段搜索框的增加与删除使用 Javascript 在前端完成。

参考文献

文本搜索引擎的探究与设计（华南理工大学·张立）
基于Docker的智能云平台系统的设计与实现（华南理工大学·曾圣钊）
XX公司人力资源管理系统的设计与实现（电子科技大学·龚畅）
基于JAVA平台的企业人事档案管理系统的设计与实现（吉林大学·王晓君）
基于JAVA平台的企业人事档案管理系统的设计与实现（吉林大学·王晓君）
基于J2EE的分布式信息检索查询平台的研究（北京化工大学·高峰）
基于J2EE的分布式信息检索查询平台的研究（北京化工大学·高峰）
基于云的统一身份智能信息管理系统设计实现（华南理工大学·水凯凯）
基于Docker的智能云平台系统的设计与实现（华南理工大学·曾圣钊）
网络新闻中人物识别系统的设计与实现（北京邮电大学·刘畅）
基于Docker的智能云平台系统的设计与实现（华南理工大学·曾圣钊）
基于Python的非结构化数据检索系统的设计与实现（南京邮电大学·董海兰）
基于JavaEE和XML的分布式信息检索系统设计与实现（山东大学·牛拥军）
基于Java平台的网络资源搜索系统的设计与实现（电子科技大学·李梦雅）
XX公司人力资源管理系统的设计与实现（电子科技大学·龚畅）

本文内容包括但不限于文字、数据、图表及超链接等）均来源于该信息及资料的相关主题。发布者：代码向导，原文地址：https://bishedaima.com/yuanma/35271.html

Python Django框架人物信息检索

资源下载

本站所有项目都经过严格测试,直连告诉下载项目包, 毕设课设定制需求, 点此提交表单

代码都经过了认真的调试,不免费哦联系QQ2625289483 更多资料关注公号: 大学生学习圈

jsp日记本系统、javaweb+mysql

日记本系统一直是人们记录生活，思考和感受的重要工具之一，随着互联网技术的发展，基于网络的日记本系统越来越受到人们的关注和需求，本论文旨在通过基于JSP和Servlet技术的日记本系统

毕设港湾
2024年05月07日
8 1 1 3
基于SpringBoot框架的社区养老服务平台

这是一份采用🔥🔥SpringBoot核心框架构建的社区养老服务中心的源代码项目，主要编程语言为Java，并结合了Vue技术进行开发，开发工具选择的是Idea或Eclipse

代码向导
2024年05月23日
9 1 2 2
基于Android的电子词典安卓APP源码

这是一个🔥🔥基于Android的电子词典安卓APP源码🔥🔥的项目源码，开发语言Java，开发环境Idea/Eclipse，这个电子词典安卓APP开发技术栈为安卓项目

源码码头网
2024年05月23日
9 1 2 3
基于Springboot+Redis+Mysql+Boostrap实现的高校社团管理系统

Sprinboot学生社团管理系统 1，项目简介高校社团管理系统分为前后台，角色分为三种：管理员，社长，普通社员，超级管理员角色包含以下功能：会员管理

代码导航
2024年05月14日
20 1 4 1
python实现的面向推荐系统的数据挖掘

python实现的面向推荐系统的数据挖掘摘要信息化世界存在着大量的数据，如何在大量的数据中为每一个用户找到其所需求的数据成为了一个问题，本文尝试以包括基于用户的协同过滤算法

毕设助手
2024年05月14日
5 1 1 3
基于JAVA FX实现的酒店预订系统网站

基于JAVA FX实现的酒店预订系统网站 1 产品概述参考酒店预订系统用例文档和酒店预订系统软件需求规格说明文档中队产品的概括描述，酒店预订系统主要是应用于网上预定远程酒店订单的在线系统

毕业设计客栈
2024年05月14日
5 1 2 1
基于javaweb的记账系统、java+ssh+mysql实现

这是一个🔥🔥基于javaweb的记账系统，ssh+mysql实现🔥🔥的项目源码，开发语言Java，开发环境Idea/Eclipse，这个记账系统开发技术栈为SSH项目

代码工坊
2024年05月23日
5 1 1 1
基于SpringBoot框架的企业设备管理系统

这是一套采用Java编程语言，基于SpringBoot框架构建的✨✨企业级设备管理系统的源代码实现✨✨，开发工具为Idea或Eclipse，技术栈融入了SpringBoot和Vue

代码项目助手
2024年05月23日
14 1 2 2
python数据分析

python数据分析（5）——数据预处理（下） 3，数据变换 3，1 简单函数变换常用的变换包括平方，开方，取对数，差分运算等 3，2 规范化为了消除指标之间的量纲和取值范围差异的影响

源码项目助手
2024年05月14日
3 1 1 2
基于python实现的日志系统

企业级的网站日志不能公开，但是我的是个人网站，用来跟大家一起学习的，所以，需要将百度的统计页面展示出来，但是，百度并不提供日志的图像，只提供API给开发者调用，而且还限制访问次数

源码港湾
2024年05月14日
2 1 2 1

发表回复

登录后才能评论