输电线路监拍装置AI能力测试方法研究与实现
这是一篇关于监拍装置,AI能力测试,自动标注,样本分级,目标检测的论文, 主要内容为随着输电线路监拍装置的广泛应用,监拍装置对输电线路周围环境隐患目标的检测性能受到越来越多地关注,但目前在输电线路监拍装置AI能力的测试中,缺乏成套的测试系统,测试效率低;且原有的评价指标难以直观有效地分析测试结果;同时,测试样本的构建过程完全由人工进行,既耗费了大量的人力,又可能由于人工的失误造成样本误标注、漏标注的问题,导致监拍装置AI能力的测试结果不够准确。针对上述问题,设计能够实现构建测试样本和自动测试AI能力的监拍装置测试系统具有重要意义。由于监拍装置属于嵌入式设备,通过对嵌入式系统的测试方法、测试过程及测试样本设计过程的分析,提出AI能力的评价指标和AI能力测试系统的总体设计方案。测试系统主要包括测试样本的构建和自动化交叉测试过程,测试样本的构建过程由测试样本的自动标注、分级和人工修正完成;自动化交叉测试通过目标检测能力测试单元、电流采集单元和综合处理单元协同实现。为满足测试样本自动标注的需要,提出改进Center Net目标检测模型的方法对测试样本进行标注。针对原Center Net模型主干网络层数少、特征提取不充分、预测位置有偏差等问题,首先设计包含ECA的Efficient Net-B0网络进行特征提取,并提出AF-Bi FPN模块进行特征融合,丰富隐患目标的特征信息,之后引入MIOU损失将目标的中心点位置和尺寸进行联合预测,减少目标检测过程的位置偏差,进而实现测试样本的自动标注。为进一步定性地判断监拍装置的AI能力,以隐患目标外部特征表现完整度为根据对测试样本进行分级,进而评估监拍装置AI能力的等级。测试样本的分级由改进YOLOv4的目标检测模型实现。针对隐患目标尺度差异较大且YOLOv4对较小目标特征提取不充分的问题,设计多尺度空洞卷积模块、引入CBAM注意力机制和FRM特征细化模块,提高模型对不同尺度目标的检测能力,进而实现测试样本的分级。通过分析测试样本的构建过程和自动化交叉测试的原理,设计了测试样本构建工具、研发了AI能力测试软件,并结合工控机、电流监测设备和交换机等硬件设备搭建AI能力测试系统,实现了对监拍装置AI能力的测试。
面向经济知识图谱构建中文关系抽取算法的研究与应用
这是一篇关于经济领域知识图谱,中文关系抽取,远程监督,自动标注的论文, 主要内容为随着信息化时代的高速发展,近些年来互联网技术得到了爆炸式的飞速发展,同时互联网在各行各业广泛普及应用,互联网上文本数据呈爆炸式增长。虽然互联网上海量的、多样的数据让人们获取知识变得更加容易,但是其中大量的无用的数据同样让人们高效准确地获取知识变得更加困难。人们迫切希望一种技术能够从海量的数据中抽取有用的知识,当人们需要某种知识时可以直接准确获取,而不需要人工筛选。知识图谱正是在这种情况下诞生的,知识图谱就是覆盖在海量数据上的知识网络结构,它从海量的数据中抽取有用的知识,以实体关系三元组的形式结构化呈现给用户,让人们可以快速准确地获取需要的知识,而实体关系抽取则是构建知识图谱的核心技术。因而,知识图谱和实体关系抽取从提出至今一直是热门研究方向,面向领域知识图谱研究实体关系抽取算法在学术上和工程上都有极大的价值和意义。本文首先介绍了知识图谱和实体关系抽取算法在国内外的发展历程和研究现状,然后分析了知识图谱和实体关系抽取的相关技术,接着在此基础上面向经济领域知识图谱深入研究实体关系抽取算法,并在已有的经典算法模型基础上进行优化改进,提出了本文改进的基于远程监督的实体关系抽取算法,最后将本文改进的算法模型应用于实际的经济领域的具体数据上,成功搭建了经济领域的大数据知识图谱中心系统。整体来讲,本文的具体工作和主要贡献如下所示:(1)针对远程监督实体关系抽取算法的数据自动标注模块存在的准确率和召回率较低的问题,本文在已有算法模型的基础上进行优化,提出了本文的联合关系特征词与句子相似度的自动标注算法。具体来讲,首先,结合依存句法分析改进句子相似度,使得句子相似度主要依赖于和实体对相关的句子成分,强调实体对对句子的约束条件,然后,结合本文改进的句子相似度计算方法和传统的关系特征词匹配方法实现本文的数据自动标注算法,最后,将本文改进的数据自动标注算法与经典的Mintz方法、关系特征词扩展方法和关键词相似度方法进行了对比实验,实验结果证明了本文的数据自动标注算法相较于Mintz方法在准确率上有着极大的提升,相较于关系特征词扩展方法和关键词相似度方法在准确率和召回率上都有较好的提升;(2)针对已有的远程监督关系抽取模型忽略了句子中的关系受实体对约束的问题和经典算法PCNNs-ATT模型面向经济领域具体中文数据存在的中文分词噪声传递、多关系分类以及重复计算这些具体小问题,本文在PCNNs-ATT模型的基础上,设计了基于依存句法分析的拟字符注意力机制,实现了实体对对句子中关系的约束条件,同时引入字词混合向量、多标签问题和关系表示解决了中文分析噪声传递、多关系分类和重复计算的问题,最终提出了本文的PCNNs-ATT-DP模型,实现远程监督关系抽取,最后,将本文改进的PCNNs-ATT-DP模型与经典的Mintz模型、MIML模型、PCNNs模型和PCNNs-ATT模型进行了对比实验,实验结果证明了本文改进的PCNNs-ATT-DP模型在经济领域中文数据的实体关系抽取任务中,相较于其他经典的Mintz模型、MIML模型、PCNNs模型以及PCNNs-ATT模型,在准确率和召回率上都有良好的提升,同时,在这几种经典远程监督关系抽取算法中取得了最高的F值;(3)在本文第三章改进的经济领域数据自动标注算法和第四章改进的远程监督关系抽取模型PCNNs-ATT-DP模型的基础上,本文还面向中文经济领域的具体数据设计并实现了大数据知识图谱中心系统,实现了本文研究算法的应用。
融合试题题目与解析的数学多知识点自动标注方法研究
这是一篇关于多知识点,自动标注,机器学习,深度学习,预训练的论文, 主要内容为在教育互联网+飞速发展的时代,各类在线学习平台层出不穷,各种教育领域需求任务应运而生,例如自动解答,自动阅卷,试题推荐等,所有这些任务中的一个基础性的任务是对互联网上不断产生的试题进行知识点自动标注。当前已有的自动标注方法主要采用传统的机器学习和深度学习方法。基于传统机器学习的方法忽略了文本中词语之间的前后联系,通过统计的方式提取文本特征,其受人为主观影响较大,不适合用来解决互联网上试题数量不断增加以及特征不断变化的实际情况。基于传统深度学习的方法虽然能通过生成词向量的方式自动对文本特征进行表征,但存在不能动态表征词向量以及对样本不均衡问题处理较差的问题,主要用于实现试题的单一知识点标注,不能实现对一个试题标注其对应的多个知识点的实际需求。而本文所研究的针对数学学科试题的知识点标注任务,其学科本身又存在大量数学学科的特有信息,要求模型本身含有大量的先验知识,而传统深度学习方法所使用的词向量并不包含数据的先验信息。针对上述问题,本文通过设计合理的标注模型,然后选择适当的方法实现该标注模型,最后设计并完成了基于该模型的标注系统。通过这样的方式,提供了一套解决当前问题的方案,并验证了该方案的可行性。首先,本文针对数学试题的短文本和抽象性的特点,采取横向融合试题与解析来扩充输入信息,纵向设计能包含学科先验知识的模型的方式,完成了试题特征抽取及表征模块的设计,增强了对试题特征的表征能力;并设计不均衡标注生成模块,将多知识点标注的“多选多”问题转化为“多选一”问题,极大缓解了样本不均衡问题。根据这两个模块,构建了多知识点标注模型。通过对比基于传统的机器学习和深度学习方法的标注模型,可知本文设计的多知识点标注模型在性能上具有明显的优势。其次,根据设计的标注模型,选用基于改进了预训练任务的语言模型方法实现该标注模型。首先使用本文的数据集进行进一步预训练,使模型含有本数据集所包含的数学学科先验知识;然后嵌入预训练框架,生成包含上下文信息的动态词向量,并执行下游任务;紧接着通过级联三种句向量的方式,得到新的向量,减弱padding位冗余信息的影响;最后使用新的改进的损失函数,缓解不均衡样本带来的标注误差。通过上述方法实现了该模型,并验证了该模型的可行性。最后,通过设计并完成了相应的B/S系统,然后将本文实现的多知识点标注方法嵌入到系统的后台服务中,使之能实现对试题多知识点的实时预测。系统还提供了人工协同功能,让有经验的一线教师或专家能对标注系统预测生成的试题知识点进行人工纠错,系统会将结果更新到数据库中。系统还具有自动训练的功能,以这些不断更新的试题题库作为新的数据集,在原有模型参数文件的基础上进行新的训练,使标注模型的性能不断趋于完善。
基于深度学习的线上数据集标注系统设计与实现
这是一篇关于深度学习,标注系统,自动标注,数据增强,训练可视化的论文, 主要内容为近年来,深度学习目标检测算法取得了重大突破,并逐渐应用于智能安防、无人驾驶、医疗诊断等众多领域。这些成熟的算法模型通常基于海量的标注图像训练产生,然而大量的图像标注工作费时费力,很难在短时间内完成,如何提高图像的标注效率是近年来目标检测领域的研究热点。此外,目标检测应用所需的数据增强、模型训练与模型评估等操作需利用不同工具完成,不利于深度算法模型的快速落地。因此,本文对当下流行的标注系统进行了调研与分析,并以Label Studio平台为基础研发了一套多功能的高效数据集标注系统。主要工作内容如下:1)学习Label Studio平台构建过程中所使用的开发技术,并深入研究平台的前后端交互逻辑、数据库设计、前端页面搭建流程、图像上传及标注管理周期。2)针对现阶段标注平台集成的自动标注算法老旧,对图像中面积占比较小物体自动标注效果不理想的问题,提出了一种基于改进YOLOv5的自动标注算法。在特征融合部分采用更加高效的Bi FPN结构,实现特征的多尺度融合;在小目标检测端添加自定义的Dc-res-SA模块,利用SA注意力机制和一些残差结构精炼小目标的语义信息。实验结果表明,本文改进后算法的平均准确率提高了2.8%,小目标的平均准确率提高了1.2%,单张图像的检测速度为21ms,有效提高了算法标注的准确率。3)完成了数据集标注系统的开发和测试。根据需求分析,将系统划分为数据增强、自动标注、模型训练以及训练结果可视化等四个功能模块,并对系统中每一模块的内部流程及数据交互接口进行详细的设计与实现。测试结果表明,本系统不仅可以有效提高数据集的标注效率,还支持YOLOv5系列算法训练的全周期管理,无需借助于其他工具,具有较高的实用性。
基于深度学习的线上数据集标注系统设计与实现
这是一篇关于深度学习,标注系统,自动标注,数据增强,训练可视化的论文, 主要内容为近年来,深度学习目标检测算法取得了重大突破,并逐渐应用于智能安防、无人驾驶、医疗诊断等众多领域。这些成熟的算法模型通常基于海量的标注图像训练产生,然而大量的图像标注工作费时费力,很难在短时间内完成,如何提高图像的标注效率是近年来目标检测领域的研究热点。此外,目标检测应用所需的数据增强、模型训练与模型评估等操作需利用不同工具完成,不利于深度算法模型的快速落地。因此,本文对当下流行的标注系统进行了调研与分析,并以Label Studio平台为基础研发了一套多功能的高效数据集标注系统。主要工作内容如下:1)学习Label Studio平台构建过程中所使用的开发技术,并深入研究平台的前后端交互逻辑、数据库设计、前端页面搭建流程、图像上传及标注管理周期。2)针对现阶段标注平台集成的自动标注算法老旧,对图像中面积占比较小物体自动标注效果不理想的问题,提出了一种基于改进YOLOv5的自动标注算法。在特征融合部分采用更加高效的Bi FPN结构,实现特征的多尺度融合;在小目标检测端添加自定义的Dc-res-SA模块,利用SA注意力机制和一些残差结构精炼小目标的语义信息。实验结果表明,本文改进后算法的平均准确率提高了2.8%,小目标的平均准确率提高了1.2%,单张图像的检测速度为21ms,有效提高了算法标注的准确率。3)完成了数据集标注系统的开发和测试。根据需求分析,将系统划分为数据增强、自动标注、模型训练以及训练结果可视化等四个功能模块,并对系统中每一模块的内部流程及数据交互接口进行详细的设计与实现。测试结果表明,本系统不仅可以有效提高数据集的标注效率,还支持YOLOv5系列算法训练的全周期管理,无需借助于其他工具,具有较高的实用性。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码港湾 ,原文地址:https://bishedaima.com/lunwen/49978.html