基于张量的个性化推荐系统在医疗领域的研究应用
这是一篇关于推荐系统,张量分解,医疗大数据,药物重定位的论文, 主要内容为随着人工智能和机器学习的发展,各领域都逐渐步入智能化。作为一直以来受国家重视的医疗健康服务领域,它的智能化近年来更是受到了广泛的关注。如今的推荐系统在各个领域都有较为成功的应用,然而在医疗范畴的应用却仍需要进一步去挖掘。尽管医疗领域的推荐系统相比其他领域存在着更多的困难,即便如此国内外的学者们也从未停下探索的脚步。目前推荐系统在医疗行业较为成功的业务应用有:辅助诊疗、合理用药、就诊引导、精准医疗等,所用到的核心技术多以传统协同过滤为主。近些年来,张量分解也被应用到了推荐系统中,甚至在一定程度上优于传统的推荐算法。因此,本文选择以药物重定位作为本次推荐系统在医疗领域的研究应用方向,利用张量分解技术旨在构建一个基于张量的药物重定位推荐算法。本文首先对医疗大数据及相关业务应用场景做了较为全面的调研与综述,介绍了当今医疗范畴和推荐系统的关系。由医疗大数据引出了张量,由信息过载引出了推荐系统,而张量分解作为勾连二者的枢纽,将两个领域交汇在一起。接着对张量的理论基础和常见的概念方法进行了比较全面的整合阐述。又从经典的传统推荐算法入手,对推荐系统进行了一定的调研、整理和分析。并以药物重定位作为本次推荐算法在医疗范畴的应用方向,对推荐算法在其上的价值进行了说明。针对与药物重定位有关的医疗数据构建张量模型,借助PARAFAC2方法处理不规则数据矩阵集合进而得到规范化张量。利用张量常用于推荐系统的平行因子分解法实现疾病-药物的关系对预测,挖掘潜在的疾病-药物关系,最终完成药物重定位的TopN推荐。最后在公开的数据集下选取10%并抹去部分药物-疾病关系信息作为测试数据,利用K折交叉验证对本文的算法模型进行反复测试,和传统协同过滤模型相比较,验证了本次研究模型在precision、recall和F1-Measure上具有不错的表现,同时具备一定的新颖性和可行性。接着在原有模型的基础上引入置信矩阵进行了一定的改进,改进后的效果较之前模型在可靠性上有着一定的提高。最终表明,本文的算法为医疗领域的药物重定位研究提供了一定的参考价值,较好的实现了张量在医疗大数据的一次建模与推理。
基于多组学生物异构网络的药物重定位方法研究
这是一篇关于药物重定位,深度学习,多组学,生物异构网络,链接预测的论文, 主要内容为全新药物的研发存在着高投入、高风险以及费时耗力等问题。在一种新药被发现到批准上市的过程中,依次需要经历分子探索、动物实验、临床试验等多个环节,平均需投入10到15年的时间和约8亿美元的成本,而且成功率极低。药物重定位,亦称老药新用,是指发掘已上市药物的新适应症或新用途,能够显著缩短药物研发周期,节约制药成本并规避风险,逐渐成为药物研发的重要策略。药物重定位计算分析的主要方法,按照技术策略可以大致总结为药物-靶标关联预测、药物-疾病关联预测和药物-药物关联预测等,本文主要针对药物-靶标关联预测和药物-疾病关联预测两种策略建立模型,基于异构网络的链接预测算法,实现药物重定位。具体地,本文完成了以下三方面的工作和创新:(1)近年来,生物信息学、系统生物学、深度学习和大数据等技术发展迅速,海量药物、疾病、靶标等生物数据的积累提供了丰富的生物学特征,本文通过整合15种化学、基因组、表型和细胞等网络构建出一个多组学生物异构网络。为了学习不同网络的深层表征,本文运用多层深度自编码网络学习每种网络中节点的低维向量表示,考虑到生物数据典型的正负样本不平衡问题,本文引入偏置矩阵补全算法寻找药物空间到靶标空间的最佳映射。(2)大多数模型在学习网络节点表示时只考虑到节点邻居之间二阶以内的邻近度,研究表明,节点之间的高阶邻近度对于捕获网络底层拓扑结构具有很高的重要性。本文基于任意邻近度保留算法学习15种网络中节点的低维向量表示,从而能够保留节点任意邻近度的特征,接着再使用高分类精度的树模型完成链接预测。具体地,本文将药物-靶标链接预测问题转化为机器学习中的二分类问题,并使用深度森林算法进行分类。(3)在第一项工作中使用多层深度自编码网络分别提取每种网络的特征,没有考虑到不同网络之间信息的关联,在整合所有网络特征时可能存在信息丢失。借鉴于多模态学习的思维,本文改进使用多模态深度自编码网络用于不同药物网络的特征提取和融合,从而学习到一个高质的和所有网络都相关的特征表示。接着使用协同变分自编码网络将药物-疾病链接预测问题转化为推荐系统问题,对不同疾病推荐预测得分较高的药物。
中医名方知识图谱构建与链路预测模型的研究及应用
这是一篇关于中医名方,知识图谱,深度学习,命名实体识别,链路预测,药物重定位的论文, 主要内容为近年来,我国大力推动中医领域的传承与发展。随着人口老龄化时代的到来,人们的健康意识普遍提高,具有“治未病”独特优势的中医领域采取早期干预的理念,可以有效的起到疾病预防的作用。然而,中医领域的相关知识较为杂乱,且来源广泛说法不一,对中医知识没有统一的描述。因此,充分整合“多源异构”的中医知识,对中医药知识的有效组织和管理,挖掘其中的隐含知识是传统中医药的传承、发展和应用的必要和重要途径。目前,人工智能技术在知识的组织、管理、关联与可视化展示等多方面展现了强大的能力。应用人工智能技术在中医药领域不仅可以解决存在的难题,而且可实现中医药知识更有效的应用,如药方改良、药物发现(Drug Discovery)、药物重定位等,从而提高中医药在国民健康事业中发挥的作用。在大数据时代背景之下,知识图谱(Knowledge Graph)是有效解决上述问题的方法之一。作为一个网络化的知识结构,知识图谱可以包含丰富的语义信息,能够实现对零散、繁杂知识的连接和表示。由于其在自动问答、知识检索等方面取得了较好的表现,已经被广泛的应用于多个领域。目前,医疗领域知识图谱越来越被重视,已经成为知识图谱重要研究领域之一。但是,中医药方领域知识图谱的构建研究仍处于起步阶段,中医药的相关知识未被充分挖掘。因此,构建中医名方知识图谱,可以有效的对中药方、中药材、疾病、功效等相关实体进行管理。构建一个准确且具体的中医名方知识图谱,可为高效和深层次的挖掘隐含的新知识提供必要的基础。本文阐述了知识图谱构建技术的相关进展以及知识图谱结合深度学习在中医领域的应用概况,并构建了中医名方知识图谱,通过此图谱进行药物重定位的应用。具体包括以下工作:第一,本文完成了对中医名方知识图谱的构建。首先对知识图谱内的实体进行了定义,主要包括“药物”、“功效”、“组成”、“疾病”四种实体,然后根据实体的特点对四种实体之间的语义关系进行了定义,最后对知识进行关联、整合以及可视化展示。第二,针对中医名方相关实体的命名实体识别任务,本文设计了一种基于深度学习的中医名方命名实体识别模型BERT+Bi LSTM+CRF,其最高F1值达到0.9743,取得了较好的实体识别效果。第三,本文优化了基于深度学习的知识图谱链路预测模型,提出一种融合SKNet模块的知识图谱链路预测模型SK-Conv E,并与已报道的比较具有代表性的四种性能优异链路预测模型进行实验对比分析。实验结果表明,SK-Conv E模型的预测能力相比与其他模型有所提升,其Hit@1值达到0.234,在链路预测任务上有着较好的表现。第四,将SK-Conv E链路预测模型应用于本文构建的中医名方知识图谱上挖掘隐含知识,对药物进行重定位,并以疾病“新冠肺炎”、“不孕不育”、“阴道炎”、“肺癌”为例给出药物重定位示例,对传统疾病进行药物重定位来证明结果有一定的可行性,对于新型疾病“新冠肺炎”来说,结果表明泻肺散、黄连解毒汤、普济消毒饮三个药方最有可能对新冠病毒产生抑制作用。
基于深度学习的生物医学实体关联研究
这是一篇关于深度学习,协同过滤,表示学习,生物医学实体,关联研究,药物重定位的论文, 主要内容为尽管科学技术飞速发展,传统的药物发现仍然是费时费力且高风险高成本的过程,因此急需要一种新的药物开发技术来缩短药物开发周期,降低风险和成本。生物医学实体(如基因、疾病、药物等等)之间的关联研究是药物重定位技术的基础,研究基于各种计算方法并结合各种生物医学领域的组学数据,发现潜在未知的药物-疾病,疾病-基因之间的关系。由于神经网络和推荐模型在用户-物品关系预测中的优越性能,本文采用基于深度学习的推荐系统模型进行药物重定位研究,结合最新的数据表示和整合方法,提出了基于深度学习的神经协同过滤模型——NCFBE算法。本研究分为以下两个部分:(1)研究了将网络表示方法应用到生物医学知识库中,自动学习生物实体的结构和语义表示,基于学习到的实体表示采用传统的机器学习模型SVM应用到药物-疾病关联预测之中。该模型的实验结果表明,实体的网络表示和多源数据整合使用可以改善系统的预测能力,跟同期的其它系统相比有一定的性能提升。(2)提出了NCFBE模型,将神经网络推荐系统模型结合异构数据表示和整合技术应用药物-疾病关联预测中。本研究利用已知的药物-疾病关系构建了神经协同过滤模型,然后整合药物和疾病相关的知识库信息作为推荐系统的辅助信息,减轻了神经协同过滤模型的由于数据稀疏导致的冷启动问题。在多个公共数据集上的实验结果显示,跟其它最新的药物-疾病关系预测系统相比,在AUC,AUPR,和F1等多个评估取值上都显示了更好的性能。为了证明模型在其它生物医学实体的关联预测的鲁棒性,本文也将NCFBE模型应用在mi RNA与疾病的关联研究并取得了很好的性能,证明模型具有很好的泛化能力。综上所述,本文提出的神经协同过滤模型NCFBE在生物领域的实体关系预测中取得了优异的性能,表明深度神经网络架构对生物医学实体的特征表示学习和整合有其优势。为药物的重定位研究提供了一种新的思路。
基于知识增强的深度学习药物重定位方法研究
这是一篇关于知识图谱,预训练,BERT,推荐系统,对比学习,药物重定位的论文, 主要内容为药物重定位是一种寻找现有药物新治疗用途的方法,它可以大大减少药物开发的时间和成本,并提高药物开发的效率。目前基于计算的药物重定位方法可以粗略地分为四类:经典的机器学习模型、基于矩阵的方法、基于网络的方法和深度学习方法。这些方法在处理数据稀疏性、处理缺失数据、处理多种关联类型以及可解释性等方面存在局限性,限制了这些方法的应用和推广。为了克服这些局限性,本论文提出了一种名为UKEDL-DR的新方法来进行药物重定位,即利用知识图嵌入、预训练模型和推荐系统。UKEDL-DR使用PairRE方法进行知识图谱嵌入,它使用关系的成对向量表示来处理实体之间的复杂关系,如药物、疾病和蛋白质等具有多对多或一对多关系的实体。采用CReSS方法进行药物特征提取,它利用深度对比学习技术提取药物分子的特征,并能够捕捉分子化学环境的影响。DisBERT用于疾病特征提取,它是一种基于Transformer的预训练语言模型,可捕捉大量和多样化的生物医学文本中生物医学实体之间的复杂关系。通过引入知识图谱和预训练解决了数据稀疏性问题。最后,引入推荐系统以增加药物与疾病特征之间的交互,提高药物重定位的准确性。我们在基准数据集上评估了UKEDL-DR,结果显示它在AUC、AUPR、精度、F1等指标和不同top-k级别的召回率方面均优于其他模型。例如,UKEDL-DR在top-500级别上实现了0.9584的召回率,明显高于LR、RF和DeepDR模型的召回率,突显了其在确定现有药物的潜在治疗用途方面的卓越性能。最后,通过知识图谱可视化增加了重定位的可解释性。本研究论文提出的UKEDL-DR方法将知识图谱嵌入、预训练模型和推荐系统相结合,为药物重定位提供了一种全面而实用的方法。
基于可解释性知识图谱的药物重定位
这是一篇关于药物重定位,知识图嵌入,可解释性,集成学习,图神经网络的论文, 主要内容为药物重定位是生物医学领域的一个重要研究方向,其通过挖掘现有药物的潜力来治疗新的适应症,能解决新药研发中高成本,低效率等问题。然而,传统的药物重定位方法一般是通过药物的副作用转化来实现的,难以满足市场以及研究者对于药物预测精度的需求。大数据时代的来临以及机器学习技术的兴起,为药物重定位领域带来了许多新兴的技术,知识图谱也凭借其优秀的数据处理能力脱颖而出。然而现有基于知识图谱的药物重定位方法大多预测能力有限,且无法提供对预测结果的解释,而结果的可解释性对于药物重定位这种高风险任务来说具有重要指导价值和安全性意义。针对上述问题,本文从生物医学知识图谱出发,利用图卷积神经网络、集成学习以及知识图谱嵌入等技术,对药物重定位预测任务的精度以及预测结果的可解释性进行研究。本文的主要研究内容和贡献如下:(1)本文使用六个公开数据集,并利用知识抽取,知识融合等技术构建出一个大规模的综合性生物医学知识图谱,其包含了13种实体类型和107种关系类型。(2)本文提出了一种基于集成的知识图卷积算法EKGCN用于药物重定位预测。首先,该模型将实体之间的关系融入到实体的嵌入表示中,从而获得含有丰富语义信息的实体和关系的嵌入表示。其次,EKGCN算法利用了模型侵蚀技术,生成多个模型,并使用集成技术对多个模型进行处理,使得集成后的嵌入表示不但保留了模型的固有特征,还减少了不同模型中的特征噪声,进而提高了模型的预测准确性。最后,本文将EKGCN算法与九种相关方法进行了对比。相比于最先进的预测算法,EKGCN在MRR(Mean Reciprocal Rate)上提升了2.7%,充分证明了本文算法的有效性。(3)另外,本文还提出了一种基于子图扰动的可解释性路径分析算法KGExplainer用于对预测结果提供解释。该算法包含了一种寻找关键路径的贪婪搜索策略和一种基于子图的嵌入重训练策略。本文提出的算法缩小了关键路径的搜索范围,且其计算复杂度与知识图谱的大小无关,因此,可应用于大规模知识图谱上。另外,本文在两个数据集上将KGExplainer算法与四种可解释性算法进行了对比,其相比于最先进的方法在ACC(Accuracy)上提高了9.7%,证明了本文算法的有效性。
面向药物重定位的隐含知识发现研究
这是一篇关于隐含知识发现,药物重定位,关系抽取,异质图神经网络的论文, 主要内容为浩如烟海的生物医学文献中储藏着大量非结构化的信息,是生物医学信息挖掘的重要来源,对于隐含知识发现研究而言更是宝贵的待开发资源。一方面,使用自然语言处理技术和深度学习方法自动化进行药物重定位,能够极大地降低药物研发的经济成本和时间成本;另一方面,药物重定位系统作为药物研究人员研发的参考依据,其推断结果需要具备充分的准确性和可解释性。如何高效而准确地将生物医学文本中的信息结构化是生物医学文本挖掘的一个挑战。本文旨在利用自然语言处理技术和深度学习方法,研究如何面向药物重定位,在医学文献中发现隐含知识。首先,本文提出了一种新的关系抽取方法。为了获取具有高质量标注的生物医学关系抽取数据集,需要具有领域知识的专家进行手工标注,高人力成本使得获取大量的高质量数据集的难度很大。针对关系抽取任务,本文提出了基于预训练语言模型和多任务学习的关系抽取方法,使用具有领域知识的预训练模型,提升了模型对生物医学文本的表示能力;另外多任务学习策略可以在不需要额外标注数据集的前提下隐式地扩大训练数据,从而提升模型准确性。本文在公开数据集上进行实验,实验结果证实了这两种方法的有效性。其次,本文提出了一种基于异质神经网络的隐含知识发现方法。药物重定位的任务可以将其理解为一个为药物推荐疾病或为疾病推荐药物的推荐系统。本文引入了异质图神经网络模型,使用不同类型的节点构建成一张关系网络图,学习节点的表示特征。引入了双级注意力机制进行节点和路径的聚合,并赋予模型可解释性。实验结果表明本文提出的方法在公开数据集上超越了此前最优结果,证实了异质网络在药物重定位领域的应用价值。最后,本文提出了一种基于节点交互的隐含知识发现方法。元路径模型在网络稀疏或有噪音数据时会不可靠,另一方面,节点及其邻域信息聚合网络表示方法没有捕获路径的语义信息。对此本文采用了基于节点交互的方法增强模型的语义感知能力。实验结果证明此方法能够明显提升模型的性能,取得了当前最优结果。此外,本文对某一推理实例进行了可视化的解释性分析,并提供了由模型推断得到的阿尔兹海默病的潜在药物,援引了相关文献佐证其有效性。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设向导 ,原文地址:https://bishedaima.com/lunwen/48895.html