基于知识图谱的Web服务智能搜索系统
这是一篇关于知识图谱,API推荐,个性化需求,数据稀疏,冷启动的论文, 主要内容为随着面向服务的软件开发范式日趋成熟,Web API的种类和数量都在迅速增加。但是,单个Web API的功能相对单一,无法满足开发者多样化的开发需求。此时,通过Mashup可以对多个Web API进行组合混搭,实现更加复杂的功能。然而,由于功能相近甚至相同的Web API和Mashup应用越来越多,开发者很难快速、准确地找到自己想要的Web API。本文基于Web服务知识图谱设计和实现了一个面向Web服务的智能搜索系统,旨在帮助开发者搜索和推荐符合目标需求的Web API,提升软件开发的效率,具体研究内容包括:(1)构建了一个面向Web服务的知识图谱。首先,以Web API为核心,对Web服务生态系统中的实体以及实体之间的关系进行分析,借助本体建模工具Protégé构建Web服务本体模型;然后,通过数据获取工具,从当前最大的Web API聚合网站Programmable Web上获取Web服务相关数据;最后,将Web服务知识图谱保存至图数据库Neo4j中。(2)提出了一个基于知识图谱的Web服务推荐算法KGWSR。该算法以Web服务知识图谱为输入,利用图神经网络技术训练并获得知识图谱中节点的Embedding向量,进而预测Mashup和Web API之间的调用关系。实验结果表明,知识图谱中包含的丰富的语义关系,作为辅助信息可以有效地缓解传统Web服务推荐算法中存在的数据稀疏、冷启动等问题带来的影响,提高了推荐算法的性能。(3)设计并实现了一个Web服务智能搜索系统。该系统一方面为软件开发人员提供了基本的关键词搜索功能,开发人员可以通过关键词准确地检索Web服务知识图谱中的各种数据。另一方面,提供了基于需求的服务推荐功能,当软件开发人员试图开发一个新的Mashup应用时,只需要输入对应的功能需求描述,系统就会基于KGWSR推荐算法推荐符合需求的Web API列表。此外,系统还借助可视化工具,将搜索和推荐的结果进行可视化展示,提供了友好的交互体验,方便用户对Web服务数据进行语义探索。综上所述,本文设计开发的Web服务智能搜索系统,一方面以知识图谱的形式为Web服务推荐领域的研究和创新提供了一个新的数据集。另一方面,它也可以作为一个实验平台,在Web服务推荐领域的研究中用于运行和测试不同的推荐算法。
融合Stack Overflow和API文档信息的API推荐方法研究
这是一篇关于API推荐,Stack Overflow,API文档,词向量的论文, 主要内容为随着软件开发需求的不断增加,可复用软件代码的种类日益增多、规模日益增大,如何帮助软件开发人员为当前编程任务快速、准确地找到合适的应用程序编程接口(Application Programming Interface,API)进行复用,是智能软件工程的一个重要研究方向。现有的API推荐方法大多仅从用户使用的角度进行间接推荐(如采用词向量技术在Stack Overflow等软件开发讨论社区中查找在语义上与编程任务相似的历史问题,进行API推荐),未能有效利用API文档本身的语义信息,且词向量模型无法表示句子级别的深层次语义信息,因此API推荐效果仍有待进一步提高。针对上述问题,本文提出了一种融合Stack Overflow和API文档信息的API混合推荐方法。该方法通过融合API实体的文档信息以及改进问题查询相似度计算方法来改进API推荐准确率。给定编程任务,该方法首先收集Stack Overflow问题的标题语义信息和标签信息,通过Sentence-BERT模型和标签预测模型计算得到编程任务与问题的相似度,查找与编程任务相似的历史问题,获取相似历史问题中的候选API,并计算候选API的问题查询相似度,获得基于历史问题相似度计算的API推荐列表;同时利用API文档中API实体的描述文本语义信息和API实体的概念信息,通过Sentence-BERT模型和API知识图谱计算API实体的文档相似度,获得基于API文档相似度计算的API推荐列表;最后,计算推荐列表中所有API的综合得分,并进行排序和API推荐。在上述工作的基础上,本文实现了融合Stack Overflow和API文档信息的API混合推荐工具—HAPIR。为了验证HAPIR的有效性,本文选取了486个Java核心API相关的编程任务作为查询数据开展实验研究。实验结果表明,HAPIR可有效提高API推荐准确率,且具有较高的用户查询效率。与BIKER相比,HAPIR在方法级别的API推荐任务上,MRR和MAP分别提高31.97%和29.27%;与Deep API相比,HAPIR在方法级别的API推荐任务上,MRR和MAP分别提高108.95%和111.54%。
基于用户反馈的API推荐方法研究
这是一篇关于API推荐,用户反馈,语义相似度,排序学习,主动学习,推荐系统的论文, 主要内容为在软件开发的过程中,应用程序编程接口(API)发挥了重要作用。但是由于API的数量庞大,开发人员不可能熟悉所有的API,为了提高软件开发效率,大量API推荐方法及工具应运而生。在传统推荐系统领域中,用户的反馈信息通常对提高推荐系统性能有显著影响。然而,现有的API推荐方法和工具很少考虑开发人员反馈信息在推荐过程中的作用。为将用户反馈信息有效的整合到API推荐任务中,本文提出了一种基于用户反馈的API推荐方法BRAID。BRAID首先利用TF-IDF和词嵌入技术构建语义相似度计算模型;然后通过第三方API推荐方法,获取用户输入查询语句对应的初始API列表;再借助语义相似度计算模型为列表中的API构建特征向量,作为排序学习和主动学习模型的输入数据;最后通过计算两模型输出值得到API预测分数,对API推荐列表进行重新排序,并将结果返回给用户,供用户选择。BRAID记录用户选择,存入反馈库。在此基础上,我们设计并实现了一个基于客户端/服务器架构的API推荐系统,并将其以插件的形式集成到VS Code IDE中。用户可从客户端展示的API推荐结果中选择最合适的API,客户端捕捉到用户选择的API项,并将其作为反馈数据传输给服务器端进行存储。实验结果证明了BRAID与现有研究工作相比的显著优越性。随着反馈数据量的增加,BRAID能够有效的根据用户反馈信息对推荐结果进行优先级调整,使得用户偏好的API推荐项位于推荐结果列表中更加靠前的位置,从而提高API推荐效果。
面向开发者社区的应用程序接口推荐系统的研究与实现
这是一篇关于API推荐,协同学习,异构网络,潜在关系挖掘,矩阵分解的论文, 主要内容为应用程序接口(application programming interface,API)是指在软件开发的过程中,由于不同模块间组合的形式不同而需要的一些事先定义好的接口程序。API的出现解决了开发人员在编程过程中出现的代码冗余现象,对于一些重复性较高的功能,只需调用API即可实现。在实际应用中,API由于简化了开发人员将全新组件集成到已有结构中的方式,提升了开发效率。为了适配更多的平台并满足更多开发需求,API的数量日益增加,类别的划分也越来越细致化,这虽然便利了开发者,但也使得寻找到适合的API成为了一个急需解决的问题。目前现有的API推荐算法大多专注于API与用户之间的关系,却忽略了对于用户之间或API之间关系的探索与利用。为了解决上述问题,本文通过挖掘用户之间和API之间存在的潜在关系特征增强矩阵分解模型,并构建基于潜在关系特征的集成模型来提升API推荐的准确度。本文主要工作包括以下几个方面:(1)收集API数据。采用分布式爬虫在Programmable Web网站上爬取真实的API数据集,并对该数据集进行数据预处理工作,利用用户和API的特性完成API异构信息网络的构建。(2)提出基于用户关系挖掘的推荐模型。首先通过用户之间存在的异构信息网络利用Jaccard公式计算用户与朋友之间的相似度,并以正则化的形式将用户关系加入损失函数构建矩阵分解模型。接着通过随机梯度下降的方法训练模型,得到用户最终的社交化矩阵,矩阵中的元素代表在朋友的影响下,用户对API关注度的预测值。(3)提出基于API关系挖掘的推荐模型。首先通过API之间存在的异构信息网络利用Jaccard公式计算相似度,并以正则化的形式将API关系加入损失函数构建矩阵分解模型。接着通过随机梯度下降训练模型,得到API最终的特征化矩阵,矩阵中的元素代表在已关注的API的影响下,用户对API关注度的预测值。(4)集成模型。由于基于用户关系挖掘的推荐模型和基于API关系挖掘的推荐模型都只考虑到用户之间或者API之间的网络关系,并且,对于不同的用户和API,两个模型得到的最终结果也不同。因此,本文以线性组合的方式集成上述两个模型,并通过参数组合实验决定模型权重,最终得到完整的API推荐模型。通过实验表明,在API推荐方面,本文提出的集成模型相较于其他推荐算法,推荐准确度至少提升30%。同时在不同训练集密度下,模型也展示了良好的泛化能力和鲁棒性。
基于用户反馈的API推荐方法研究
这是一篇关于API推荐,用户反馈,语义相似度,排序学习,主动学习,推荐系统的论文, 主要内容为在软件开发的过程中,应用程序编程接口(API)发挥了重要作用。但是由于API的数量庞大,开发人员不可能熟悉所有的API,为了提高软件开发效率,大量API推荐方法及工具应运而生。在传统推荐系统领域中,用户的反馈信息通常对提高推荐系统性能有显著影响。然而,现有的API推荐方法和工具很少考虑开发人员反馈信息在推荐过程中的作用。为将用户反馈信息有效的整合到API推荐任务中,本文提出了一种基于用户反馈的API推荐方法BRAID。BRAID首先利用TF-IDF和词嵌入技术构建语义相似度计算模型;然后通过第三方API推荐方法,获取用户输入查询语句对应的初始API列表;再借助语义相似度计算模型为列表中的API构建特征向量,作为排序学习和主动学习模型的输入数据;最后通过计算两模型输出值得到API预测分数,对API推荐列表进行重新排序,并将结果返回给用户,供用户选择。BRAID记录用户选择,存入反馈库。在此基础上,我们设计并实现了一个基于客户端/服务器架构的API推荐系统,并将其以插件的形式集成到VS Code IDE中。用户可从客户端展示的API推荐结果中选择最合适的API,客户端捕捉到用户选择的API项,并将其作为反馈数据传输给服务器端进行存储。实验结果证明了BRAID与现有研究工作相比的显著优越性。随着反馈数据量的增加,BRAID能够有效的根据用户反馈信息对推荐结果进行优先级调整,使得用户偏好的API推荐项位于推荐结果列表中更加靠前的位置,从而提高API推荐效果。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设导航 ,原文地址:https://bishedaima.com/lunwen/56252.html