de00ce4
通过优化上述的三个瓶颈, 一定程度上提高了运行速度, 对于 6000 大小的训练集且 k 等于 5 时,计算大小为 1000 的测试集需要 20 秒,但是和 sklearn 还是有非常大的差距 (sklearn 的默认实现是 0.6 秒) , 后来也了解到可以通过使用 kd_tree,ball_tree 等特殊数据结构来优化运行速度, 但是限于能力和时间还是选择的最原始的方法.
参考文献
- 基于数据挖掘的用户上网行为分析(中央民族大学·丰玄霜)
- 基于J2EE技术ACM竞赛程序在线评测系统的设计与实现(厦门大学·赵春风)
- 滨化集团商品价格K线图系统的设计与实现(山东大学·宋飞)
- 基于SSH架构的个人空间交友网站的设计与实现(北京邮电大学·隋昕航)
- 基于SSH的在线视频网站设计与实现(大连理工大学·朱锋)
- 基于SSH2+AJAX架构的在线招聘求职系统设计与实现(吉林大学·李琦)
- 印刷公司内容管理平台的设计与实现(吉林大学·郎彩虹)
- 印刷公司内容管理平台的设计与实现(吉林大学·郎彩虹)
- 基于J2EE的远程教育平台的开发与实现(吉林大学·葛瑛)
- 分布式应用系统的研究与开发(武汉理工大学·廖斌)
- 印刷公司内容管理平台的设计与实现(吉林大学·郎彩虹)
- 印刷公司内容管理平台的设计与实现(吉林大学·郎彩虹)
- 基于J2EE的中小企业ERP平台设计与实现(电子科技大学·贾雪)
- 基于Kettle和Weka的数据转存与挖掘平台(西南科技大学·何宇恒)
- 基于J2EE的网上交友系统的设计与实现(大连理工大学·姚岚)
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码货栈 ,原文地址:https://bishedaima.com/yuanma/36114.html