python数据分析(3)——数据特征分析(下)
1. 周期性分析
周期性分析是探索某个变量是否随这时间的变化而呈现出某种周期变化趋势。
时间尺度较长的有年度性、季节性;较短的有月度、周度性;甚至更短的天、小时。
2. 贡献度(帕累托)分析
20/80定律,同样的投入放在不同的地方会产生不同的效益。
例如对于一个公司,80%的利润常常来源于20%的产品,其余80%产品只产生了20%利润。
帕累托图用双直角坐标系表示,左边纵坐标表示频数,右边纵坐标表示频率,折线表示累积频率,横坐标表示影响的各项因素,按影响程度的大小(即出现频数多少)从左到右排列,通过对帕累托图的观察分析,可以抓住影响的主要因素,从而优先解决主要问题。
数据为catering_dish_profit.xls
代码为
```python
- - coding: utf-8 - -
菜品盈利数据 帕累托图
from future import print_function import pandas as pd
初始化参数
dish_profit = 'catering_dish_profit.xls' #餐饮菜品盈利数据 data = pd.read_excel(dish_profit, index_col = u'菜品名') data = data[u'盈利'].copy() data.sort_values(ascending=False)
import matplotlib.pyplot as plt #导入图像库 plt.rcParams['font.sans-serif'] = ['SimHei'] #用来正常显示中文标签 plt.rcParams['axes.unicode_minus'] = False #用来正常显示负号
plt.figure() data.plot(kind='bar') plt.ylabel(u'盈利(元)') p = 1.0 data.cumsum()/data.sum() p.plot(color = 'r', secondary_y = True, style = '-o',linewidth = 2) plt.annotate(format(p[6], '.4%'), xy = (6, p[6]), xytext=(6 0.9, p[6]*0.9), arrowprops=dict(arrow, connection)) #添加注释,即85%处的标记。这里包括了指定箭头样式。 plt.ylabel(u'盈利(比例)') plt.show() ```
3. 相关性分析
3.1 直接绘制散点图
判断两个变量是否具有线性相关关系的最最直观的方法是直接绘制散点图。
3.2 绘制散点图矩阵
需要同时考察多个变量间的相关关系,使用散点图矩阵。
代码是
```python
Seaborn visualization library
import seaborn as sns
Create the default pairplot
sns.pairplot(df) ```
3.3 计算相关系数
3.3.1 Pearson相关系数
3.3.2 Spearman秩相关系数
3.3.3 判定系数
```python
- - coding: utf-8 - -
餐饮销量数据相关性分析
from future import print_function import pandas as pd
catering_sale = 'catering_sale_all.xls' #餐饮数据,含有其他属性 data = pd.read_excel(catering_sale, index_col = u'日期') #读取数据,指定“日期”列为索引列 ```
data.corr() #相关系数矩阵,即给出了任意两款菜式之间的相关系数 data.corr()[u'百合酱蒸凤爪'] #只显示“百合酱蒸凤爪”与其他菜式的相关系数 data[u'百合酱蒸凤爪'].corr(data[u'翡翠蒸香茜饺']) #计算“百合酱蒸凤爪”与“翡翠蒸香茜饺”的相关系数
参考文献
- 网站运营分析系统设计与实现(电子科技大学·蒋黎)
- 股票交易系统的设计与实现(吉林大学·王文卓)
- 主题网络爬虫的研究与设计(南京理工大学·朱良峰)
- 电子商务网站的数据分析系统研究与开发(北方工业大学·韩杰)
- 基于网络爬虫的信息采集分类系统设计与实现(厦门大学·周茜)
- 零售业大数据下载与分析系统的设计与实现(西安电子科技大学·吴霜)
- 电子商务网站的数据分析系统研究与开发(北方工业大学·韩杰)
- 基于Python的非结构化数据检索系统的设计与实现(南京邮电大学·董海兰)
- 零售业大数据下载与分析系统的设计与实现(西安电子科技大学·吴霜)
- 基于商品名称的电商平台商品自动分类的研究与实现(西南交通大学·黄超)
- 数据分析流程编排系统设计与实现(大连理工大学·闫欣)
- 基于商品名称的电商平台商品自动分类的研究与实现(西南交通大学·黄超)
- 网络流量统计分析系统(吉林大学·石景龙)
- 销量数据挖掘技术及电子商务应用研究(广东工业大学·周昊明)
- 生物农药智能推荐系统的设计与实现(电子科技大学·彭亚飞)
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕业设计工坊 ,原文地址:https://bishedaima.com/yuanma/35385.html