iris数据集下载(免费):https://download.csdn.net/download/weixin_44940488/20718531
使用的分析软件:jupyter notebook
主要语法知识:Python数据清洗与整理、seaborn数据可视化。
1.导入相关库和数据集
from pandas import Series,DataFrame
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = 'SimHei' # 用来正常显示中文
plt.rcParams['axes.unicode_minus'] = False # 用来正常显示负号
iris = pd.read_csv(open('数据\iris-data.csv'))
iris.head()
鸢尾花数据集经常用于及其学习(分类算法)的入门例子。其中,sepal_length_cm:为花萼长度; sepal_width_cm:为花萼宽度; petal_length_cm:为花瓣长度; petal_width_cm:花瓣宽度。
2. 散点图绘制
plt.figure(figsize=(12,6),dpi=100)
plt.scatter(x = iris.petal_width_cm, y = iris.petal_length_cm , s =10, color = 'steelblue')
plt.xlabel('花瓣宽度',fontsize = 15)
plt.ylabel('花瓣长度',fontsize = 15)
plt.title('鸢尾花花瓣长度与宽度关系图', fontsize = 20, pad = 20)
plt.show()
3. 数据处理
iris['class'].value_counts()
# 修改
iris.ix[iris['class'] == 'versicolor', 'class'] = 'Iris-versicolor'
iris.ix[iris['class'] == 'Iris-setossa', 'class'] = 'Iris-setosa'
iris['class'].unique()
# 不同类别鸢尾花统计
iris['class'].value_counts()
4. 不同类型鸢尾花散点图绘制
# 设置不同种类鸢尾花的颜色
colors_iris = ['steelblue','indianred','green']
class1 = ['Iris-setosa', 'Iris-versicolor', 'Iris-virginica']
marker_iris = ['o','s','x']
# 设置绘图窗口大小
plt.figure(figsize=(12,6),dpi=100)
for i in range(0,3): # 循环
plt.scatter(x = iris.petal_width_cm[iris['class']== class1[i]],
y = iris.petal_length_cm[iris['class']== class1[i]],
color = colors_iris[i],marker = marker_iris[i],label = class1[i])
plt.xlabel('花瓣宽度',fontsize = 15) # X轴标题
plt.ylabel('花瓣长度',fontsize = 15) # Y轴标题
plt.title('鸢尾花花瓣长度与宽度关系图', fontsize = 20, pad = 20) # 图表标题
plt.legend(loc='best') # 图例标签
plt.show() # 图表展示
今天的文章Python数据分析项目实例3:使用matplotlib散点图分析鸢尾花(Iris)数据集分享到此就结束了,感谢您的阅读。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/63599.html