用线性回归建模的基本步骤_线性回归的应用

用线性回归建模的基本步骤_线性回归的应用主要目的有两个:1、熟悉一些dsw的开发环境,以及是如何使用的2、学习编写代码的能力,本人小白基础,只是为了记录一下学习过程为什么选择DSW?DSW是阿里云机器学习pai的一个云上开发环境,是属于比较舒服的环境了,之前

主要目的有两个:1、熟悉一些dsw的开发环境,以及是如何使用的
2、学习编写代码的能力,本人小白基础,只是为了记录一下学习过程

为什么选择DSW?DSW是阿里云机器学习pai的一个云上开发环境,是属于比较舒服的环境了,之前要为各种cpu、gpu环境的配置烦恼,最起码现在环境是现成的了。

线性回归是什么?

线性回归:线性回归是一种数据分析技术,它通过使用另一个相关的已知数据值来预测未知数据的值。它以数学方式将未知变量或因变量以及已知变量或自变量建模为线性方程。(看了这个定义呢,那我目前的理解是线性回归就是通过已知数据模拟出一条线性方程,这样我们就可以通过x去预测y或者通过y去预测x)

步骤一:安装依赖 

如下示范了如何利用Jupyter(dsw里内置了jupyter)的快速安装此案例中需要的依赖。

pip install pandas
pip install scikit-learn
pip install matplotlib

步骤二:引入依赖 
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
from sklearn import datasets, linear_model
from sklearn.metrics import mean_squared_error, r2_score

步骤三:加载数据,构建模型和训练 
from sklearn.datasets import load_diabetes
# diabetes 是一个关于糖尿病的数据集, 该数据集包括442个病人的生理数据及一年以后的病情发展情况。 
# 数据集中的特征值总共10项, 如下:
    # 年龄
    # 性别
    #体质指数
    #血压
    #s1,s2,s3,s4,s4,s6  (六种血清的化验数据)
    #但请注意,以上的数据是经过特殊处理, 10个数据中的每个都做了均值中心化处理,然后又用标准差乘以个体数量调整了数值范围。验证就会发现任何一列的所有数值平方和为1. 
data=load_diabetes(as_frame=True)
#as_frame是load_diabetes的一个参数,默认为Fales如图1-1,Ture如图1-2。如果为fales就会少了包裹的特征。

用线性回归建模的基本步骤_线性回归的应用

                                                                        1-1

df=pd.concat([pd.DataFrame(data[‘data’]),pd.DataFrame(data[‘target’])],axis=1)

df.head()#观察数据格式

用线性回归建模的基本步骤_线性回归的应用

                                                                        1-2

# 构造训练与测试集,如我们假设BMI指数和糖尿病指数相关,并通过线性回归模型来找出关系
diabetes_X=np.array([df[‘bmi’]]).transpose()
diabetes_Y=np.array([df[‘target’]]).transpose()

# 构造训练与测试数据
diabetes_X_train=diabetes_X[:-20]
diabetes_X_test=diabetes_X[-20:]
diabetes_Y_train=diabetes_Y[:-20]
diabetes_Y_test=diabetes_Y[-20:]
# 构造模型并训练
regr=linear_model.LinearRegression()
regr.fit(diabetes_X_train,diabetes_Y_train)
# 预测
diabetes_Y_predict=regr.predict(diabetes_X_test)

# 输出对应指标
print(“相关度:”,regr.coef_)
print(“Mean squared error:%.2f” %mean_squared_error(diabetes_Y_test, diabetes_Y_predict))
print(“Coefficient of determination:%.2f” %r2_score(diabetes_Y_test, diabetes_Y_predict))
# 可视化训练结果
plt.scatter(diabetes_X_test,diabetes_Y_test,color=’black’)
plt.plot(diabetes_X_test,diabetes_Y_predict,color=’blue’,linewidth=1)
plt.xticks(())
plt.yticks(())
plt.show()

用线性回归建模的基本步骤_线性回归的应用

今天的文章用线性回归建模的基本步骤_线性回归的应用分享到此就结束了,感谢您的阅读。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/84149.html

(0)
编程小号编程小号

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注