2025年数据挖掘项目_数据分析师怎么自学

数据挖掘项目_数据分析师怎么自学数据挖掘项目 1 数据导入 一共有 4754 个样本 90 列的数据 表格中 status 是结果标签 0 表示未逾期 1 表示逾期 未逾期 3561 逾期 1193 2 数据类型分析 90 列中 70 列为 float 13 列为 int 7 列 object object 类型的列名 以及其分布 3 删除无关变量 4 缺失值处理 5 划分数据集 测试集 30 训练集 70

数据挖掘项目

1.数据导入


一共有4754个样本,90列的数据
表格中 “status” 是结果标签:0表示未逾期,1表示逾期。


未逾期:3561 逾期:1193

2.数据类型分析


90列中70列为float,13列为int,7列object


object类型的列名,以及其分布

3.删除无关变量

4.缺失值处理

5.划分数据集


测试集30%,训练集70%,随机种子设置为2018

待续…

编程小号
上一篇 2025-03-02 19:51
下一篇 2025-03-12 19:01

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/hz/146360.html