书上的表达:假设你只想保留包含一定数量的观察值的行,可以使用thresh参数来表示。
嗯嗯嗯….有些模棱两可。摸索了一番,终于理解了。

格式:df.dropna ( thresh=n )
简单的理解:这一行除去NA值,剩余数值的数量大于等于n,便显示这一行。

----

1.先创建数组,代码如下:

1 import numpy as np 2 from numpy import nan as NA 3
4 import pandas as pd 5 from pandas import Series,DataFrame 6
7 df = pd.DataFrame (np.random .randn(8,7)) 8
9 df.iloc[0,:] = NA 10 df.iloc[1,:6] = NA 11 df.iloc[2,:5] = NA 12 df.iloc[3,:4] = NA 13 df.iloc[4,:3] = NA 14 df.iloc[5,:2] = NA 15 df.iloc[6,0] = NA
Jetbrains全家桶1年46,售后保障稳定
输出显示:(最左边一列是索引)
----
2.验证:
(1)n=1,即剔除NA值,这些行剩余的数值数量大于等于1
df.dropna(thresh=1)
输出显示:索引号为[0]的第1行被剔除
(2)n=3,即剔除NA值,这些行剩余的数值数量大于等于3
df.dropna(thresh=3)
输出显示:索引号为[0]至[2]的前3行被剔除
(3)n=6,即剔除NA值,这些行剩余的数值数量大于等于6
df.dropna(thresh=6)
输出显示:索引号为[0]至[5]的前6行被剔除
转载于:https://www.cnblogs.com/zeng-ymzkx/p/11468912.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/hz/131221.html