python中count()、values_counts()、size()函数

python中count()、values_counts()、size()函数python中count()、values_counts()、size()函数

转载了count()函数,以便自己以后更好的查阅。

string 中 某字符 的次数

str.count(sub, start= 0,end=len(string))

Args Annotations
sub 搜索的子字符串
start 字符串开始搜索的位置。默认为第一个字符,第一个字符索引值为0。
end 字符串中结束搜索的位置。字符中第一个字符的索引为 0。默认为字符串的最后一个位置。

list 中 某元素 的次数

list.count(obj)

Args Annotations
obj 搜索的list

实验代码

string 中 某字符 的次数

# coding=utf-8
string = 'Hello World ! Hello Python !'
print "string.count(sub) : ", string.count('H')
print "string.count(sub, 1) : ", string.count('H', 1)
print "string.count(sub, 1, 100) : ", string.count('H', 1, 100) # 随便取个 无限大的 end 参数

打印结果:

string.count(sub) :  2
string.count(sub, 1) :  1
string.count(sub, 1, 100) :  1

list 中 某元素 的次数

list = [10, 20, 30, 'Hello', 10, 20]
print "list.count('Hello') : ", list.count('Hello')
print "list.count(10) : ", list.count(10)

打印结果:

list.count('Hello') :  1
list.count(10) :  2

pandas 的value_counts()函数可以对Series里面的每个值进行计数并且排序。

现有一个DataFrame

python中count()、values_counts()、size()函数

如果我们想知道,每个区域出现了多少次,可以简单如下:

python中count()、values_counts()、size()函数

每个区域都被计数,并且默认从最高到最低做降序排列。

如果想用升序排列,可以加参数ascending=True:

python中count()、values_counts()、size()函数

如果想得出的计数占比,可以加参数normalize=True:

python中count()、values_counts()、size()函数

空值是默认剔除掉的。value_counts()返回的结果是一个Series数组,可以跟别的数组进行运算。

value_count()跟透视表里(pandas或者excel)的计数很相似,都是返回一组唯一值,并进行计数。这样能快速找出重复出现的值。

size()和shape () 是numpy模块中才有的函数

size():计算数组和矩阵所有数据的个数 
a = np.array([[1,2,3],[4,5,6]]) 
np.size(a),返回值为 6 
np.size(a,1),返回值为 3

shape ():得到矩阵每维的大小 
np. shape (a),返回值为 (2,3)

另外要注意的是,shape和size既可以作为函数,也可以作为ndarray的属性 
a.size,返回值为 6, 
a.shape,返回值为 (2,3)

今天的文章python中count()、values_counts()、size()函数分享到此就结束了,感谢您的阅读。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/8942.html

(0)
编程小号编程小号

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注