一、sort_values()函数用途
pandas中的sort_values()函数原理类似于SQL中的order by,可以将数据集依照某个字段中的数据进行排序,该函数即可根据指定列数据也可根据指定行的数据排序。
二、sort_values()函数的具体参数
用法:
1
|
DataFrame.sort_values(by = ‘ ##',axis=0,ascending=True, inplace=False, na_position=‘last') |
参数说明
参数 | 说明 |
---|---|
by | 指定列名(axis=0或'index')或索引值(axis=1或'columns') |
axis | 若axis=0或'index',则按照指定列中数据大小排序;若axis=1或'columns',则按照指定索引中数据大小排序,默认axis=0 |
ascending | 是否按指定列的数组升序排列,默认为True,即升序排列 |
inplace | 是否用排序后的数据集替换原来的数据,默认为False,即不替换 |
na_position | {‘first',‘last'},设定缺失值的显示位置 |
三、sort_values用法举例
创建数据框
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
|
#利用字典dict创建数据框 import numpy as np import pandas as pd df = pd.DataFrame({ 'col1' :[ 'A' , 'A' , 'B' ,np.nan, 'D' , 'C' ], 'col2' :[ 2 , 1 , 9 , 8 , 7 , 7 ], 'col3' :[ 0 , 1 , 9 , 4 , 2 , 8 ] }) print (df) >>> col1 col2 col3 0 A 2 0 1 A 1 1 2 B 9 9 3 NaN 8 4 4 D 7 2 5 C 7 8 |
依据第一列排序,并将该列空值放在首位
1
2
3
4
5
6
7
8
9
10
|
#依据第一列排序,并将该列空值放在首位 print (df.sort_values(by = [ 'col1' ],na_position = 'first' )) >>> col1 col2 col3 3 NaN 8 4 0 A 2 0 1 A 1 1 2 B 9 9 5 C 7 8 4 D 7 2 |
依据第二、三列,数值降序排序
1
2
3
4
5
6
7
8
9
10
|
#依据第二、三列,数值降序排序 print (df.sort_values(by = [ 'col2' , 'col3' ],ascending = False )) >>> col1 col2 col3 2 B 9 9 3 NaN 8 4 5 C 7 8 4 D 7 2 0 A 2 0 1 A 1 1 |
根据第一列中数值排序,按降序排列,并替换原数据
1
2
3
4
5
6
7
8
9
10
11
12
|
#根据第一列中数值排序,按降序排列,并替换原数据 df.sort_values(by = [ 'col1' ],ascending = False ,inplace = True , na_position = 'first' ) print (df) >>> col1 col2 col3 3 NaN 8 4 4 D 7 2 5 C 7 8 2 B 9 9 1 A 1 1 0 A 2 0 |
按照索引值为0的行,即第一行的值来降序排序
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
|
x = pd.DataFrame({ 'x1' :[ 1 , 2 , 2 , 3 ], 'x2' :[ 4 , 3 , 2 , 1 ], 'x3' :[ 3 , 2 , 4 , 1 ]}) print (x) #按照索引值为0的行,即第一行的值来降序排序 print (x.sort_values(by = 0 ,ascending = False ,axis = 1 )) >>> x1 x2 x3 0 1 4 3 1 2 3 2 2 2 2 4 3 3 1 1 x2 x3 x1 0 4 3 1 1 3 2 2 2 2 4 2 3 1 1 3 |
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持服务器之家。
原文链接:https://www.cnblogs.com/avivi/p/10813318.html