1. 找出数据集中的重复数据,使用df.duplicated()
|
|
O ever youthful, O ever weeping!
|
|
|
|
|
|
matplotlib.colors.ListedColormap(colors, name = ‘from_list’, N = None)
colors 为颜色列表,颜色指定可以使用十六进制颜色,https://www.colorhexa.com 这个网站可以用来产生各种颜色的代码。name 和 N 还没用过。
|
|
level值可以改为其他值,如0。fill_value可以指定空白值为多少,如fill_value = 0。此外还可以将需要unstack的元素传入作为参数,如DataFrame.unstack(‘Medal’)。
|
|
表示不修改dataFrame,如果为True,则修改dataFrame.
如果是数列数据
作用:返回一个包含值和该值出现次数的Series对象,次序按照出现的频率由高到低排序。
参数:
normalize : 布尔值,默认为False,如果是True的话,就会包含该值出现次数的频率。
sort : 布尔值,默认为True.排序控制。
ascending : 布尔值,默认为False,以降序排序。
dropna : 布尔型,默认为True,表示不包括NaN(缺失值)。
|
|
如果CSV文件前几行是文件说明,真正有用的数据从后面几行开始,那么则读取文件时则需要跳过这几行区域。