1. pd.merge(df1, df2, on, how)/df1.merge(df2, on, how)。
该方法用于合并两个有着相同column(s)的数据集,常用的参数:
on = ‘column name’,用到这个参数的时候一定要保证左表和右表用来对齐的那一列都有相同的列名;
how = ‘inner/outer/left/right’,是合并(连接)的方式,有inner(内连接),left(左外连接), right(右外连接), outer(全外连接),默认为inner。
|
|
(1) how = ‘left’,保留左表的全部数据。
|
|
(2) how = ‘right’,保留右表的全部数据。
|
|
(3) how = ‘outer’,保留两个表的所有数据。
|
|
(4) how = ‘inner’,保留两个表中公共部分的数据。不指定此参数也默认为inner。
|
|