concat()函數(shù)可以沿著一條軸將多個(gè)對(duì)象進(jìn)行堆疊,其使用方式類似數(shù)據(jù)庫(kù)中的數(shù)據(jù)表合并,該函數(shù)的語(yǔ)法格式如下:
pandas.contact(objs,axis=0,join='outer',join_axes=None,ignore_index=False,
keys=None,levels=None,names=None,verify_integrity=False,
sort=None, copy=True)
上述函數(shù)中常用參數(shù)表示的含義如下:
(1)axis:表示連接的軸向,可以為0或1,默認(rèn)為0。
(2)join:表示連接的方式,inner表示內(nèi)連接,outer表示外連接,默認(rèn)使用外連接。
(3)ignore_index:接收布爾值,默認(rèn)為False。如果設(shè)置為True,則表示清除現(xiàn)有索引并重置索引值。
(4)keys:接收序列,表示添加最外層索引。
(5)levels:用于構(gòu)建MultiIndex的特定級(jí)別(唯一值)。
(6)names:在設(shè)置了keys和level參數(shù)后,用于創(chuàng)建分層級(jí)別的名稱。
(7)verify_integerity:檢查新的連接軸是否包含重復(fù)項(xiàng)。接收布爾值,當(dāng)設(shè)置為True時(shí),如果有重復(fù)的軸將會(huì)拋出錯(cuò)誤,默認(rèn)為False。
根據(jù)軸方向的不同(axis參數(shù)),可以將堆疊分成橫向堆疊或縱向堆疊,默認(rèn)采用的是縱向堆疊方式。在堆疊數(shù)據(jù)時(shí),默認(rèn)采用的是縱向堆疊方式。在堆疊數(shù)據(jù)時(shí),默認(rèn)采用的是外連接(join參數(shù)設(shè)為outer)的方式,當(dāng)然也可以通過(guò)join=inner設(shè)置為內(nèi)連接的方式,圖4-10是兩種連接方式的示意圖。
圖4-10 連接方式
圖4-10中,A和B分別表示兩個(gè)數(shù)據(jù)集。當(dāng)A與B采用外連接的方式合并時(shí),所得的結(jié)果為索引并集部分的數(shù)據(jù),數(shù)據(jù)不足的地方使用NaN補(bǔ)齊即可;當(dāng)A與B采用內(nèi)連接的方式合并時(shí),則所得的結(jié)果僅僅為索引交集(重疊)部分的數(shù)據(jù)。