데이터를 결합하는데 사용하는 함수는 총 두 가지가 존재한다.
DataFrame.concat과 DataFrame.append의 차이점은 concat은 좌,우(axis=1)로 합칠 수 있지만 append의 경우 상,하(0)로 합칠 수 있다.
#df1, df2, df3 데이터 생성
df1=pd.DataFrame({'A':['A0','A1','A2','A3'],
'B':['B0','BT','B2','B3'],
'C':['C0','C1','C2','C3'],
'D':['D0','D1','D2','D3']},
index=[0,1,2,3])
df2=pd.DataFrame({'A':['A4','A5','A6','A7'],
'B':['B4','B5','B6','B7'],
'C':['C4','C5','C6','C7'],
'D':['D4','D5','D6','D7']},
index=[4,5,6,7])
df3=pd.DataFrame({'A':['A8','A9','A10','A11'],
'B':['B8','B9','B10','B11'],
'C':['C8','C9','C10','C11'],
'D':['D8','D9','D10','D11']},
index=[8,9,10,11])
# 동일한 기능을 수행한다.
pd.concat([df1,df2,df3])
df1.append([df2,df3])
# ignore_index은 원래 있던 인덱스를 사용하지 않고, 다시 셀별로 인덱싱한다. 이때, 멀티인덱스는 사라진다.
result=pd.concat([df1,df2,df3],keys=['A','B','C','D'],names=['Dataframe name', 'Row ID'],ignore_index=False)
result
728x90
반응형
'Developer's Life > BigData' 카테고리의 다른 글
BigData 데이터 수집 (0) | 2023.05.02 |
---|---|
BigData 예측 모델 (0) | 2023.05.01 |
BigData 데이터 정렬 및 중복성 확인 (0) | 2023.05.01 |
BigData 데이터 결합2 (0) | 2023.05.01 |
BigData 데이터 내용 확인 (0) | 2023.04.28 |