BigData 데이터 결합

Simon_Kim 2023. 4. 29. 23:55

2023. 4. 29. 23:55

데이터를 결합하는데 사용하는 함수는 총 두 가지가 존재한다.

DataFrame.concat과 DataFrame.append의 차이점은 concat은 좌,우(axis=1)로 합칠 수 있지만 append의 경우 상,하(0)로 합칠 수 있다.

#df1, df2, df3 데이터 생성
df1=pd.DataFrame({'A':['A0','A1','A2','A3'],
                  'B':['B0','BT','B2','B3'],
                  'C':['C0','C1','C2','C3'],
                  'D':['D0','D1','D2','D3']},
                  index=[0,1,2,3])
df2=pd.DataFrame({'A':['A4','A5','A6','A7'],
                  'B':['B4','B5','B6','B7'],
                  'C':['C4','C5','C6','C7'],
                  'D':['D4','D5','D6','D7']},
                  index=[4,5,6,7])
df3=pd.DataFrame({'A':['A8','A9','A10','A11'],
                  'B':['B8','B9','B10','B11'],
                  'C':['C8','C9','C10','C11'],
                  'D':['D8','D9','D10','D11']},
                  index=[8,9,10,11])

# 동일한 기능을 수행한다.
pd.concat([df1,df2,df3])
df1.append([df2,df3])

# ignore_index은 원래 있던 인덱스를 사용하지 않고, 다시 셀별로 인덱싱한다. 이때, 멀티인덱스는 사라진다.
result=pd.concat([df1,df2,df3],keys=['A','B','C','D'],names=['Dataframe name', 'Row ID'],ignore_index=False)
result

728x90

저작자표시 비영리 (새창열림)

'Developer's Life > BigData' 카테고리의 다른 글

BigData 데이터 수집 (0)	2023.05.02
BigData 예측 모델 (0)	2023.05.01
BigData 데이터 정렬 및 중복성 확인 (0)	2023.05.01
BigData 데이터 결합2 (0)	2023.05.01
BigData 데이터 내용 확인 (0)	2023.04.28

SIMON

BigData 데이터 결합

'Developer's Life > BigData' 카테고리의 다른 글

+ Recent posts

티스토리툴바