본문 바로가기
카테고리 없음

Pandas 기본기 다지기 3강 - Pandas 데이터 입출력 I - Importing / Exporting (csv ,tsv, txt)

by 문자메일 2020. 6. 14.

pandas가 지원하는 Importing/Exporting 포맷은 아래와 같습니다.

  • csv (모든 text파일 연결에 사용)
  • excel
  • sql (모든 데이터베이스 연결에 사용)
  • hdf5
  • json
  • html
  • pickle
  • ...

#import

pd.read_포맷()

 

# csv, tsv, txt 파일도 read_csv()로 읽어올 수 있다.

# csv, tsv 둘 다 txt 파일인대 값의 구분자로 comma, tab을 사용했다는 것의 차이가 있는것 뿐이기 때문

ex) pd.read_csv('FILE_PATH', sep=',') #sep=',' 는 default이다. 

pd.read_excel('FILE_PATH', sheet_name=0) #sheet_name=0 은 default이다. 2번째 시트를 가져오려면 sheet_name 파라메타에 1을 전달해야 한다. 또는 sheet_name='Sheet2' 처럼 시트의 이름을 명시해서 가져올수도 있다.

 

#export

pd.to_포맷()

 

# index=False 없이 DataFrame Export하면 df의 index 값이 'Unnamed: 0' 칼럼명으로 들어가게 된다.

ex) pd.to_csv('FILE_PATH', index=False)

pd.to_excel('FILE_PATH', sheet_name='SHEET_NAME', index=False)

 

 

두 개 이상의 DataFrame을 여러개의 Excel Sheets에 나누어서 쓰는법 정리된 블로그

https://rfriend.tistory.com/466

# Write two DataFrames to Excel using to_excel(). Need to specify an ExcelWriter object first.

with pd.ExcelWriter(xlxs_dir) as writer:

    df_1.to_excel(writer, sheet_name = 'DF_1')

    df_2.to_excel(writer, sheet_name = 'DF_2') 

출처: https://rfriend.tistory.com/466 [R, Python 분석과 프로그래밍의 친구 (by R Friend)]

 

 

 

데이터베이스 연결해서 data read 하는 방법 아래 유튜브 영상에 정리되어 있음(나중에 필요할 때 참고할 것)

https://www.youtube.com/watch?v=3XqWk-FNrqk

pd.read_sql("DB Query", connection)

ex) pd.read_sql("select created, logic_name, db from analysis limit 3', connection)

댓글