pandas가 지원하는 Importing/Exporting 포맷은 아래와 같습니다.
- csv (모든 text파일 연결에 사용)
- excel
- sql (모든 데이터베이스 연결에 사용)
- hdf5
- json
- html
- pickle
- ...
#import
pd.read_포맷()
# csv, tsv, txt 파일도 read_csv()로 읽어올 수 있다.
# csv, tsv 둘 다 txt 파일인대 값의 구분자로 comma, tab을 사용했다는 것의 차이가 있는것 뿐이기 때문
ex) pd.read_csv('FILE_PATH', sep=',') #sep=',' 는 default이다.
pd.read_excel('FILE_PATH', sheet_name=0) #sheet_name=0 은 default이다. 2번째 시트를 가져오려면 sheet_name 파라메타에 1을 전달해야 한다. 또는 sheet_name='Sheet2' 처럼 시트의 이름을 명시해서 가져올수도 있다.
#export
pd.to_포맷()
# index=False 없이 DataFrame Export하면 df의 index 값이 'Unnamed: 0' 칼럼명으로 들어가게 된다.
ex) pd.to_csv('FILE_PATH', index=False)
pd.to_excel('FILE_PATH', sheet_name='SHEET_NAME', index=False)
두 개 이상의 DataFrame을 여러개의 Excel Sheets에 나누어서 쓰는법 정리된 블로그
https://rfriend.tistory.com/466
# Write two DataFrames to Excel using to_excel(). Need to specify an ExcelWriter object first. with pd.ExcelWriter(xlxs_dir) as writer: df_1.to_excel(writer, sheet_name = 'DF_1') df_2.to_excel(writer, sheet_name = 'DF_2') |
출처: https://rfriend.tistory.com/466 [R, Python 분석과 프로그래밍의 친구 (by R Friend)]
데이터베이스 연결해서 data read 하는 방법 아래 유튜브 영상에 정리되어 있음(나중에 필요할 때 참고할 것)
https://www.youtube.com/watch?v=3XqWk-FNrqk
pd.read_sql("DB Query", connection)
ex) pd.read_sql("select created, logic_name, db from analysis limit 3', connection)
댓글