티스토리 뷰
출처: 나도코딩
데이터 등록
data = {
'이름': ['채치수', '정대만', '송태섭', '서태웅', '강백호', '변덕규', '황태산', '윤대협'],
'학교': ['북산고', '북산고', '북산고', '북산고', '북산고', '능남고', '능남고', '능남고'],
'키' : [197, 184, 168, 187, 188, 202, 188, 190],
'국어': [90, 40, 80, 40, 15, 80, 55, 100],
'영어': [85, 35, 75, 60, 20, 100, 65, 85],
'수학': [100, 50, 70, 70, 10, 95, 45, 90],
'과학': [95, 55, 80, 75, 35, 85, 40, 95],
'사회': [85, 25, 75, 80, 10, 80, 35, 95],
'SW특기': ['Python', 'Java', 'Javascript', '', '', 'C', 'PYTHON', 'C#'],
}
data
Pandas import와 DataFrame
import pandas as pd
df = pd.DataFrame(data)
DataFrame: 테이블 형식 데이터
df 사용하여 일부 컬럼만 select
df['이름']
df['키']
df[['이름', '키']]
index 설정하기 & index의 column명 설정하기
df = pd.DataFrame(data, index=['1번', '2번', '3번', '4번', '5번', '6번', '7번', '8번'])
df.index.name = '지원번호'

일부 컬럼 발췌하기
df = pd.DataFrame(data, columns=['이름', '학교', '키']) # 컬럼명 순서는 변경 O
Index
index 정보보기
df.index
index 제거하기(테이블에서만)
df.reset_index()
df.reset_index(drop=True) # 보이는 index만 제거
index 제거하기(실제 데이터에서도)
df.reset_index(drop=True, inplace=True) # inplace=True 실 데이터 바로 반영: 인덱스 삭제
기존 column명으로 index 설정
df.set_index('이름')
df.set_index('이름', inplace=True)
index 오름차순, 내림차순
df.sort_index() # 내가 지정해둔 column을 기준으로 오름차순
df.sort_index(ascending=False)
데이터 csv로 내보내기
df.to_csv('score.csv')
df.to_csv('score.csv', encoding='utf-8-sig') #나는 안해도 괜찮았음
df.to_csv('score.csv', encoding='utf-8-sig', index=False) #index 제거해서