PANDAS(4)
-
python - pandas apply를 사용한 데이터 수정 with lambda
pandas를 사용해서 데이터를 다룰 때 구성된 데이터의 하나의 컬럼 데이터를 통째로 연산해야 하거나 변환해야하는 경우가 생기게 됩니다. 이때 사용하면 유용한 pandas 함수 apply를 알아봅시다 우선 데이터를 생성해 볼까요? 데이터 셋 생성 import pandas as pd # 예제 데이터프레임 생성 data = { '이름': ['홍길동', '이순신', '박보영'], '나이': [25, 40, 33], '부모의 나이 평균': [55, 62, 63], '도시': ['서울', '부산', '대구'] } df = pd.DataFrame(data) 다음과 같은 테이블을 생성 했습니다. 여기서 처음 시도해 볼 것은 이 유저의 나이를 1씩 더하는 작업을 진행하게 될겁니다 단일 Column 수정 - 유저의 나이..
2024.03.12 -
Python - Pandas read_csv 'utf-8' codec can't decode byte 0xb3 in position 19: invalid start byte ERROR 해결
'utf-8' codec can't decode byte 0xb3 in position 19: invalid start byte Pandas에서 read_csv를 사용할때 csv에 한글이 포함되어 있고 Encoding이 utf-8로 구성되어 pandas를 이용하여 파일을 읽을때 발생하는 에러입니다. 해결법은 매우 간단 합니다. Encoding을 다시 해서 불러주면 되는데 아래 예제 코드를 사용해 봅니다. import pandas as pd df = pd.read_csv("data.csv", encoding='cp949') cp949 encoding 방식은 한글 관련 인코딩 방식으로 이를 사용하여 불러오기를 진행하면 에러 없이 진행이 가능합니다.
2021.10.28 -
Python - DataFrame Column 이름 변경
이번에 알아볼 내용은 Dataframe의 Column 이름 변경을 해보도록 하겠습니다. 굉장히 많이 쓰이는 기능인데.. 저는 매번 바꿀 때마다 까먹어서 포스팅을 작성해서 기억에 좀 넣어보도록 하겠습니다. 이번에도 코드를 보며 진행해보도록 합니다. # Pandas 로딩 import pandas as pd # Dataframe 생성 df = pd.DataFrame({ 'a': [4, 5, 6], 'b': [7, 8, 9], 'c': [10, 11, 12]}, index = [1, 2, 3] ) # 첫번째 방법 df.columns = ["d", "e", "f"] df #두번째 방법 df.rename(columns = {'d' : 'a', 'e':'b', "f":"c"}, inplace = True) df 이렇..
2021.09.11 -
Pandas - CSV 저장 한글 깨짐 오류
Pandas CSV 저장 한글깨짐이 발생하면 Encoding을 진행하면 된다. result.to_csv("./result.csv", encoding='utf-8-sig') 단 여기서 Encoding을 할때 utf-8이 아닌 utf-8-sig로 해줘야 정상적으로 파일에 한글을 깨지지 않게 저장할 수 있다.
2021.08.20