대소문자 처리하기
기본 데이터
단어들이 대문자, 소문자 다 섞여 있다.
str.lower()
모두 소문자로 바꿔주기
str.upper()
모두 대문자로 바꿔주기
str.capitalize()
앞글자만 대문자로 바꿔주기
데이터 프레임에 적용
문자열 분리하기
기본 데이터
str.split('구분점')
해당 함수로 문자열을 나누어준다.
나눈 문자열의 0번 인덱스 값을 가져와서 새로운 컬럼에 저장한다.
나눈 문자열의 1번 인덱스 값을 가져와서 새로운 컬럼에 저장한다.
원래 나누기 전 문자열 컬럼을 삭제한다.
불필요한 문자 제거하기
원하는 값이 안나온다.
unique()함수로 확인해보니 앞에 공백도 있고, 뒤에 .도 있다.
str.strip()
위 함수를 써서 공백을 없애준다. 그리고 저장해준다.
str.replace('기존값', '바꿀 값')
뒤에 점을 없애주고 저장해준다.
이건 없애주는 함수는 아니고 바꿔주는 함수다.
결과를 보면 깔끔해졌다.
한 번에 작성하는 것도 가능!
이때 .str을 빼먹지 말자.
실습 1
import pandas as pd
cellphone_df = pd.read_csv('data/cellphone.csv')
# 여기에 코드를 작성하세요.
cellphone_df['brand'] = cellphone_df['brand'].str.capitalize()
cellphone_df['model'] = cellphone_df['name'].str.split('(').str[0].str.strip()
cellphone_df['capacity'] = cellphone_df['name'].str.split('(').str[1].str.replace(')','',regex=True)
cellphone_df = cellphone_df.drop(columns = 'name')
cellphone_df['size'] = cellphone_df['size'].str.replace('"','')
cellphone_df['size'] = cellphone_df['size'].astype('float')
cellphone_df
코드잇 15. 문자 데이터 가공하기
'마케팅 > 데이터 분석' 카테고리의 다른 글
[파이썬] 날짜와 시간 데이터 다루기 (0) | 2025.03.14 |
---|---|
[파이썬] 숫자 데이터 가공하기 (0) | 2025.03.14 |
[파이썬] 데이터 다듬기 (0) | 2025.03.13 |
[파이썬] DataFrame 기본기 (0) | 2025.03.13 |
[파이썬] seaborn (0) | 2025.03.13 |