๋์๋ฌธ์ ์ฒ๋ฆฌํ๊ธฐ
๊ธฐ๋ณธ ๋ฐ์ดํฐ
๋จ์ด๋ค์ด ๋๋ฌธ์, ์๋ฌธ์ ๋ค ์์ฌ ์๋ค.
str.lower()
๋ชจ๋ ์๋ฌธ์๋ก ๋ฐ๊ฟ์ฃผ๊ธฐ
str.upper()
๋ชจ๋ ๋๋ฌธ์๋ก ๋ฐ๊ฟ์ฃผ๊ธฐ
str.capitalize()
์๊ธ์๋ง ๋๋ฌธ์๋ก ๋ฐ๊ฟ์ฃผ๊ธฐ
๋ฐ์ดํฐ ํ๋ ์์ ์ ์ฉ
๋ฌธ์์ด ๋ถ๋ฆฌํ๊ธฐ
๊ธฐ๋ณธ ๋ฐ์ดํฐ
str.split('๊ตฌ๋ถ์ ')
ํด๋น ํจ์๋ก ๋ฌธ์์ด์ ๋๋์ด์ค๋ค.
๋๋ ๋ฌธ์์ด์ 0๋ฒ ์ธ๋ฑ์ค ๊ฐ์ ๊ฐ์ ธ์์ ์๋ก์ด ์ปฌ๋ผ์ ์ ์ฅํ๋ค.
๋๋ ๋ฌธ์์ด์ 1๋ฒ ์ธ๋ฑ์ค ๊ฐ์ ๊ฐ์ ธ์์ ์๋ก์ด ์ปฌ๋ผ์ ์ ์ฅํ๋ค.
์๋ ๋๋๊ธฐ ์ ๋ฌธ์์ด ์ปฌ๋ผ์ ์ญ์ ํ๋ค.
๋ถํ์ํ ๋ฌธ์ ์ ๊ฑฐํ๊ธฐ
์ํ๋ ๊ฐ์ด ์๋์จ๋ค.
unique()ํจ์๋ก ํ์ธํด๋ณด๋ ์์ ๊ณต๋ฐฑ๋ ์๊ณ , ๋ค์ .๋ ์๋ค.
str.strip()
์ ํจ์๋ฅผ ์จ์ ๊ณต๋ฐฑ์ ์์ ์ค๋ค. ๊ทธ๋ฆฌ๊ณ ์ ์ฅํด์ค๋ค.
str.replace('๊ธฐ์กด๊ฐ', '๋ฐ๊ฟ ๊ฐ')
๋ค์ ์ ์ ์์ ์ฃผ๊ณ ์ ์ฅํด์ค๋ค.
์ด๊ฑด ์์ ์ฃผ๋ ํจ์๋ ์๋๊ณ ๋ฐ๊ฟ์ฃผ๋ ํจ์๋ค.
๊ฒฐ๊ณผ๋ฅผ ๋ณด๋ฉด ๊น๋ํด์ก๋ค.
ํ ๋ฒ์ ์์ฑํ๋ ๊ฒ๋ ๊ฐ๋ฅ!
์ด๋ .str์ ๋นผ๋จน์ง ๋ง์.
์ค์ต 1
import pandas as pd
cellphone_df = pd.read_csv('data/cellphone.csv')
# ์ฌ๊ธฐ์ ์ฝ๋๋ฅผ ์์ฑํ์ธ์.
cellphone_df['brand'] = cellphone_df['brand'].str.capitalize()
cellphone_df['model'] = cellphone_df['name'].str.split('(').str[0].str.strip()
cellphone_df['capacity'] = cellphone_df['name'].str.split('(').str[1].str.replace(')','',regex=True)
cellphone_df = cellphone_df.drop(columns = 'name')
cellphone_df['size'] = cellphone_df['size'].str.replace('"','')
cellphone_df['size'] = cellphone_df['size'].astype('float')
cellphone_df
์ฝ๋์ 15. ๋ฌธ์ ๋ฐ์ดํฐ ๊ฐ๊ณตํ๊ธฐ
'๋ง์ผํ > ๋ฐ์ดํฐ ๋ถ์' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[ํ์ด์ฌ] ๋ ์ง์ ์๊ฐ ๋ฐ์ดํฐ ๋ค๋ฃจ๊ธฐ (0) | 2025.03.14 |
---|---|
[ํ์ด์ฌ] ์ซ์ ๋ฐ์ดํฐ ๊ฐ๊ณตํ๊ธฐ (0) | 2025.03.14 |
[ํ์ด์ฌ] ๋ฐ์ดํฐ ๋ค๋ฌ๊ธฐ (0) | 2025.03.13 |
[ํ์ด์ฌ] DataFrame ๊ธฐ๋ณธ๊ธฐ (0) | 2025.03.13 |
[ํ์ด์ฌ] seaborn (0) | 2025.03.13 |