๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
๋งˆ์ผ€ํŒ…/์‹ค์Šต

๊ฐ€์ƒ ๋ฐ์ดํ„ฐ๋กœ ๋ฐ์ดํ„ฐ ๋ถ„์„ ์‹ค์Šต - ํ• ์ธ์— ๋”ฐ๋ฅธ ์†Œ๋น„์ž ํ–‰๋™ ๋ถ„์„

by ํผํฌ๋งˆ์ฒผ๋ผ 2025. 2. 2.

 

 

 

๋ชฉ์ 

ํ”ผ๋ฒ—ํ…Œ์ด๋ธ”์„ ํ™œ์šฉํ•ด ์†Œ๋น„์ž ํ–‰๋™ ๋ถ„์„์„ ์—ฐ์Šตํ•˜๊ณ ์ž, ์บ๊ธ€์—์„œ ๋ฌด๋ฃŒ ๊ฐ€์ƒ ๋ฐ์ดํ„ฐ๋ฅผ ๋‹ค์šด๋กœ๋“œํ•˜์—ฌ ํ•œ ๊ฐ€์ง€ ๋ชฉํ‘œ๋ฅผ ์„ค์ •ํ•˜๊ณ  ๋ฐ์ดํ„ฐ๋ฅผ ๋ถ„์„ํ•ด ๋ณด์•˜๋‹ค.


๋‹ค์šด๋กœ๋“œํ•œ ์ž๋ฃŒ

https://www.kaggle.com/datasets/uom190346a/e-commerce-customer-behavior-dataset/data

 

E-commerce Customer Behavior Dataset

Exploring Customer Engagement and Purchasing Patterns in an E-commerce

www.kaggle.com


๊ฐ€์ƒ ๋ฐ์ดํ„ฐ ์ •๋ณด

์˜ค๋Š˜ ๋ถ„์„ํ•˜๊ณ ์ž ํ–ˆ๋˜ ๊ฒƒ์ด '์†Œ๋น„์ž ํ–‰๋™'์ด์—ˆ๊ธฐ ๋•Œ๋ฌธ์— '์†Œ๋น„์ž'์™€ ๊ด€๋ จ๋œ ์ž๋ฃŒ๋ฅผ ์ฐพ์•„ ๋‹ค์šด๋กœ๋“œํ•˜์˜€๋‹ค.

๋ฐ์ดํ„ฐ์˜ ์–‘์€ ๋งŽ์ง€ ์•Š์•˜๊ณ , ์ปฌ๋Ÿผ์— ๋Œ€ํ•ด ํ™•์ธํ•˜๋ฉด์„œ ์–ด๋–ค ๋ชฉ์ ์œผ๋กœ ๋ถ„์„ํ•˜๋ฉด ์ข‹์„์ง€ ๊ณ ๋ฏผํ•ด ๋ณด์•˜๋‹ค.

 


์‹ค์Šต ์‹œ์ž‘

 

๋ถ„์„ ๋ชฉ์  

๊ตฌ๋งค ํ• ์ธ์ด ๊ณ ๊ฐ์—๊ฒŒ ๋ฏธ์น˜๋Š” ์˜ํ–ฅ (ํ• ์ธ์— ๋”ฐ๋ฅธ ์†Œ๋น„์ž ํ–‰๋™ ๋ถ„์„)

 

 

๋ถ„์„ ๊ณผ์ •

์—ฐ๋ น, ์„ฑ, ์ง€์—ญ์„ ๊ธฐ์ค€์œผ๋กœ ๊ตฌ๋งค ํ• ์ธ์œผ๋กœ ์ง€์ถœํ•œ ๊ธˆ์•ก์„ ์„ธํŒ…ํ–ˆ๊ณ , ์ด์ง€์ถœ์—์„œ ๊ตฌ๋งค ํ• ์ธ์œผ๋กœ ์ง€์ถœ๋œ ๊ธˆ์•ก์ด ์–ผ๋งˆ์ธ์ง€ ๋น„์œจ์„ ๊ณ„์‚ฐํ–ˆ๋‹ค.

์ง€์—ญ ๊ธฐ์ค€์œผ๋กœ ๋ถ„์„ํ•œ ๊ฒฐ๊ณผ ์ง€์—ญ๋งˆ๋‹ค 100 ์•„๋‹ˆ๋ฉด 0์ด๋ผ๋Š” ๊ฒฐ๊ณผ๊ฐ€ ๋‚˜์™”๋‹ค.

ํŠน์ • ์ง€์—ญ์—๋งŒ ํ• ์ธ์„ ์ ์šฉ์‹œ์ผœ์„œ ์ด๋Ÿฐ ๊ฒฐ๊ณผ๊ฐ€ ๋‚˜์™”์„ ๊ฑฐ๋ผ๊ณ  ํŒ๋‹จํ•˜๊ณ  ์ง€์—ญ๋ณ„ ๋ฐ์ดํ„ฐ๋Š” ์ผ๋‹จ ๋ฐฐ์ œํ•˜์˜€๋‹ค.

 

์—ฐ๋ น๋ณ„ ๋ฐ์ดํ„ฐ๋ฅผ ๋ณด๋ฉด 20๋Œ€์™€ 30๋Œ€๋Š” ์ ˆ๋ฐ˜ ์•ˆ ๋˜๋Š” ๋น„์œจ๋กœ, 40๋Œ€๋Š” 100%์˜ ๋น„์œจ๋กœ ํ• ์ธ ์˜ํ–ฅ์„ ๋ฐ›์•˜๋‹ค.

์„ฑ๋ณ„ ๋ฐ์ดํ„ฐ๋ฅผ ๋ณด๋ฉด ์—ฌ์„ฑ์€ ๊ฑฐ์˜ 80% ๊ฐ€๊นŒ์ด ํ• ์ธ ์˜ํ–ฅ์„ ๋ฐ›์•˜๊ณ , ๋‚จ์„ฑ์€ ๊ทธ ๋ฐ˜๋Œ€์˜€๋‹ค.

 

์ด ๊ฒฐ๊ณผ๋ฅผ ํ™•์ธํ•˜๊ณ  ๋‚˜๋‹ˆ, ์—ฐ๋ น๋ณ„๋กœ ๋‚จ์„ฑ๊ณผ ์—ฌ์„ฑ์˜ ํ• ์ธ ์˜ํ–ฅ์ด ์–ด๋–ป๊ฒŒ ๋˜๋Š”์ง€ ๊ถ๊ธˆํ•ด์„œ ํ™•์ธํ•ด ๋ณด์•˜๋‹ค.

20๋Œ€ ์„ฑ๋ณ„ ๊ตฌ๋งค ํ• ์ธ ๋น„์œจ ์ฐจํŠธ๋ฅผ ํ™•์ธํ–ˆ์„ ๋•Œ๋Š” ๋‚จ์„ฑ์ด 100์ค‘ 93์„ ์ฐจ์ง€ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ๋” ๋งŽ์€ ์˜ํ–ฅ์„ ๋ฐ›์€ ๊ฒƒ ๊ฐ™์ง€๋งŒ, ๋ฐ์ดํ„ฐ๋ฅผ ์ง€์ถœ ๊ธˆ์•ก์œผ๋กœ ์„ค์ •ํ•ด์„œ ๊ทธ๋Ÿฐ์ง€ ์‹ค์ œ ์ง€์ถœ ๊ธˆ์•ก์„ ํ™•์ธํ•˜๋ฉด ๊ฒฐ๊ณผ๊ฐ€ ๋‹ค๋ฅด๋‹ค๋Š” ๊ฒƒ์„ ์•Œ ์ˆ˜ ์žˆ๋‹ค.

20๋Œ€ ์—ฌ์„ฑ๊ณผ 40๋Œ€ ์—ฌ์„ฑ์€ ํ• ์ธ ์—†๋Š” ์ง€์ถœ์ด ๋‹จ 1๊ฑด๋„ ์—†์—ˆ๊ณ , 30๋Œ€์˜ ๊ฒฝ์šฐ 72%๊ฐ€ ํ• ์ธ์— ์˜ํ–ฅ์„ ๋ฐ›์•˜๋‹ค.

๋‚จ์„ฑ์˜ ๊ฒฝ์šฐ 20๋Œ€ ๋•Œ๋Š” ์•ฝ 67%๊ฐ€ ํ• ์ธ ์—†์ด ์ง€์ถœํ–ˆ๊ณ , 30๋Œ€ ๋•Œ๋Š” 82%๊ฐ€ ํ• ์ธ ์—†์ด ์ง€์ถœํ–ˆ๋‹ค.

 

 

๋ถ„์„ ๊ฒฐ๊ณผ

ํ• ์ธ์ด ๊ตฌ๋งค ํ–‰๋™์— ์˜ํ–ฅ์„ ์ฃผ๋Š”์ง€์— ๋Œ€ํ•œ ๋ถ„์„ ๊ฒฐ๊ณผ ์—ฌ์„ฑ์˜ ๊ฒฝ์šฐ 79%๊ฐ€ ์˜ํ–ฅ์„ ์ฃผ์—ˆ์ง€๋งŒ, ๋‚จ์„ฑ์€ ํ• ์ธ์ด๋ผ๋Š” ์ด๋ฒคํŠธ๊ฐ€ ๊ตฌ๋งค ํ–‰๋™์— ์˜ํ–ฅ์„ ์ฃผ์ง€๋Š” ์•Š์•˜๋‹ค. 

 

 

๋ถ„์„ ๊ฒฐ๊ณผ์— ๋”ฐ๋ฅธ ๋งˆ์ผ€ํŒ… ์ „๋žต ์ œ์•ˆ

์—ฌ์„ฑ ๊ณ ๊ฐ์„ ํƒ€๊นƒ์œผ๋กœ ํ•œ ๋งž์ถคํ˜• ํ• ์ธ ์ด๋ฒคํŠธ๋‚˜ ์บ ํŽ˜์ธ์„ ์ง„ํ–‰ํ•œ๋‹ค.

์˜ˆ๋ฅผ ๋“ค์–ด,

1 ์—ฌ์„ฑ ๊ณ ๊ฐ ํŠน์ • ์ œํ’ˆ๊ตฐ์„ ํƒ€๊นƒ์œผ๋กœ ๋‹จ๊ธฐ ํ• ์ธ ์ด๋ฒคํŠธ๋‚˜ 2+1 ํ”„๋กœ๋ชจ์…˜์„ ์ง„ํ–‰ํ•œ๋‹ค.

2 ๊ตฌ๋งค ํ›„ ์žฌ๊ตฌ๋งค๋ฅผ ์œ„ํ•œ ํ• ์ธ ์ฟ ํฐ์„ ์ œ๊ณตํ•œ๋‹ค.

3 ์˜ค๋Š˜๋งŒ 50% ํ• ์ธ์ด๋ผ๋Š” ํƒ€์ž„ ๋ฆฌ๋ฏธํ‹ฐ๋“œ๋ฅผ ์ค˜์„œ ํ•œ์ • ํ• ์ธ ์ด๋ฒคํŠธ๋ฅผ ์ง„ํ–‰ํ•œ๋‹ค.

 

๋‚จ์„ฑ ๊ณ ๊ฐ์€ ํ• ์ธ์— ์˜ํ–ฅ์„ ๋ฐ›์ง€ ์•Š์œผ๋ฏ€๋กœ ์ œํ’ˆ์˜ ํ’ˆ์งˆ์ด๋‚˜ ๊ธฐ๋Šฅ ์ค‘์‹ฌ์˜ ๋งˆ์ผ€ํŒ…์„ ์ง„ํ–‰ํ•œ๋‹ค.

์˜ˆ๋ฅผ ๋“ค์–ด,

1 ๊ณ ๊ฐ ๋ฆฌ๋ทฐ์™€ ์‚ฌ๋ก€๋ฅผ ์ƒ์„ธํŽ˜์ด์ง€์— ๋„ฃ์–ด, ์ œํ’ˆ์˜ ๊ฐ€์น˜์™€ ์„ฑ๋Šฅ์„ ๋ณด์—ฌ์ค€๋‹ค.

2 ํŒจํ‚ค์ง€๋‚˜ ๋ฒˆ๋“ค์„ ์ œ๊ณตํ•˜์—ฌ ํ•˜๋‚˜์˜ ์ƒํ’ˆ์œผ๋กœ ๋” ํฐ ๊ฐ€์น˜๋Š” ์ œ๊ณตํ•˜๋Š” ๋А๋‚Œ์„ ์ค€๋‹ค.

3 'ํ•œ์ •ํŒ'์ด๋ผ๋Š” ํ‚ค์›Œ๋“œ๋กœ ์†Œ์œ ์š•์„ ์ž๊ทนํ•œ๋‹ค.


๋А๋‚€ ์ 

์‹ค์ œ๋กœ ์ด๋Ÿฐ ๋ฐ์ดํ„ฐ๋ฅผ ์ด์šฉํ•ด ๋ถ„์„ํ•˜๊ณ  ์ „๋žต์„ ์„ธ์šฐ๋Š” ์ผ์ด ์ฒ˜์Œ์ด๋‹ค ๋ณด๋‹ˆ ์–ด๋ ค์›€์ด ์žˆ์—ˆ๋‹ค.

๊ทธ๋ƒฅ ๊ตฌ๊ธ€ ์• ๋„๋ฆฌํ‹ฑ์Šค ๋ณด๊ณ ์„œ๋ฅผ ๋ถ„์„ํ•˜๋Š” ๊ฒƒ๊ณผ ๋‚ด๊ฐ€ ์ง์ ‘ ๋ฐ์ดํ„ฐ๋ฅผ ์›ํ•˜๋Š” ๋ฐฉ์‹์œผ๋กœ ์„ธํŒ…ํ•˜๊ณ  ๋ถ„์„ํ•˜๋Š” ๊ฒƒ์€ ํฐ ์ฐจ์ด๊ฐ€ ์žˆ๋‹ค๋Š” ๊ฑธ ๋А๊ผˆ๊ณ , ๋ณด๊ณ ์„œ ๋ถ„์„๋งŒ ์ž˜ํ•˜๋ฉด ๋˜๋Š” ๊ฒŒ ์•„๋‹ˆ๋ผ ์„ธํŒ…์„ ์–ด๋–ป๊ฒŒ ํ•ด์•ผ ๋ ์ง€ ๊ณ ๋ฏผํ•˜๊ณ  ๊ฒฐ์ •ํ•˜๋Š” ๊ฒƒ์ด ๋” ์–ด๋ ต๋‹ค๋Š” ๊ฒƒ์„ ์•Œ์•˜๋‹ค.

๋‚˜๋Š” ์ฃผ์ œ๋ฅผ '๊ตฌ๋งค ํ• ์ธ์ด ๊ณ ๊ฐ์—๊ฒŒ ๋ฏธ์น˜๋Š” ์˜ํ–ฅ'์œผ๋กœ ์žก๊ณ , ์†Œ๋น„์ž ๊ธฐ์ค€๊ณผ ์ง€์ถœ ๊ธˆ์•ก์ด๋ผ๋Š” ๊ฐ€์žฅ ์ ์€ ๋ฐ์ดํ„ฐ๋งŒ์„ ๊ฐ€์ง€๊ณ  ๋ถ„์„ํ–ˆ๋Š”๋ฐ ๋‹ค ํ•˜๊ณ  ๋ณด๋‹ˆ ์„ธํŒ… ์ž์ฒด๊ฐ€ ๋งŽ์ด ์•„์‰ฝ๊ณ  ๋ถ€์กฑํ–ˆ๋‹ค๋Š” ๊ฑธ ์•Œ์•˜๋‹ค.

๋˜ํ•œ ์„ธํŒ…๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ์‹œ๊ฐ์ ์œผ๋กœ๋„ ํ•œ๋ˆˆ์— ์•Œ์•„๋ณด๊ธฐ ์‰ฝ๊ฒŒ ํ–ˆ์–ด์•ผ ํ–ˆ๋Š”๋ฐ ๋‚˜์กฐ์ฐจ๋„ ๋ถˆํŽธํ–ˆ๋‹ค. 

 

๋Œ€ํ•™๊ต ์‹ค์Šต์œผ๋กœ ํ•œ ๋‹ฌ ๋™์•ˆ ๋‹ค๋…”๋˜ ํšŒ์‚ฌ์—์„œ ๋ฐ์ดํ„ฐ๋ฅผ ํ”ผ๋ฒ—ํ…Œ์ด๋ธ”๋กœ ๋งŒ๋“ค๊ณ  ๋ณด๊ณ ์„œ๋ฅผ ์ž‘์„ฑํ•˜๋Š” ์—…๋ฌด๋ฅผ ํ–ˆ๋‹ค.

๊ทธ ๋‹น์‹œ ์—…๋ฌด๋ฅผ ์ง€์‹œํ•œ ์ƒ์‚ฌ๊ฐ€ ๋ฐ์ดํ„ฐ๋ฅผ ์–ด๋–ค ์‹์œผ๋กœ ๊ตฌ์„ฑํ• ์ง€ ์„ธํŒ…ํ•ด์„œ ์•Œ๋ ค์ฃผ์—ˆ๋‹ค. ๋‚œ ๊ทธ๋Œ€๋กœ ์—‘์…€์— ๋ฐ˜์˜๋งŒ ํ–ˆ์„ ๋ฟ์ด์—ˆ๋‹ค.

์ง€๊ธˆ ์ƒ๊ฐํ•ด ๋ณด๋‹ˆ ์–ด๋–ค ๊ฒฐ๊ณผ๋ฅผ ๋ณด๊ณ  ์‹ถ์–ด์„œ ๊ทธ๋Ÿฐ ์„ธํŒ…์„ ํ–ˆ๋Š”์ง€, ์™œ ์ด๋Ÿฐ ๋ฐ์ดํ„ฐ๊ฐ€ ๋“ค์–ด๊ฐ€๋Š”์ง€ ๋“ฑ์— ๋Œ€ํ•œ ๊ถ๊ธˆ์ฆ๋„ ์—†์ด ์‹œํ‚ค๋Š” ์ผ๋งŒ ํ–ˆ๋˜ ๊ฒƒ ๊ฐ™๋‹ค.

์กฐ๊ธˆ ๋” ๊ด€์‹ฌ์„ ๊ฐ–๊ณ  ๋Šฅ๋™์ ์œผ๋กœ ํ–ˆ๋‹ค๋ฉด ํ˜„์žฌ์— ์กฐ๊ธˆ์ด๋ผ๋„ ๋„์›€์ด ๋˜์ง€ ์•Š์•˜์„๊นŒ ํ•˜๋Š” ์ƒ๊ฐ์ด ๋“ ๋‹ค.

๊ทธ๋ฆฌ๊ณ  ์–ด๋–ค ์‹์œผ๋กœ ์„ธํŒ…์„ ํ• ์ง€ ๋ฐ์ดํ„ฐ๋ฅผ ๋ณด๊ณ  ๋ฏธ๋ฆฌ ํ™•์‹คํžˆ ์ •ํ•ด๋‘๊ณ  ์ง„ํ–‰ํ•ด์•ผ ๋œ๋‹ค๋Š” ๊ฑธ ์•Œ์•˜๋‹ค. ์˜ค๋Š˜์˜ ๋‚œ ์ด๋Ÿฐ ๋ฐ์ดํ„ฐ๋„ ํ•ด๋ณด๊ณ  ์ €๋Ÿฐ ๋ฐ์ดํ„ฐ๋„ ํ•ด๋ณด๋‹ค๊ฐ€ ์ ์  ์ค‘์‹ฌ์—์„œ ๋ฒ—์–ด๋‚˜๋Š” ๋А๋‚Œ์ด ๋งŽ์ด ๋“ค์—ˆ๋‹ค.

 

์•„๋ฌดํŠผ ์˜ค๋Š˜ ์ฒ˜์Œ์œผ๋กœ ์ง์ ‘ ์„ธํŒ…ํ•˜๊ณ  ๋ถ„์„ํ•˜๊ณ  ์ „๋žต์„ ์„ธ์›Œ๋ณด์•˜์œผ๋‹ˆ ๋‹ค์Œ์—๋Š” ๋ณด์™„ํ•  ์ ์„ ๋” ๋ณด์™„ํ•ด์„œ ์ง„์งœ ๊ฐ™์€ ๋ถ„์„์„ ํ•ด๋ณด๊ณ  ์‹ถ๋‹ค. ๊ทธ๋ฆฌ๊ณ  ์˜ค๋Š˜์€ ์—‘์…€๋กœ ๊ธฐ๋ณธ์ ์ธ ๋ถ„์„์„ ์—ฐ์Šตํ–ˆ์ง€๋งŒ, ๋‹ค์Œ์—๋Š” sql๊ณผ ํŒŒ์ด์ฌ์„ ํ™œ์šฉํ•œ ๋ถ„์„๋„ ํ•ด๋ณด๊ณ  ์‹ถ๋‹ค.