- ๋ชจ๋ธ ์ ์ ์ด์
- Input & Output
- ๋ชจ๋ธ ์ค๋ช
- ๋ชจ๋ธ ์ ์ ์ด์
- Input & Output
- ๋ชจ๋ธ ์ค๋ช
1. Rule Based Model ๐ ์์ธ์ค๋ช
์ ํฌ๊ฐ ๊ฐ๊ณ ์๋ ๋ฐ์ดํฐ๋ ์๋์ ์ผ๋ก sparsity๊ฐ ๋์์ต๋๋ค.
๋ฐ๋ผ์, ๋จธ์ ๋ฌ๋ ํน์ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ์ ์ฉํ๋๋ผ๋ ํ์ตํ ์ํธ์์ฉ ๋ฐ์ดํฐ๊ฐ ๋ถ์กฑํ๊ธฐ ๋๋ฌธ์ ์ข์ ์ฑ๋ฅ์ ๋ด์ง ๋ชปํ์ต๋๋ค.
๊ฒฐ๊ณผ์ ์ผ๋ก ์ ํฌ ํ์ ์์ ์ ์ธ ์ฑ๋ฅ์ ๋ณด์ฅํ๋ Rule-Based Model์ ์ฌ์ฉํ๊ธฐ๋ก ๊ฒฐ์ ํ์ต๋๋ค.
Input : ์์ดํ
ID
Output : ๋๋ถ๋ฅ ๋ณ ์ถ์ฒ ์์ดํ
(์ต๋ 10๊ฐ)
๋ชจ๋ธ์ ์๋ ๋ฐฉ์์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
1. ์์ดํ
ID๋ฅผ ์
๋ ฅ ๋ฐ๋๋ค
2. ์์ดํ
์ด ์ํ ์์ดํ
ํด๋ฌ์คํฐ (๋์ผํ ์๊ณผ ์ค๋ถ๋ฅ๋ฅผ ๊ฐ๋ ์์ดํ
์ ์งํฉ)์ ์ฐพ๋๋ค
3. ํด๋น ํด๋ฌ์คํฐ์ ์ํธ์์ฉํ ํด๋ฌ์คํฐ๋ค๊ณผ ํฌํจ๋์ด ์๋ ์์ดํ
์ ์ถ์ฒ ํ๋ณด ์งํฉ์ ๋ฃ๋๋ค
4. ์ถ์ฒ ํ๋ณด ์์ดํ
๋ค์ Light-GCN์ ์ํธ์์ฉ ๊ฒฐ๊ณผ๊ฐ์ด ๋์ ์์๋ก ์ ๋ ฌํ ํ, Top 10๊ฐ๋ฅผ ์ถ์ฒํ๋ค
* ํ์ํ ๋ฐ์ดํฐ
ํด๋ฌ์คํฐ ์ฌ์ด ์ํธ์์ฉ ์ฌ๋ถ๋ฅผ ๋ด๊ณ ์๋ ํด๋ฌ์คํฐ ์ํธ์์ฉ ํ๋ ฌ
2. Light-GCN ๐ ์์ธ์ค๋ช
1. Data Crawling Method
: ์ ํฌ ํ์ 1์ฐจ์ ์ผ๋ก ์ฝ๋์ ์ฝ๋์ ํฌํจ๋ ์์ดํ
์ ํฌ๋กค๋ง ํ ํ, ํฌ๋กค๋ง๋ ์์ดํ
์ด ํฌํจ๋์ด ์๋ ๋ค๋ฅธ
์ฝ๋์ ํฌํจ๋์ด ์๋ ์์ดํ
๋ค์ ๋ค์ ๋ฐ๋ณตํด์ ํฌ๋กค๋ง ํ์ต๋๋ค. ๊ฒฐ๊ณผ์ ์ผ๋ก ์๋ ์ฌ์ง๊ณผ ๊ฐ์ด ๋ชจ๋ ์์ดํ
๋ค์
์ฝ๋๋ก ์ฐ๊ฒฐ๋์ด ์๋ ํ ์์ดํ
์ด ์ต์ 1๊ฐ ์ด์ ๊ฐ๊ณ ์์ต๋๋ค.
๋ชจ๋ ์์ดํ
์ด ์๋ก ๋์ด์ง์ง ์๊ณ ์ฐ๊ฒฐ๋์ด ์๋ ๊ทธ๋ํ ๊ตฌ์กฐ๊ฐ ๋ณด์ฅ๋์ด ์๊ธฐ ๋๋ฌธ์, ์ด๋ฅผ ํ์ฉํ ์ ์๋
๊ทธ๋ํ ๊ณ์ด ๋ชจ๋ธ์ ์ฌ์ฉํ๋ ๊ฒ์ด ํจ๊ณผ์ ์ด๋ผ๊ณ ์๊ฐํ์ต๋๋ค.
2. Data Sparsity
: ์ต๋ํ ์๋ก ์ํธ์์ฉํ ์์ดํ
์ด ๋ง์ด ํฌํจ๋๋๋ก ํฌ๋กค๋ง ํ์์๋ ๋ถ๊ตฌํ๊ณ , ์์ดํ
์ํธ์์ฉ ํ๋ ฌ
sparsity์ด ๋๋ฌด ๋์์ต๋๋ค. ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ์์ดํ
๋ค์ ํด๋ฌ์คํฐ๋ก ๋ฌถ์ด์ ์ํธ์์ฉ ํ๋ ฌ์ ๋ง๋ค์์์๋,
๋ชจ๋ธ ์ฑ๋ฅ์ ์ถฉ๋ถํ ๋์ด๊ธฐ์ ์ฌ์ ํ ๋ฐ์ดํฐ๊ฐ ๋๋ฌด sparseํ ๊ฒ์ ๋ฐ๊ฒฌํ์ต๋๋ค.
์ด๋ฌํ sparsity๋ฅผ ๋ณด์ํ๊ธฐ ์ํด ์ง์ ์ํธ์์ฉํ ์์ดํ
๋ฟ๋ง ์๋๋ผ, ์ฐ๊ฒฐ ๊ด๊ณ๋ฅผ ํ๊ณ ๋ค์ด๊ฐ์ ๋ ๋ง์
์ ๋ณด๋ฅผ ๊ณ ๋ คํ์ฌ ์์ธกํ๋ ๊ทธ๋ํ ๊ณ์ด ๋ชจ๋ธ์ด ์ ํฉํ๋ค๊ณ ํ๋จํ์ต๋๋ค.
3. Inference Speed
: ๊ทธ๋ํ ๊ณ์ด ๋ชจ๋ธ ์ค์์ Light-GCN์ ์ ํํ ์ด์ ๋, ๋ชจ๋ธ ์์ธก ์๋๊ฐ ๊ฐ์ฅ ๋น ๋ฅด๊ธฐ ๋๋ฌธ์
๋๋ค. ๋ชจ๋ธ์ด
๊ฒฐ๊ณผ๋ฅผ ์ฐ์ถํ๋ ๊ณผ์ ์ด ๋๋ฆฌ๋ค๋ฉด, ์๋น์ค ๋ฐฐํฌ์ ์ฅ์ ๋ฌผ์ด ๋ ์๋ ์๊ธฐ ๋๋ฌธ์ ์๋์ ์ผ๋ก ๋น ๋ฅธ ๋ชจ๋ธ์
์ ํํ์ต๋๋ค.
Input : ํด๋ฌ์คํฐ์ ์์ดํ
Output : ํด๋ฌ์คํฐ์ ์์ดํ
์ด ์ํธ์์ฉํ ํ๋ฅ
Light-GCN์ ์๋ ์ ์ ์ ์์ดํ
์ ์ํธ์์ฉ ๊ทธ๋ํ๋ฅผ ํ์ตํ์ฌ, ํน์ ์ ์ ์ ์์ดํ
์ด ์ฃผ์ด์ก์ ๋, ๋์ด
์ํธ์์ฉํ ํ๋ฅ ์ ๊ณ์ฐํฉ๋๋ค. ์ ํฌ ํ์ ๊ฐ๊ณ ์๋ ๋ฐ์ดํฐ์ ๋ง๊ฒ ์ ์ ์ ์์ดํ
๋
ธ๋๋ฅผ ํด๋ฌ์คํฐ์ ์์ดํ
๋
ธ๋๋ก ์นํํด์ ์ฌ์ฉํ์ต๋๋ค. ๋ค์์ ํ์ต ๋ฐ์ดํฐ ๊ทธ๋ํ๋ฅผ ์๊ฐํํ ๊ทธ๋ฆผ์
๋๋ค. ํฐ ์์ ํด๋ฌ์คํฐ, ์์ ์์
์์ดํ
์
๋๋ค.
ํ์ต ๊ณผ์
1. Data
Light-GCN์ (ํด๋ฌ์คํฐ - ์์ดํ
) ์์ ์
๋ ฅํ๊ณ , ์ํธ์์ฉ label์ ์์ธกํ๋๋ก ํ์ต์ํต๋๋ค. ์ค์ ๋ก ์ํธ์์ฉํ
ํด๋ฌ์คํฐ - ์์ดํ
์๋ฟ๋ง ์๋๋ผ, ์ํธ์์ฉ ํ์ง ์์ ์๋ ๋ฌด์์๋ก negative sampling ํ์ฌ ๋์ผํ ๊ฐ์๋ฅผ
ํ์ต์ํต๋๋ค.
2. Model Structure
Light-GCN์ ํด๋ฌ์คํฐ์ ์์ดํ
์ ์
๋ ฅ ๋ฐ์ ํ, ์ง์ ํ ๊น์ด๋งํผ ์ฐ๊ฒฐ๋ ๋
ธ๋๋ฅผ ๋ฐ๋ผ๊ฐ๋ฉด์ ์ ๋ณด๋ฅผ ์์งํฉ๋๋ค.
๊ฐ๊น์ด ๋
ธ๋์ผ ์๋ก ๋ ๋ง์ ๊ฐ์ค์น๋ฅผ ๋ฌ์ ๋ชจ๋ ์ ๋ณด๋ฅผ ์์ถ์์ผ ์ต์ข
์ํธ์์ฉ ํ๋ฅ ๊ฐ์ ๊ณ์ฐํฉ๋๋ค. ๋
ผ๋ฌธ์
๋์จ ๋ชจ๋ธ ๊ตฌ์กฐ ์ด๋ฏธ์ง๋ ์๋ ์ฒจ๋ถํ์ต๋๋ค.
3. Inference
๋ชจ๋ ํ์ต์ด ์๋ฃ๋ ํ, ํน์ ํด๋ฌ์คํฐ์ ์์ดํ
์ ์
๋ ฅํ๊ฒ ๋๋ฉด ๋์ด ์ํธ์์ฉํ ํ๋ฅ ์ ๊ณ์ฐํฉ๋๋ค.
๋ค์์ ๋ชจ๋ธ ์ ๋ ฅ๋ถํฐ ์ถ๋ ฅ๊น์ง๋ฅผ ์๊ฐํํ ๊ฒ์ ๋๋ค.