- Source of questions: Seongyun Byeon
- ํต๊ณ ๋ฐ ์ํ
- ๋ถ์ ์ผ๋ฐ
- ๋จธ์ ๋ฌ๋
- ๋ฅ๋ฌ๋
- ์ถ์ฒ ์์คํ
- ๋ฐ์ดํฐ๋ฒ ์ด์ค
- ๋ฐ์ดํฐ ์๊ฐํ
- ๋ ๊ณ ๊ฐ ์ฌ์ด๋
- ๊ฐ์ธ์ ๋ณด
- ๊ณ ์ ๊ฐ(eigen value)์ ๊ณ ์ ๋ฒกํฐ(eigen vector)์ ๋ํด ์ค๋ช ํด์ฃผ์ธ์. ๊ทธ๋ฆฌ๊ณ ์ ์ค์ํ ๊น์?
- ์ํ๋ง(Sampling)๊ณผ ๋ฆฌ์ํ๋ง(Resampling)์ ๋ํด ์ค๋ช
ํด์ฃผ์ธ์. ๋ฆฌ์ํ๋ง์ ๋ฌด์จ ์ฅ์ ์ด ์์๊น์?
- sampling: ๋จ์ ๋ฌด์์, ๊ณํต, ์ธตํ, ๊ตฐ์ง ์ถ์ถ ๋ฑ
- resampling: bootstrap, cross-validation ๋ฑ. ์ํ์ ํต๊ณ๋์ ์ ๋ฐ๋๋ฅผ ์ธก์ ํ๊ฑฐ๋ ์ํ์ ์์์ ๋ถ๋ถ ์งํฉ์ ์ด์ฉํ์ฌ ๋ชจ๋ธ์ ๊ฒ์ฆํจ
- ํ๋ฅ ๋ชจํ๊ณผ ํ๋ฅ ๋ณ์๋ ๋ฌด์์ผ๊น์?
- ํ๋ฅ ๋ณ์: ์ ์์ญ์ด ํ๋ณธ ๊ณต๊ฐ์ธ ํจ์. [ref]
- ํ๋ฅ ๋ชจํ: ๋ฐ์ดํฐ์ ๋ถํฌ๋ฅผ ๊ทผ์ฌํ๋ ๋ชจํ
- ๋์ ๋ถํฌ ํจ์์ ํ๋ฅ ๋ฐ๋ ํจ์๋ ๋ฌด์์ผ๊น์? ์์๊ณผ ํจ๊ป ํํํด์ฃผ์ธ์
- ๋ฒ ๋ฅด๋์ด ๋ถํฌ / ์ดํญ ๋ถํฌ / ์นดํ ๊ณ ๋ฆฌ ๋ถํฌ / ๋คํญ ๋ถํฌ / ๊ฐ์ฐ์์ ์ ๊ท ๋ถํฌ / t ๋ถํฌ / ์นด์ด์ ๊ณฑ ๋ถํฌ / F ๋ถํฌ / ๋ฒ ํ ๋ถํฌ / ๊ฐ๋ง ๋ถํฌ / ๋๋ฆฌํด๋ ๋ถํฌ์ ๋ํด ์ค๋ช ํด์ฃผ์ธ์. ํน์ ์ฐ๊ด๋ ๋ถํฌ๊ฐ ์๋ค๋ฉด ์ฐ๊ด ๊ด๊ณ๋ฅผ ์ค๋ช ํด์ฃผ์ธ์
- ์กฐ๊ฑด๋ถ ํ๋ฅ ์ ๋ฌด์์ผ๊น์?
- ๊ณต๋ถ์ฐ๊ณผ ์๊ด๊ณ์๋ ๋ฌด์์ผ๊น์? ์์๊ณผ ํจ๊ป ํํํด์ฃผ์ธ์
- ์ ๋ขฐ ๊ตฌ๊ฐ์ ์ ์๋ ๋ฌด์์ธ๊ฐ์?
- p-value๋ฅผ ๊ณ ๊ฐ์๊ฒ๋ ๋ญ๋ผ๊ณ ์ค๋ช
ํ๋๊ฒ ์ดํดํ๊ธฐ ํธํ ๊น์?
- ๋จผ์ ์ด๋ ํ ๋ช ์ ์ ์ฌ์ค ์ฌ๋ถ๋ฅผ ํ๋จํ๊ธฐ ์ํด ๊ฐ์ค(๊ท๋ฌด๊ฐ์ค๊ณผ ๋๋ฆฝ๊ฐ์ค)์ ์ค์
- ํต๊ณ์ ๊ฒ์ ์ ์ ๋ฏธ๋ฆฌ ์ ์์์ค์ ์ค์ ํจ. ํต์์ ์ผ๋ก 5%
- ํต๊ณ์ ๊ฒ์ ์ผ๋ก ํต๊ณ๋๊ณผ ์ ์ํ๋ฅ ์ ์ป์
- ์ ์ํ๋ฅ ์ด ์ ์์์ค๋ณด๋ค ์์ผ๋ฉด ๊ท๋ฌด๊ฐ์ค์ ๊ธฐ๊ฐํ๊ณ ๋๋ฆฝ๊ฐ์ค์ ์ฑํํจ
- p-value๋ ์์ฆ ์๋์๋ ์ฌ์ ํ ์ ํจํ ๊น์? ์ธ์ p-value๊ฐ ์ค์ ๋ฅผ ํธ๋ํ๋ ๊ฒฝํฅ์ด ์์๊น์?
- [ref]
- [ref1]
- p-value๊ฐ ์ ์์์ค๋ณด๋ค ์์ผ๋ฉด ๊ท๋ฌด๊ฐ์ค์ ๊ธฐ๊ฐํ๋ค. ์ ์์์ค์ ์ผ์ข ์ threshold๋ก๋ง ๊ธฐ๋ฅํ๋ฉฐ p-value์ ๋์์ ๋ํด ํด์์ ์ฌ์ง๋ ์๋ค
- ์๋ฅผ ๋ค์ด ์ ์์์ค 0.05์์ p-value๊ฐ 0.01์ด๋ 0.001์ด๋ ๊ท๋ฌด๊ฐ์ค์ ๊ธฐ๊ฐํ ๋ฟ, ์์ ์ค ์ด๋ ๊ฒ์ด ๋ ํ์คํ๊ฒ ํน์ ๊ฐํ๊ฒ ๊ธฐ๊ฐํ๋ค๊ณ ๋งํ ์ ์๋ค
- ๋ฐ๋๋ก ์ ์์์ค 0.05์์ p-value๊ฐ 0.7์ด๋ 0.051์ด๋ ๋๊ฐ์ด ๊ท๋ฌด๊ฐ์ค์ ๊ธฐ๊ฐํ ์ ์๋ค. ์๋ฌด๋ฆฌ ์ ์์์ค์ ๊ฐ๊น๋๋ผ๋ ์ ์์์ค์ ์ด๊ณผํ๋ ์๊ฐ ํ์์ ์ฌ์ง๋ ์๋ค
- ๊ทธ๋ฌ๋ ์ฌ์ง์ด ํ์ ์ ์ธ ๊ธ์์์กฐ์ฐจ ์ด๋ฅผ ๊ต๋ฌํ ํธ๋ํ๋ ํํ์ ์ฌ์ฉํ๋ค
- A/B Test ๋ฑ ํ์ ๋ถ์ ๋ฐ ์คํ ์ค๊ณ ์ ํต๊ณ์ ์ผ๋ก ์ ์๋ฏธํจ์ ์ฌ๋ถ๋ฅผ ๊ฒฐ์ ํ๊ธฐ ์ํ ๋ฐฉ๋ฒ์๋ ์ด๋ค ๊ฒ์ด ์์๊น์?
- R square์ ์๋ฏธ๋ ๋ฌด์์ธ๊ฐ์?
- ํ๊ท (mean)๊ณผ ์ค์๊ฐ(median)์ค์ ์ด๋ค ์ผ์ด์ค์์ ๋ญ๋ฅผ ์จ์ผํ ๊น์?
- ๋ฐ์ดํฐ์ ์ด์์น๊ฐ ์์ ๋, ๊ทธ ์ด์์น์ ์ํด ํ๊ท ์ด ์๊ณก๋ ์ ์์. ์ด๋ฅผ ํผํ๋ฉด์ ํ ์ํ์ ๋ํฏ๊ฐ์ ์ป๊ณ ์ ํ๋ค๋ฉด, ์ค์๊ฐ์ ์ฌ์ฉํ๋ ๊ฒ ๋ฐ๋์งํจ
- ์ค์ฌ๊ทนํ์ ๋ฆฌ๋ ์ ์ ์ฉํ๊ฑธ๊น์?
- ํ๋ณธ์ ํฌ๊ธฐ๊ฐ ์ปค์ง์๋ก ํ๋ณธ์ ๋ถํฌ๋ ์ ๊ท๋ถํฌ๋ฅผ ๋ฐ๋ฆ. ๋ฐ๋ผ์ ํ๋ณธ์ด ์ถฉ๋ถํ ํฌ๋ค๋ฉด ๊ทธ ๋ถํฌ๋ฅผ ์ ๊ท๋ถํฌ๋ก ๊ฐ์ฃผํ๊ณ ๋ถ์์ ์งํํ ์ ์์
- ์ํธ๋กํผ(entropy)์ ๋ํด ์ค๋ช
ํด์ฃผ์ธ์. ๊ฐ๋ฅํ๋ฉด Information Gain๋์.
-
- ์ํธ๋กํผ๊ฐ ํด์๋ก ๋ถ๊ธฐ๋ ๋ ๊ทธ๋ฃน์ ๋ถํฌ๊ฐ ์ ์ฌํจ. ์ฆ ๋ถ๊ธฐ ๊ธฐ์ค์ด ํจ๊ณผ์ ์ด์ง ๋ชปํ๊ณ ๋ถ์๋(impurity)๊ฐ ํฌ๋ค๊ณ ํ ์ ์์
- Information gain์ ํ ๋ถ๊ธฐ ์คํ ์์ ๋ถ์๋์ ๊ฐ์๋
- tree-based ์๊ณ ๋ฆฌ์ฆ์ ๋ถ์๋๊ฐ ๊ฐ์ฅ ํฌ๊ฒ ๊ฐ์ํ๋ ์ฆ Information gain์ด ๊ฐ์ฅ ํฐ ๋ถ๊ธฐ ๊ธฐ์ค์ ์ฐพ์ ์ด๋ฅผ ๊ทผ๊ฑฐ๋ก ๋ถ๋ชจ ๋ ธ๋๋ฅผ ์์ ๋ ธ๋๋ก ๋๋
-
- ์์ฆ๊ฐ์ ๋น
๋ฐ์ดํฐ(?)์๋์๋ ์ ๊ท์ฑ ํ
์คํธ๊ฐ ์๋ฏธ ์๋ค๋ ์ฃผ์ฅ์ด ์์ต๋๋ค. ๋ง์๊น์?
- ํต๊ณ์ ๋ชจ๋ธ๋ง์ ๋ชฉ์ : ๋ถํฌ๋ฅผ ๊ฐ์ ํ์ฌ ์ ์ ์์ ์ํ๋ก ๋ชจ์๋ฅผ ์ถ์
- ๋น ๋ฐ์ดํฐ, ๋จธ์ ๋ฌ๋: estimation < prediction. ํต๊ณ์ ์ ์์ฑ๋ณด๋ค๋ ๋ชจ๋ธ์ ์ฑ๋ฅ(์ ํ๋, ์ค์ฐจ ๋ฑ)์ ์ฃผ๋ชฉ. ๋์ ์ฑ๋ฅ์ ๋ชจ๋ธ๋ก ๋น์ฆ๋์ค์ ๋ชฉํ๋ฅผ ๋ฌ์ฑํ๊ณ ์ ํจ
- ๋น ๋ฐ์ดํฐ์ ๋ํด์๋ ์ ๊ท์ฑ ํ ์คํธ๊ฐ ํ์ ์์ ์ ์์. ํ์ง๋ง ๋ถ์ํ๋ ค๋ ๋ฐ์ดํฐ๊ฐ ๋น ๋ฐ์ดํฐ์ธ์ง ๋จผ์ ์ดํด์ผ ํจ
- ์ถฉ๋ถํ ํฐ์ง, ๋ชจ์ง๋จ์ ๋ํํ๋์ง, ์ค์ผ์ ์๋์ง ๋ฑ
- garbage in, garbage out
- ์ด๋จ ๋ ๋ชจ์์ ๋ฐฉ๋ฒ๋ก ์ ์ธ ์ ์๊ณ , ์ด๋จ ๋ ๋น๋ชจ์์ ๋ฐฉ๋ฒ๋ก ์ ์ธ ์ ์๋์?
- ๋น๋ชจ์์ ๋ฐฉ๋ฒ๋ก : ์ํ ํฌ๊ธฐ๊ฐ ์๊ณ ์ํ์ ๋ถํฌ๋ฅผ ๊ฐ์ ํ๊ธฐ ์ด๋ ค์ธ ๋
- ๋น๋, ๋ถํธ, ์์ ๋ฑ์ ์ฌ์ฉํ๋ฏ๋ก ์ด์์น์ ์ํฅ์ ๋ ๋ฐ์
- โlikelihoodโ์ โprobabilityโ์ ์ฐจ์ด๋ ๋ฌด์์ผ๊น์?
- ์ฐ์ ํ๋ฅ ๋ณ์์์
- probability: pdf์ ์ ์ ๋ถ ๊ฐ
- likelihood: pdf์ ํจ์ซ๊ฐ
- ํต๊ณ์์ ์ฌ์ฉ๋๋ bootstrap์ ์๋ฏธ๋ ๋ฌด์์ธ๊ฐ์.
- ๋ณต์ ์ถ์ถ์ ๋งค์ฐ ๋ง์ด ์ํํ์์ ๋ ์ด๋ค ์ํ์ด ํ ๋ฒ๋ ์ถ์ถ๋์ง ์์ ํ๋ฅ ์ ์ฝ 36.79%๋ก ์๋ ดํจ
- ๋ฐ๋ผ์ ์ด๋ค ํ๋ณธ(ํ๋ณธ์ง๋จ)์ ๋ ๊ทธ๋ฃน์ผ๋ก ๋๋ ์ ์์. ๋๋ถ์ด ๋งค ์ํ๋ง๋ค ๊ทธ๋ฃน์ ๊ตฌ์ฑ์ด ๋ฌ๋ผ์ง
- ์ด๋ฅผ ํ์ต์ ์ ์ฉํ์ฌ ํ์ ๋ ์ํ๋ก ๋ค์์ ๋ถ๋ฅ๊ธฐ๋ฅผ ์์ฑํ๋ ๊ธฐ๋ฒ์ด bagging
- ๋ชจ์(population)๊ฐ ๋งค์ฐ ์ ์ (์์ญ๊ฐ ์ดํ) ์ผ์ด์ค์ ๊ฒฝ์ฐ ์ด๋ค ๋ฐฉ์์ผ๋ก ์์ธก ๋ชจ๋ธ์ ์๋ฆฝํ ์ ์์๊น์?
- overfitting ๋ฐฉ์ง: ๋จ์ํ ๋ชจ๋ธ ์ฑํ ๋ฐ ๋ณด์์ ์ธ ์ ์ฉ, regularization ์ฌ์ฉ
- outliers ๊ด๋ฆฌ
- over-sampling
- voting: ์ฌ๋ฌ ๋จ์ผ ๋ชจ๋ธ์ ๊ฒฐ๊ณผ๋ฅผ voting
- ๋ฒ ์ด์ง์๊ณผ ํ๋ฆฌํํฐ์คํธ๊ฐ์ ์
์ฅ์ฐจ์ด๋ฅผ ์ค๋ช
ํด์ฃผ์ค ์ ์๋์?
- [ref]
- frequentist: ํ๋ณธ์ด ๋ชจ์ง๋จ๊ณผ ๋์งํ ๊ฒ์ด๋ผ๋ ๊ฐ์ . ๋ฐ๋ผ์ (ํ๋ฅ ํ๋ฅผ ํตํด ์ถ์ถ๋) ํ๋ณธ์ ํฌ๊ธฐ๊ฐ ํด์๋ก ๋ชจ์ง๋จ์ ์ ํํํจ. ์๋ก์ด ๊ด์ธก๊ฐ์ด ํ๋ณธ์ ํตํด ์ถ์ ํ ๋ถํฌ์ ์ผ๋ง๋ ์ ๋ถํฉํ๋์ง ํ์ธ
- bayesian: ์ฌ์ ๋ถํฌ๋ฅผ ๊ฐ์ ํ๊ณ ์๋ก์ด ๊ด์ธก๊ฐ์ ๋ฐ์ํด ๋ฒ ์ด์ฆ ์ ๋ฆฌ๋ก ์ฌํ๋ถํฌ๋ฅผ ๊ตฌํ๋ฉฐ ๋ชจ์๋ฅผ ์ถ์
- ๊ฒ์ ๋ ฅ(statistical power)์ ๋ฌด์์ผ๊น์?
- ๊ท๋ฌด๊ฐ์ค์ด ๊ฑฐ์ง์ผ ๋ ๋๋ฆฝ๊ฐ์ค์ ์ฑํํ ํ๋ฅ
- missing value๊ฐ ์์ ๊ฒฝ์ฐ ์ฑ์์ผ ํ ๊น์? ๊ทธ ์ด์ ๋ ๋ฌด์์ธ๊ฐ์?
- ์ด๋ค ๊ฐ์ผ๋ก๋ ์ฑ์์ผ ํจ. ๋ณ์๊ฐ์ด ํ๋๋ผ๋ ๋น์ด ์์ผ๋ฉด ๋ชจ๋ธ์ด ํ์ต ๋ฐ inferenceํ ์ ์๋ค
- ์์๋ผ์ด์ด์ ํ๋จํ๋ ๊ธฐ์ค์ ๋ฌด์์ธ๊ฐ์?
- ๋ฐ์ค ํ๋กฏ(์ฌ๋ถ์์): max, min์ ๋ฒ์ด๋๋ฉด ์์๋ผ์ด์ด๋ก ํ๋จ
- ์๊ฐํ, ๋งํ ๋ผ๋ ธ๋น์ค ๊ฑฐ๋ฆฌ
- ESD(3-sigma), ๊ธฐํํ๊ท ยฑ (2.5-sigma), Z-score
- ์ฝ์ผํฐ ํตํ ์ง์ ์๊ฐ์ ๋ํ ๋ฐ์ดํฐ๊ฐ ์กด์ฌํฉ๋๋ค. ์ด ๋ฐ์ดํฐ๋ฅผ ์ฝ๋ํํ๊ณ ๋ถ์ํ๋ ๋ฐฉ๋ฒ์ ๋ํ ๊ณํ์ ์ธ์์ฃผ์ธ์. ์ด ๊ธฐ๊ฐ์ ๋ถํฌ๊ฐ ์ด๋ป๊ฒ ๋ณด์ผ์ง์ ๋ํ ์๋๋ฆฌ์ค๋ฅผ ์ค๋ช ํด์ฃผ์ธ์
- ์ถ์ฅ์ ์ํด ๋นํ๊ธฐ๋ฅผ ํ๋ ค๊ณ ํฉ๋๋ค. ๋น์ ์ ์ฐ์ฐ์ ๊ฐ์ ธ๊ฐ์ผ ํ๋์ง ์๊ณ ์ถ์ด ์ถ์ฅ์ง์ ์ฌ๋ ์น๊ตฌ 3๋ช ์๊ฒ ๋ฌด์์๋ก ์ ํ๋ฅผ ํ๊ณ ๋น๊ฐ ์ค๋ ๊ฒฝ์ฐ๋ฅผ ๋ ๋ฆฝ์ ์ผ๋ก ์ง๋ฌธํด์ฃผ์ธ์. ๊ฐ ์น๊ตฌ๋ 2/3๋ก ์ง์ค์ ๋งํ๊ณ 1/3์ผ๋ก ๊ฑฐ์ง์ ๋งํฉ๋๋ค. 3๋ช ์ ์น๊ตฌ๊ฐ ๋ชจ๋ "๊ทธ๋ ์ต๋๋ค. ๋น๊ฐ ๋ด๋ฆฌ๊ณ ์์ต๋๋ค"๋ผ๊ณ ๋งํ์ต๋๋ค. ์ค์ ๋ก ๋น๊ฐ ๋ด๋ฆด ํ๋ฅ ์ ์ผ๋ง์ ๋๊น?
- ํ์ํ ํ๋ณธ์ ํฌ๊ธฐ๋ฅผ ์ด๋ป๊ฒ ๊ณ์ฐํฉ๋๊น?
- [ref]
- Z: z-score, p: population proportion, epsilone: margin of error
-
- Bias๋ฅผ ํต์ ํ๋ ๋ฐฉ๋ฒ์ ๋ฌด์์ ๋๊น?
- ๋ก๊ทธ ํจ์๋ ์ด๋ค ๊ฒฝ์ฐ ์ ์ฉํฉ๋๊น? ์ฌ๋ก๋ฅผ ๋ค์ด ์ค๋ช
ํด์ฃผ์ธ์
- ์ฐ๋ํจ์: ๋ก๊ทธ ์ฐ๋ํจ์๋ฅผ ์ฌ์ฉํ๋ฉด ๊ฐ ํญ์ ๊ณฑ์ ์ ๋ง์ ์ผ๋ก ์ฒ๋ฆฌํ ์ ์์
- ์ฐ์ธก ํธํฌ(์ค๋ฅธํธ ๊ผฌ๋ฆฌ ๋ถํฌ): ๋ก๊ทธ ํจ์๋ฅผ ์ ์ฉํ์ฌ ๋์นญํ ๋ถํฌ๋ก ๋ณํ
- ์ค์ผ์ผ์ ์ค์ด๋ ๋ฐ ์ฌ์ฉ
- ์ข์ feature๋ ๋ฌด์์ธ๊ฐ์. ์ด feature์ ์ฑ๋ฅ์ ํ๋จํ๊ธฐ ์ํ ๋ฐฉ๋ฒ์๋ ์ด๋ค ๊ฒ์ด ์๋์?
- ํ๊ท: t-test ๊ฒฐ๊ณผ p-value๊ฐ ๋ฎ์ features
- ๋ถ๋ฅ: feature importance๊ฐ ํฐ features
- coefficients, feature importances๋ฅผ ์ฌ์ฉํจ
- "์๊ด๊ด๊ณ๋ ์ธ๊ณผ๊ด๊ณ๋ฅผ ์๋ฏธํ์ง ์๋๋ค"๋ผ๋ ๋ง์ด ์์ต๋๋ค. ์ค๋ช
ํด์ฃผ์ค ์ ์๋์?
- ์ฌ๋ฆ์๋ ์์ด์คํฌ๋ฆผ์ด ๋ง์ด ํ๋ฆฐ๋ค
- ๋๋ถ์ด ์ฌ๋ฆ์๋ ์ต์ฌ์ฌ๊ณ ๊ฐ ๋์ด๋๋ค
- ์ฌ๋ฆ ์ค ํน์ ๊ธฐ๊ฐ์ ์์ด์คํฌ๋ฆผ ํ๋งค๋๊ณผ ์ต์ฌ์ฌ๊ณ ๊ฑด์๋ฅผ ์กฐ์ฌํ๋ฉด ์์ ์๊ด๊ด๊ณ๋ฅผ ๋ณด์ผ ์ ์๋ค
- ๊ทธ๋ฌ๋ ์ด๋ ์๊ด๊ด๊ณ์ผ๋ฟ ์ธ๊ณผ๊ด๊ณ๋ฅผ ์๋ฏธํ์ง ์๋๋ค. ์์ด์คํฌ๋ฆผ ํ๋งค๊ฐ ์ต์ฌ์ฌ๊ณ ๋ฅผ ์ ๋ฐํ๋ค๊ณ ๋งํ ์ ์๋ค
- A/B ํ ์คํธ์ ์ฅ์ ๊ณผ ๋จ์ , ๊ทธ๋ฆฌ๊ณ ๋จ์ ์ ๊ฒฝ์ฐ ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํ ๋ฐฉ์์๋ ์ด๋ค ๊ฒ์ด ์๋์?
- ๊ฐ ๊ณ ๊ฐ์ ์น ํ๋์ ๋ํ์ฌ ์ค์๊ฐ์ผ๋ก ์ํธ์์ฉ์ด ๊ฐ๋ฅํ๋ค๊ณ ํ ๋์, ์ด์ ์ ์ฉ ๊ฐ๋ฅํ ๊ณ ๊ฐ ํ๋ ๋ฐ ๋ชจ๋ธ์ ๊ดํ ์ด๋ก ์ ์์๋ด ์๋ค.
- ๊ณ ๊ฐ์ด ์ํ๋ ์์ธก๋ชจํ์ ๋๊ฐ์ง ์ข ๋ฅ๋ก ๋ง๋ค์๋ค. ํ๋๋ ์์ธก๋ ฅ์ด ๋ฐ์ด๋์ง๋ง ์ ๊ทธ๋ ๊ฒ ์์ธกํ๋์ง๋ฅผ ์ค๋ช ํ๊ธฐ ์ด๋ ค์ด random forest ๋ชจํ์ด๊ณ , ๋๋ค๋ฅธ ํ๋๋ ์์ธก๋ ฅ์ ๋ค์ ๋จ์ด์ง๋ ๋ช ํํ๊ฒ ์ ๊ทธ๋ฐ์ง๋ฅผ ์ค๋ช ํ ์ ์๋ sequential bayesian ๋ชจํ์ ๋๋ค.๊ณ ๊ฐ์๊ฒ ์ด๋ค ๋ชจํ์ ์ถ์ฒํ๊ฒ ์ต๋๊น?
- ๊ณ ๊ฐ์ด ๋ด์ผ ์ด๋ค ์ํ์ ๊ตฌ๋งคํ ์ง ์์ธกํ๋ ๋ชจํ์ ๋ง๋ค์ด์ผ ํ๋ค๋ฉด ์ด๋ค ๊ธฐ๋ฒ(์: SVM, Random Forest, logistic regression ๋ฑ)์ ์ฌ์ฉํ ๊ฒ์ธ์ง ์ ํ๊ณ ์ด๋ฅผ ํต๊ณ์ ๊ธฐ๊ณํ์ต ์ง์์ด ์ ๋ฌดํ ์ค๋ฌด์์๊ฒ ์ค๋ช ํด๋ด ์๋ค.
- ๋๋ง์ feature selection ๋ฐฉ์์ ์ค๋ช
ํด๋ด
์๋ค.
- Blog post
- implementation
- recursive feature elimination
- sequential feature selection
- t-test, chi2 contingency
- ๋ฐ์ดํฐ ๊ฐ์ ์ ์ฌ๋๋ฅผ ๊ณ์ฐํ ๋, feature์ ์๊ฐ ๋ง๋ค๋ฉด(์: 100๊ฐ ์ด์), ์ด๋ฌํ high-dimensional clustering์ ์ด๋ป๊ฒ ํ์ด์ผํ ๊น์?
- ์ฐจ์์ถ์
- Cross Validation์ ๋ฌด์์ด๊ณ ์ด๋ป๊ฒ ํด์ผํ๋์?
- ํ์ต ๋ฐ์ดํฐ๋ฅผ K๊ฐ๋ก ๋๋
- K-1๊ฐ folds๋ฅผ ํ์ตํ๊ณ ๋จ์ 1๊ฐ fold์ ๋ํด ๋ชจ๋ธ ๊ฒ์ฆ
- ๋ณด๋ค ์๋ฐํ ๊ฒ์ฆ ๊ฐ๋ฅ. ํ์ดํผ ํ๋ผ๋ฏธํฐ ํ๋ ๋ฑ์ ์ฌ์ฉ
- ํ๊ท / ๋ถ๋ฅ์ ์๋ง์ metric์ ๋ฌด์์ผ๊น์?
- ํ๊ท: MAE, MSE, RMSE, MAPE, R2
- ๋ถ๋ฅ: Accuracy, recall, precision, F1 score, AUC
- ์๊ณ ์๋ metric์ ๋ํด ์ค๋ช ํด์ฃผ์ธ์(ex. RMSE, MAE, recall, precision ...)
- ์ ๊ทํ(regularization)๋ฅผ ์ ํด์ผํ ๊น์? ์ ๊ทํ์ ๋ฐฉ๋ฒ์ ๋ฌด์์ด ์๋์?
- Local Minima์ Global Minima์ ๋ํด ์ค๋ช ํด์ฃผ์ธ์.
- ์ฐจ์์ ์ ์ฃผ์ ๋ํด ์ค๋ช
ํด์ฃผ์ธ์
- ๋ณ์(feature)์ ๊ฐ์ ์ฆ ๋ฐ์ดํฐ์ ์ฐจ์์ด ์ฆ๊ฐํ ์๋ก ๋ณ์๊ณต๊ฐ ๋ด ์์์ ๋ ์ ์ฌ์ด์ ํ๊ท ๊ฑฐ๋ฆฌ๋ ๋น ๋ฅด๊ฒ ์ฆ๊ฐํ๋ฉฐ ์ ์ฒด ๊ณต๊ฐ์์ ๋ฐ์ดํฐ๊ฐ ์ฐจ์งํ๋ ๊ณต๊ฐ์ด ๋งค์ฐ ์ ์ด์ง
- ํ์ํ ๋ฐ์ดํฐ์ ์๊ฐ ๊ธฐํ๊ธ์์ ์ผ๋ก ์ฆ๊ฐ, ํ๋ จ์ด ๋๋ ค์ง
- dimension reduction๊ธฐ๋ฒ์ผ๋ก ๋ณดํต ์ด๋ค ๊ฒ๋ค์ด ์๋์?
- PCA๋ ์ฐจ์ ์ถ์ ๊ธฐ๋ฒ์ด๋ฉด์, ๋ฐ์ดํฐ ์์ถ ๊ธฐ๋ฒ์ด๊ธฐ๋ ํ๊ณ , ๋
ธ์ด์ฆ ์ ๊ฑฐ๊ธฐ๋ฒ์ด๊ธฐ๋ ํฉ๋๋ค. ์ ๊ทธ๋ฐ์ง ์ค๋ช
ํด์ฃผ์ค ์ ์๋์?
- Blog post
- implementation
- ๋ถ์ฐ์ค๋ช ๋ ์ฆ ๊ณต๋ถ์ฐํ๋ ฌ์ ๊ณ ์ณ๊ฐ์ด ํฐ ์์๋๋ก ์์ N๊ฐ์ ๊ณ ์ ๋ฒกํฐ๋ง์ components๋ก ์ฑํํ๋ฏ๋ก ์ค๋ช ๋ ฅ์ด ๋ฎ์ ๋ณ์ ์ฆ ๋ ธ์ด์ฆ๊ฐ ์ ๊ฑฐ๋ ์ ์์
- ๋ฐ์ดํฐ ํ๋ ฌ์ ํน์ ๋ฒกํฐ์ ํฌ์(projection)ํ์ ๋ ๊ฐ๋ค์ ๋ถ์ฐ์ด ์ต๋ํํ๋ ๋ฒกํฐ๋ฅผ ์ฐพ๋ ์๊ณ ๋ฆฌ์ฆ. ์ฆ ๋ฐ์ดํฐ ํ๋ ฌ์ ๊ณต๋ถ์ฐ ํ๋ ฌ์ ๊ณ ์ณ๊ฐ ๋ถํด๋ฅผ ํตํด ์ป์
- LSA, LDA, SVD ๋ฑ์ ์ฝ์๋ค์ด ์ด๋ค ๋ป์ด๊ณ ์๋ก ์ด๋ค ๊ด๊ณ๋ฅผ ๊ฐ์ง๋์ง ์ค๋ช
ํ ์ ์๋์?
- SVD
- Blog post
- implementation
- Singular Value Decomposition
- LSA
- Latent Semantic Analysis
- truncated SVD๋ฅผ ํ์ฉํ์ฌ ๋ฐ์ดํฐ์ ์ฐจ์์ ์ถ์์ํด. ํ ์คํธ ๋ฐ์ดํฐ์ ๊ฒฝ์ฐ, ์ถ์๋ ๊ฐ๊ฐ์ components๋ฅผ ํ๋์ topic์ผ๋ก ๊ฐ์ฃผํ ์ ์์
- LDA
- Latent Dirichlet Allocation
- ๊ฐ ๋ฌธ์(=๋ฌธ์ฅ)์ ๋จ์ด๋ฅผ ๋ถ์ํ์ฌ ํ ํฝ๋ณ ๋จ์ด์ ๋ถํฌ ๋์๊ฐ ๋ฌธ์์ ํ ํฝ ๋น์จ์ ์ฐ์ถ. [ref]
-
- SVD
- Markov Chain์ ๊ณ ๋ฑํ์์๊ฒ ์ค๋ช ํ๋ ค๋ฉด ์ด๋ค ๋ฐฉ์์ด ์ ์ผ ์ข์๊น์?
- ํ
์คํธ ๋๋ฏธ์์ ์ฃผ์ ๋ฅผ ์ถ์ถํด์ผ ํฉ๋๋ค. ์ด๋ค ๋ฐฉ์์ผ๋ก ์ ๊ทผํด ๋๊ฐ์๊ฒ ๋์?
- ํค์๋ ์ถ์ถ: TF-iDF, Bert
- ํ ์คํธ ์์ฝ: TextRank, Seq2Seq
- SVM์ ์ ๋ฐ๋๋ก ์ฐจ์์ ํ์ฅ์ํค๋ ๋ฐฉ์์ผ๋ก ๋์ํ ๊น์? ๊ฑฐ๊ธฐ์ ์ด๋ค ์ฅ์ ์ด ๋ฐ์ํ๋์?
- rbf, linear, sigmoid ๋ฑ kernel์ ํตํด ์ฐจ์์ ํ์ฅ
- (ํนํ ๋ถ๋ฅ ๋ฌธ์ ์์) ํ์ฅ๋ ๊ณต๊ฐ์ mapping๋ data points๋ฅผ ์ ํ์ผ๋ก ๊ตฌ๋ถํ๋ hyperplane์ ์ฐพ์ ์ ์์
- ์์: ์๋ก ๋ค๋ฅธ ๋ ํด๋์ค์ ์ํ๋ ๋ ๋์ฌ์. [ref]
- ๋ค๋ฅธ ์ข์ ๋จธ์ ๋ฌ๋ ๋๋น, ์ค๋๋ ๊ธฐ๋ฒ์ธ ๋์ด๋ธ ๋ฒ ์ด์ฆ(naive bayes)์ ์ฅ์ ์ ์นํธํด๋ณด์ธ์.
- Association Rule์ Support, Confidence, Lift์ ๋ํด ์ค๋ช ํด์ฃผ์ธ์.
- ์ต์ ํ ๊ธฐ๋ฒ์ค Newtonโs Method์ Gradient Descent ๋ฐฉ๋ฒ์ ๋ํด ์๊ณ ์๋์?
- ๋จธ์ ๋ฌ๋(machine learning)์ ์ ๊ทผ๋ฐฉ๋ฒ๊ณผ ํต๊ณ(statistics)์ ์ ๊ทผ๋ฐฉ๋ฒ์ ๋๊ฐ์ ์ฐจ์ด์ ๋ํ ๊ฒฌํด๊ฐ ์๋์?
- ํต๊ณ์ ์ ๊ทผ: ํน์ ํ์์ด๋ ์๊ด๊ด๊ณ๋ฅผ ์ ์ค๋ช ํ๋ ๋ถํฌ๋ ๋ชจํ์ด ์๋ค๊ณ ๊ฐ์ ํ๊ณ ์ด๋ฅผ ํํํ๋ ๋ชจ์(parameters)๋ฅผ ์ฐพ๊ณ ์ ํจ
- ๋จธ์ ๋ฌ๋: ์์คํจ์ ํน์ ์ฑ๋ฅ์งํ(metric)์ ์์ ํ๊ณ ์ด๋ฅผ ์ต์ ํํ๋ ๋ฐฉํฅ์ผ๋ก ๋ชจ๋ธ์ ๋ฐ์ดํฐ์ ์ ํฉ(fit, train)์ํด
- ์ธ๊ณต์ ๊ฒฝ๋ง(deep learning์ด์ ์ ์ ํต์ ์ธ)์ด ๊ฐ์ง๋ ์ผ๋ฐ์ ์ธ ๋ฌธ์ ์ ์ ๋ฌด์์ผ๊น์?
- XOR problem: ํ๋์ perceptron๋ง์ผ๋ก๋ ํด๊ฒฐํ ์ ์์
- ์ง๊ธ ๋์ค๊ณ ์๋ deep learning ๊ณ์ด์ ํ์ ์ ๊ทผ๊ฐ์ ๋ฌด์์ด๋ผ๊ณ ์๊ฐํ์๋์?
- ์ฌ๋ฌ layers๋ฅผ ์์ผ๋ฉด์๋ ์ ์ ํ activation function์ ํ์ฉํ์ฌ ๊ธฐ์ธ๊ธฐ ์์ค ์์ด ์ ์๋ฏธํ ํ์ต ๊ฐ๋ฅ
- ์ค์ฐจ ์ญ์ ํ๋ฅผ ํตํด gradient๋ฅผ ๊ณ์ฐํ๊ณ ์ด๋ฅผ ์ฌ์ฉํด ๊ฐ์ค์น ์ ๋ฐ์ดํธ. ํด๋ฆฌ์คํฑ ๋ฐฉ๋ฒ๋ก ๋ฑ ์ฌ๋์ ๊ฐ์ ์ฌ์ง ์ถ์
- ๋น ๋ฐ์ดํฐ๋ฅผ ํ์ตํ ์ฌ์ ํ์ต ๋ชจ๋ธ์ ๋์ ๊ณผ์ ์ ํ์ฉํ ์ ์์
- ROC ์ปค๋ธ์ ๋ํด ์ค๋ช
ํด์ฃผ์ค ์ ์์ผ์ ๊ฐ์?
- false positive rate๋ฅผ x์ถ์ผ๋ก true positive rate(recall=sensitivity)๋ฅผ y์ถ์ผ๋ก ํ๋ ๊ทธ๋ํ
- AUC: ROC ์ปค๋ธ์ y=0, x=1๋ก ๋๋ฌ์์ธ ๋ฉด์ ์ ๋์ด
- ์ฌ๋ฌ๋ถ์ด ์๋ฒ๋ฅผ 100๋ ๊ฐ์ง๊ณ ์์ต๋๋ค. ์ด๋ ์ธ๊ณต์ ๊ฒฝ๋ง๋ณด๋ค Random Forest๋ฅผ ์จ์ผํ๋ ์ด์ ๋ ๋ญ๊น์?
- Random Forest๋ ๋ง์ Decision tree์ ๊ฒฐ๊ณผ๋ฅผ ์์๋ธํ๋ ๊ธฐ๋ฒ
- ํธ๋ฆฌ๋ฅผ ๊ฐ ์๋ฒ์ ํ ๋นํ์ฌ ๊ณ์ฐ ์ํํ ์ ์์
- K-means์ ๋ํ์ ์๋ฏธ๋ก ์ ๋จ์ ์ ๋ฌด์์ธ๊ฐ์? (๊ณ์ฐ๋ ๋ง๋ค๋๊ฒ ๋ง๊ณ )
- ์ด์์น์ ๋ฏผ๊ฐํจ
- ๊ตฐ์ง์ ๊ฐ์๋ฅผ ๋ฏธ๋ฆฌ ์ค์ ํด์ผ ํจ
- non-convex shape ๋ฐ์ดํฐ์ ์ ์ฉํ๊ธฐ ์ด๋ ค์
- L1, L2 ์ ๊ทํ์ ๋ํด ์ค๋ช ํด์ฃผ์ธ์
- XGBoost์ ์์๋์? ์ ์ด ๋ชจ๋ธ์ด ์บ๊ธ์์ ์ ๋ช ํ ๊น์?
- ์์๋ธ ๋ฐฉ๋ฒ์ ์ด๋ค ๊ฒ๋ค์ด ์๋์?
- bagging: bootstrap๋ฅผ ์ฌ์ฉํด ํ๋์ ์ ๋ฐ์ดํฐ์์ ๋ค์์ ๋ฐ์ดํฐ์ ์ ๋ง๋ค๊ณ ๊ธฐ๋ณธ ๋ถ๋ฅ๊ธฐ๊ฐ ์๋ก ๋ค๋ฅธ ๋ฐ์ดํฐ์ ์ ํ์ตํ๊ฒ ํจ. ๊ฐ ๋ถ๋ฅ๊ธฐ์ ์์ธก ๊ฒฐ๊ณผ๋ฅผ ํฉ์ฐ
- boosting: ์๋ชป ๋ถ๋ฅ๋ ์ํ์ ํฐ ๊ฐ์ค์น๋ฅผ ๋์ด ํ์ต, ์ฝํ ๋ถ๋ฅ๊ธฐ๋ฅผ ๊ฐ๊ฑดํ๊ฒ ํ๋ ๊ธฐ๋ฒ
- random forest: ๋ค์์ ์์ฌ๊ฒฐ์ ๋๋ฌด๋ฅผ ์์๋ธํ์ฌ ์์ธก
- SVM์ ์ ์ข์๊น์?
- feature vector๋ ๋ฌด์์ผ๊น์?
- ๊ฐ feature๋ฅผ ํ๋์ basis๋ก ๋ณด๊ณ ๋ฐ์ดํฐ์ ์ ๋ชจ๋ bases์ ์ ํ๊ฒฐํฉ์ผ๋ก ํํ๋๋ ๊ณต๊ฐ์ผ๋ก ๋ด
- ์ข์ ๋ชจ๋ธ์ ์ ์๋ ๋ฌด์์ผ๊น์?
- ์ํธํ ์ฑ๋ฅ ์งํ๋ฅผ ๋ณด์ด๋ ๋ชจ๋ธ
- ์ด๋ ํ ๋ฐ์ดํฐ์ ์ ๋ํด์๋ ์ ์ฌํ ์ฑ๋ฅ์ ๋ณด์ด๋ ๋ชจ๋ธ
- 50๊ฐ์ ์์ ์์ฌ๊ฒฐ์ ๋๋ฌด๋ ํฐ ์์ฌ๊ฒฐ์ ๋๋ฌด๋ณด๋ค ๊ด์ฐฎ์๊น์? ์ ๊ทธ๋ ๊ฒ ์๊ฐํ๋์?
- ๋๋ฌด์ ๊ฐ์๊ฐ ๋ง์์๋ก ์์์ฑ์ด ํ๋ณด๋์ด ๋ชจ๋ธ์ด ๋ณด๋ค robustํ๋ค
- ์คํธ ํํฐ์ ๋ก์ง์คํฑ ๋ฆฌ๊ทธ๋ ์
์ ๋ง์ด ์ฌ์ฉํ๋ ์ด์ ๋ ๋ฌด์์ผ๊น์?
- coefficients ๊ธฐ๋ฐ, ์ง๊ด์ ๋ชจ๋ธ, ๊ฒฐ๊ณผ ํด์์ ์ ๋ฆฌ
- Binary classification ๋ฌธ์ ์ ์ ํฉ, ์คํธ ํ๋ฅ ์ฐ์ถ ๊ฐ๋ฅ
- OLS(ordinary least squre) regression์ ๊ณต์์ ๋ฌด์์ธ๊ฐ์?
- ๋ฅ๋ฌ๋์ ๋ฌด์์ธ๊ฐ์? ๋ฅ๋ฌ๋๊ณผ ๋จธ์ ๋ฌ๋์ ์ฐจ์ด๋?
- ๋ฅ๋ฌ๋: ์ธ๊ณต์ ๊ฒฝ๋ง์ ๊น๊ฒ ์์ ํ์ตํ๋, ๋จธ์ ๋ฌ๋ ๊ธฐ๋ฒ ์ค ํ๋
- ์ฐจ์ด
- ์ ํต ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ๊ฐ์ ํ๊ธฐ ์ํด์๋ ์ฌ์ฉ์ ์ฆ ์ฌ๋์ ๊ฐ์ญ์ด ๋ถ๊ฐํผ. ๊ทธ๋ฌ๋ ๋ฅ๋ฌ๋์ ํ๊ฒฝ๊ณผ ์์ ํ์ต์ ์ค์ฐจ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก (์ค์ค๋ก) ํ์ต ๋ฐ ์ ๋ฐ์ดํธ ๊ฐ๋ฅ
- ์ถ๋ ฅ๊ฐ ํํ์ ์ข ๋ฅ: ๋จธ์ ๋ฌ๋์ ์ถ๋ ฅ๊ฐ ์ฆ ์์ธก๊ฐ์ ์นดํ ๊ณ ๋ฆฌ๋ ์ซ์. ๊ทธ๋ฌ๋ ๋ฅ๋ฌ๋์ ์์ฐ์ด, ์ด๋ฏธ์ง, ์์ฑ, ๋น๋์ค ๋ฑ์ ์ถ๋ ฅ(inference)ํ ์ ์์
- ์ ๊ฐ์๊ธฐ ๋ฅ๋ฌ๋์ด ๋ถํฅํ์๊น์?
- XOR ๋ฌธ์ , gradient vanishing ๋ฑ ๋ฌธ์ ๊ฐ ์์์ง๋ง ๊ทธ์ ๋ํ ์๋ฃจ์ ์ด ์ ์๋์ด ์ ๊ฒฝ๋ง์ ๊น์ด ์์๋ ์ ์์ ์ผ๋ก ํ์ตํ ์ ์๊ฒ ๋จ
- ์ ๊ฒฝ๋ง์ ๊น์ด ์์์๋ก ๋ฐ์ดํฐ์ ๋ค์ํ ํน์ฑ์ ํ์ตํ ์ ์์ผ๋ฉฐ ๋ถ๋ฅ ๋ฑ ์ฑ๋ฅ ํฅ์์ ๊ธฐ๋ํ ์ ์์์
- ๋ง์ง๋ง์ผ๋ก ์ฝ์ ๋ ผ๋ฌธ์ ๋ฌด์์ธ๊ฐ์? ์ค๋ช ํด์ฃผ์ธ์
- Cost Function๊ณผ Activation Function์ ๋ฌด์์ธ๊ฐ์?
- Cost Function: ๋ชจ๋ธ ์์ธก์ ์ค์ฐจ ์ ๋๋ฅผ ์ธก์ ํ๋ ํจ์, ์์ค ํจ์๋ฅผ ์ต์ํํ๋ ๋ฐฉํฅ์ผ๋ก ๋ชจ๋ธ ํ์ต
- Activation Function: ๋ด๋ฐ(๋ ธ๋)์์ ์ถ๋ ฅ๊ฐ์ ๊ฒฐ์ ํ๋ ํจ์
- Tensorflow, Keras, PyTorch, Caffe, Mxnet ์ค ์ ํธํ๋ ํ๋ ์์ํฌ์ ๊ทธ ์ด์ ๋ ๋ฌด์์ธ๊ฐ์?
- Data Normalization์ ๋ฌด์์ด๊ณ ์ ํ์ํ๊ฐ์?
- ๊ฐ feature์ ํ๊ท , ํ์คํธ์ฐจ๋ ์ต๋๊ฐ, ์ต์๊ฐ ๋ฑ scale์ ํต์ผํ๋ ์ฒ๋ฆฌ ๊ธฐ๋ฒ
- ์ด์ : ํ์ต ์๊ฐ ๋จ์ถ ๋ฐ ๋ชจ๋ธ ์ฑ๋ฅ ํฅ์
- ๋ฐ์ดํฐ ์ ๊ทํ๋ฅผ ํ์ง ์์ผ๋ฉด feature์ ๋ฐ๋ผ ๊ฐ์ค์น ๋ณ๋ ํญ์ด ๋ฌ๋ผ(์์คํจ์์์ ๊ฒฝ์ฌ๊ฐ ๊ฐ์ฅ ๊ฐํ๋ฅธ ๋ฐฉํฅ์ด ์ผ์ ์น ์์) optimization ์ zigzagging์ด ์ฌํด์ง
- ์๊ณ ์๋ Activation Function์ ๋ํด ์๋ ค์ฃผ์ธ์. (Sigmoid, ReLU, LeakyReLU, Tanh ๋ฑ)
- ์ค๋ฒํผํ
์ผ ๊ฒฝ์ฐ ์ด๋ป๊ฒ ๋์ฒํด์ผ ํ ๊น์?
- ๋ฐ์ดํฐ ์ ์ฆ๊ฐ, ๋ชจ๋ธ ๋ณต์ก๋(layers ๊ฐ์, parameters ๊ฐ์ ๋ฑ) ๊ฐ์, weight decay, dropout
- ํ์ดํผ ํ๋ผ๋ฏธํฐ๋ ๋ฌด์์ธ๊ฐ์?
- ๋ชจ๋ธ ๋ด๋ถ ์ฐ์ฐ์ ์ํด ์ฐ์ถ๋๋ ๊ฐ์ด ์๋, ์ฌ์ฉ์๊ฐ ์ง์ ์ ๋ ฅํด์ฃผ์ด์ผ ํ๋ ๊ฐ
- CNN์ filter ๊ฐ์, kernel size, stride / dense layer์ node ๊ฐ์ ๋ฑ
- Weight Initialization ๋ฐฉ๋ฒ์ ๋ํด ๋งํด์ฃผ์ธ์. ๊ทธ๋ฆฌ๊ณ ๋ฌด์์ ๋ง์ด ์ฌ์ฉํ๋์?
- implementation
- ์๋ชป๋ ๊ฐ์ค์น ์ด๊ธฐํ๋ ์ ๊ฒฝ๋ง์ ํํ๋ ฅ์ ์ ํํ ์ ์์
- Xavier(ํน์ Glorot): ํ์ฑํ ํจ์๊ฐ Sigmoid๋ tanh์ผ ๋ ์ฌ์ฉ
- truncated normal distribution centered on 0 with stddev = sqrt(2 / (fan_in+fan_out))
- He: ํ์ฑํ ํจ์๊ฐ ReLU์ผ ๋ ์ฌ์ฉ
- truncated normal distribution centered on 0 with stddev = sqrt(2 / fan_in)
- ๋ณผ์ธ ๋ง ๋จธ์ ์ ๋ฌด์์ธ๊ฐ์?
- ์์ฆ Sigmoid ๋ณด๋ค ReLU๋ฅผ ๋ง์ด ์ฐ๋๋ฐ ๊ทธ ์ด์ ๋?
- Non-Linearity๋ผ๋ ๋ง์ ์๋ฏธ์ ๊ทธ ํ์์ฑ์?
- linear map์ด ์๋ ๊ฒฝ์ฐ
- ์ ํ์ด ์๋ ๊ด๊ณ๋ฅผ ํํํ๊ธฐ ์ํด ํ์ํจ
- ์ฌ์ธต์ ๊ฒฝ๋ง์์๋ ์๋์ธต์ ๋ค์ ์๋ ๊ฒ ๊ด๊ฑด. ๊ทธ๋ฌ๋ ํ์ฑํ ํจ์๊ฐ ์ ํํจ์์ด๋ฉด ์๋์ธต์ ์์๋ ๊ฒฐ๊ตญ ์๋์ธต์ด ํ๋์ธ ๋ชจ๋ธ๊ณผ ๋งคํ๊ฐ์ง
- ๋ฐ๋ผ์ ํ์ฑํ ํจ์๋ ๋น์ ํ ํจ์์ฌ์ผ ํจ
- ReLU๋ก ์ด๋ป๊ฒ ๊ณก์ ํจ์๋ฅผ ๊ทผ์ฌํ๋?
- ReLU๋ ์ ํ ํจ์์ ๋น์ ํ ํจ์๊ฐ ๊ฒฐํฉํ ํํ
- ์ฌ๋ฌ ์๋์ธต์ ๊ฑธ์ณ ReLU๊ฐ ์ฌ์ฉ๋๋ฉด, ๊ฐ ์ ํ ํจ์๊ฐ ๋ถ๋ถ์ ์ผ๋ก ๊ฒฐํฉ๋์ด ๋น์ ํ ํจ์๋ฅผ ๊ทผ์ฌํ๊ฒ ๋จ
- ReLU์ ๋ฌธ์ ์ ์?
- dying ReLu: ์ ๋ ฅ์ด ์์์ด๋ฉด ํจ์ซ๊ฐ์ด 0์ด ๋จ
- Bias๋ ์ ์๋๊ฑธ๊น?
- ํ์ฑํ ํจ์์ trigger๋ฅผ ์กฐ์ ํ๋ ๋ฐ ์ฌ์ฉ๋จ
- Non-Linearity๋ผ๋ ๋ง์ ์๋ฏธ์ ๊ทธ ํ์์ฑ์?
- Gradient Descent์ ๋ํด์ ์ฝ๊ฒ ์ค๋ช
ํ๋ค๋ฉด?
- ์ ๊ผญ Gradient๋ฅผ ์จ์ผ ํ ๊น? ๊ทธ ๊ทธ๋ํ์์ ๊ฐ๋ก์ถ๊ณผ ์ธ๋ก์ถ ๊ฐ๊ฐ์ ๋ฌด์์ธ๊ฐ? ์ค์ ์ํฉ์์๋ ๊ทธ ๊ทธ๋ํ๊ฐ ์ด๋ป๊ฒ ๊ทธ๋ ค์ง๊น?
- GD ์ค์ ๋๋๋ก Loss๊ฐ ์ฆ๊ฐํ๋ ์ด์ ๋?
- ์ต์ ํ ๊ธฐ๋ฒ์ ๋ฐ๋ผ gradient, learning rate๊ฐ ๋ฌ๋ผ์ง. ๊ฒฝ์ฐ์ ๋ฐ๋ผ loss๊ฐ ์ฆ๊ฐํ ์๋ ์์
- ์คํ์์ด ์ดํดํ ์ ์๊ฒ ๋ ์ฝ๊ฒ ์ค๋ช ํ๋ค๋ฉด?
- Back Propagation์ ๋ํด์ ์ฝ๊ฒ ์ค๋ช
ํ๋ค๋ฉด?
- ์์ค ํจ์์ ๊ทธ๋๋์ธํธ๋ฅผ ๊ณ์ฐํ์ฌ ๊ฐ์ค์น๋ฅผ ์ ๋ฐ์ดํธํ๋ ๋ฐฉ๋ฒ
- Local Minima ๋ฌธ์ ์๋ ๋ถ๊ตฌํ๊ณ ๋ฅ๋ฌ๋์ด ์ ๋๋ ์ด์ ๋?
- [ref]
- ์ด์
- loss์์ ์ฐจ์ด๋ฅผ ๋ณด์ด๋๋ผ๋ metric์ ์ ์ฌํ ์ ์์
- trainset๊ณผ test ํน์ inference ๋ฐ์ดํฐ์ ์์์ ๋ค๋ฆ
- ํ๋ผ๋ฏธํฐ๊ฐ ๋ง์์ง์๋ก ์์คํจ์๋ ๊ณ ์ฐจ์์ด ๋๋๋ฐ ์ด๋๋ optimal local minima๊ฐ ๋ค์ ์กด์ฌํ ์ ์์
- GD๊ฐ Local Minima ๋ฌธ์ ๋ฅผ ํผํ๋ ๋ฐฉ๋ฒ์?
- stochastic GD: ํ์ต ๋ฐ์ดํฐ๋ฅผ ์ฌ๋ฌ ๊ฐ์ ๋ฐฐ์น(batch)๋ก ๋๋์ด(๋ฌด์์ ๋น๋ณต์์ถ์ถ) ๋ชจ๋ธ ํ์ต ๋ฐ ๊ฐ์ค์น ์ ๋ฐ์ดํธ ์งํ. single batch GD์ ๋นํด ๋งค batch๋ง๋ค ์กฐ๊ธ์ฉ ๋ค๋ฅธ ๋ฐฉํฅ(gradient)๋ก
- ํ์ต๋ฅ (learning rate) ์กฐ์
- ์ฐพ์ ํด๊ฐ Global Minimum์ธ์ง ์๋์ง ์ ์ ์๋ ๋ฐฉ๋ฒ์?
- ํ์ค์ ์ผ๋ก ์ด๋ฌํ ๋ฐฉ๋ฒ์ ์์
- ํ์ต ๋ฐ์ดํฐ์์ global minimum์ผ์ง๋ผ๋ ํ๊ฐ ๋ฐ์ดํฐ์์๋ ์๋ ์ ์์
- Training ์ธํธ์ Test ์ธํธ๋ฅผ ๋ถ๋ฆฌํ๋ ์ด์ ๋?
- Validation ์ธํธ๊ฐ ๋ฐ๋ก ์๋ ์ด์ ๋?
- ๊ฐ์ค์น๋ฅผ ์ ๋ฐ์ดํธํ๋ ๊ณผ์ ์์ validation loss๋ฅผ ๋ฐ๋ก ํ์ ํ์ฌ ์ค๋ฒํผํ ์ ๋ฐฉ์งํ๊ธฐ ์ํจ
- Test ์ธํธ๊ฐ ์ค์ผ๋์๋ค๋ ๋ง์ ๋ป์?
- Test ์ธํธ๋ฅผ ๋๋ ์ด์ ๋ ๋ชจ๋ธ์ด ํ๋ฒ๋ ํ์ตํ์ง ๋ชปํ ๋ฐ์ดํฐ๋ก ๋ณด๋ค ์๋ฐํ๊ฒ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ํ์ ํ๊ธฐ ์ํจ
- ์ด๋ฌํ ๋ชฉ์ ์ผ๋ก ๋ถ๋ฆฌ๋ Test ์ธํธ๊ฐ ๋ชจ๋ธ ํ์ต์ ์ด๋ ํ ๋ฐฉ์์ผ๋ก๋ ๊ฐ์ ๋์๋ค๋ฉด ์ด๋ฅผ ์ค์ผ๋์๋ค๊ณ ํจ
- Regularization์ด๋ ๋ฌด์์ธ๊ฐ?
- Validation ์ธํธ๊ฐ ๋ฐ๋ก ์๋ ์ด์ ๋?
- Batch Normalization์ ํจ๊ณผ๋?
- Dropout์ ํจ๊ณผ๋?
- ์ผ๋ถ ๋ ธ๋๋ฅผ ๋ฌด์์๋ก ๋นํ์ฑํํจ์ผ๋ก์จ ๋ ธ๋ ์ฌ์ด์ ์์กด์ฑ์ ์ํํจ
- BN ์ ์ฉํด์ ํ์ต ์ดํ ์ค์ ์ฌ์ฉ์์ ์ฃผ์ํ ์ ์? ์ฝ๋๋ก๋?
- ์๋์ธต ๋ค์ ์ฌ์ฉ
- ์์ธต ์ถ๋ ฅ์ ํ๊ท ๊ณผ ๋ถ์ฐ์ด ํญ์ ๊ฐ์. ๋ถํฌ์ ๋ณํ ์ฆ covariate shift๊ฐ ์์. ์์ธต ์ถ๋ ฅ์ ์ํฅ์ ๋ ๋ฐ์.
- ๋ ๋ฆฝ์ , ๋น ๋ฅด๊ณ ์์ ์ ์ธ ํ์ต
- GAN์์ Generator ์ชฝ์๋ BN์ ์ ์ฉํด๋ ๋ ๊น?
- Dropout์ ํจ๊ณผ๋?
- SGD, RMSprop, Adam์ ๋ํด์ ์๋๋๋ก ์ค๋ช
ํ๋ค๋ฉด?
- SGD์์ Stochastic์ ์๋ฏธ๋?
- ๋ฏธ๋๋ฐฐ์น๋ก ๋ฌถ์ด๋ ๋ฐ์ดํฐ๊ฐ ํ๋ฅ ์ ์ฆ ๋ฌด์์๋ก ์ ํด์ง๋ค
- ๋ฏธ๋๋ฐฐ์น๋ฅผ ์๊ฒ ํ ๋์ ์ฅ๋จ์ ์?
- ์ฅ์ : ๊ฐ์ค์น๋ฅผ ์์ฃผ ์์ ํ ์ ์์ผ๋ฏ๋ก global minimum์ ์ ๊ทผํ๋ ๋ฐ ์ ๋ฆฌ
- ๋จ์ : ํ๋ ฌ ์ฐ์ฐ์ ์ด์ ์ ์ด๋ฆฌ๊ธฐ ์ด๋ ต๋ค, ๊ฐ์ค์น ์ ๋ฐ์ดํธ ์ ์ง๋์ด ์ฌํ๋ค
- ๋ชจ๋ฉํ
์ ์์์ ์ ์ด ๋ณธ๋ค๋ฉด?
velocity = momentum * velocity - learning_rate * g
w = w + velocity
- SGD์์ Stochastic์ ์๋ฏธ๋?
- ๊ฐ๋จํ MNIST ๋ถ๋ฅ๊ธฐ๋ฅผ MLP+CPU ๋ฒ์ ์ผ๋ก numpy๋ก ๋ง๋ ๋ค๋ฉด ๋ช์ค์ผ๊น?
- ์ด๋ ์ ๋ ๋์๊ฐ๋ ๋ ์์ ์์ฑํ๊ธฐ๊น์ง ๋ช์๊ฐ ์ ๋ ๊ฑธ๋ฆด๊น?
- Back Propagation์ ๋ช์ค์ธ๊ฐ?
- CNN์ผ๋ก ๋ฐ๊พผ๋ค๋ฉด ์ผ๋ง๋ ์ถ๊ฐ๋ ๊น?
- ๊ฐ๋จํ MNIST ๋ถ๋ฅ๊ธฐ๋ฅผ TF, Keras, PyTorch ๋ฑ์ผ๋ก ์์ฑํ๋๋ฐ ๋ช์๊ฐ์ด ํ์ํ๊ฐ?
- CNN์ด ์๋ MLP๋ก ํด๋ ์ ๋ ๊น?
- MLP๋ ์ด๋ฏธ์ง์ ์์น์ ๋ณด๋ฅผ ๋ณด์กดํ์ง ๋ชปํ๋ฏ๋ก ์ผ๋ฐ์ ์ผ๋ก ์ฑ๋ฅ์ด ๋จ์ด์ง
- ๋ง์ง๋ง ๋ ์ด์ด ๋ถ๋ถ์ ๋ํด์ ์ค๋ช
ํ๋ค๋ฉด?
- ๋ถ๋ฅ๊ธฐ: Fully connected layer = dense layer = linear layer
- activation function: sigmoid or softmax
- ํ์ต์ BCE loss๋ก ํ๋ ์ํฉ์ MSE loss๋ก ๋ณด๊ณ ์ถ๋ค๋ฉด?
- keras์ ๊ฒฝ์ฐ compile ์ metrics์
MeanSquaredError
๋ฅผ ์ถ๊ฐ
- keras์ ๊ฒฝ์ฐ compile ์ metrics์
- ๋ง์ฝ ํ๊ธ (์ธ์๋ฌผ) OCR์ ๋ง๋ ๋ค๋ฉด ๋ฐ์ดํฐ ์์ง์ ์ด๋ป๊ฒ ํ ์ ์์๊น?
- CNN์ด ์๋ MLP๋ก ํด๋ ์ ๋ ๊น?
- ๋ฅ๋ฌ๋ํ ๋ GPU๋ฅผ ์ฐ๋ฉด ์ข์ ์ด์ ๋?
- ํ์ต ์ค์ธ๋ฐ GPU๋ฅผ 100% ์ฌ์ฉํ์ง ์๊ณ ์๋ค. ์ด์ ๋?
- GPU๋ฅผ ๋๊ฐ ๋ค ์ฐ๊ณ ์ถ๋ค. ๋ฐฉ๋ฒ์?
- ํ์ต์ ํ์ํ GPU ๋ฉ๋ชจ๋ฆฌ๋ ์ด๋ป๊ฒ ๊ณ์ฐํ๋๊ฐ?
- TF, Keras, PyTorch ๋ฑ์ ์ฌ์ฉํ ๋ ๋๋ฒ๊น
๋
ธํ์ฐ๋?
- input๊ณผ output array์ dimensionality๋ฅผ ์ดํ๋ค
- ๋ด๋ด๋ท(neural network)์ ๊ฐ์ฅ ํฐ ๋จ์ ์ ๋ฌด์์ธ๊ฐ? ์ด๋ฅผ ์ํด ๋์จ One-Shot Learning์ ๋ฌด์์ธ๊ฐ?
- ์ ๊ฒฝ๋ง์ ๊น์ด ์์์๋ก ํ๋ผ๋ฏธํฐ์ ์๊ฐ ๊ธ๊ฒฉํ ์ฆ๊ฐํ๊ณ ์ด๋ฅผ ํ์ต์ํค๊ธฐ ์ํด์๋ ์์ํ๋ ์์ ๋ฐ์ดํฐ๊ฐ ํ์ํจ
- ๊ทธ์ ๋ํด ๋ฐ์ดํฐ ๋ถ๊ท ํ์ด ์์ด์ผ ํจ
- OpenCV ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ง์ ์ฌ์ฉํด์ ์ด๋ฏธ์ง ๋ทฐ์ด(Crop, ํ๋ฐฑํ, Zoom ๋ฑ์ ๊ธฐ๋ฅ ํฌํจ)๋ฅผ ๋ง๋ค์ด์ฃผ์ธ์
- open image:
img = cv2.imread(fileName, cv2.IMREAD_COLOR)
- crop:
img_crop = img[h1:h2, w1:w2, :]
- gray scale:
cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
- zoom:
cv2.resize(img, dsize = None, fx, fy, interpolation = cv2.INTER_CUBIC)
- save:
cv2.imwrite(fileName, img)
- open image:
- ๋ฅ๋ฌ๋ ๋ฐ๋ฌ ์ด์ ์ ์ฌ๋ฌผ์ Detectํ ๋ ์์ฃผ ์ฌ์ฉํ๋ ๋ฐฉ๋ฒ์ ๋ฌด์์ธ๊ฐ์?
- ์ด๋ฏธ์ง์์ hand-crafted feature๋ฅผ ์ถ์ถํ์ฌ ๊ฐ์ฒด๋ฅผ ๊ฒ์ถ. ์๋์ผ๋ก ์ฌ์ ์ ์ ์๋ ์๊ณ ๋ฆฌ์ฆ, ์ ๋ฌธ๊ฐ์ ์ง์์ ์์กด
- SIFT(Scale-Invariant Feature Transform), HOG(Histogram of Oriented Gradients) ๋ฑ
- Fatser R-CNN์ ์ฅ์ ๊ณผ ๋จ์ ์ ๋ฌด์์ธ๊ฐ์?
- ์ฅ์ : region proposal ๋จ๊ณ(๋ฌผ์ฒด์ ๋๋ต์ ์ธ ์์น ์๋ณ)๋ฅผ RPN์ผ๋ก ์ํ(R-CNN์ selective search ์ฌ์ฉ). ์๋ ๊ฐ์ , ๊ฐ์ฒด ๊ฒ์ถ ์ ๋จ๊ณ๋ฅผ ์ ๊ฒฝ๋ง์ผ๋ก๋ง ๊ตฌ์ฑ
- ๋จ์ : ์ฌ๋ฌ ๋จ๊ณ๋ฅผ ๊ฑฐ์ณ ํ์ต์ด ์ํ๋๋ฏ๋ก ์๊ฐ์ด ์ค๋ ๊ฑธ๋ฆฐ๋ค
- dlib์ ๋ฌด์์ธ๊ฐ์?
- ๋จธ์ ๋ฌ๋ ์๊ณ ๋ฆฌ์ฆ ๋ฑ์ด ํฌํจ๋, C++ ํดํท. ์ฌ๋ฌ ๊ธฐ๋ฅ ๊ฐ์ด๋ฐ HOG feature๋ฅผ ํ์ฉํ face detection ๋ฑ์ด ์ ๋ช ํจ
- YOLO์ ์ฅ์ ๊ณผ ๋จ์ ์ ๋ฌด์์ธ๊ฐ์?
- one stage detector์ ์ผ์ข
- region proposal ๋จ๊ณ๋ฅผ ๊ฑด๋๋ฐ๊ณ CNN ์ธต์์ ์์น์ ํด๋์ค๋ฅผ ๋ชจ๋ ์์ธกํจ
- ์ฅ์ : ๋น ๋ฅธ ์ฒ๋ฆฌ ์๋
- ์ด๋ฏธ์ง๋ฅผ ์ฌ๋ฌ ๊ฐ์ ๊ฒฉ์๋ก ๋๋๊ณ ๊ฐ ๊ฒฉ์์ ๋ํด ํด๋์ค๋ฅผ ๋ถ๋ฅ
- ์ ๊ณผ์ ์ ํตํด ์ฌ๋ฌ ๊ฒฝ๊ณ๋ฐ์ค ํ๋ณด ์์ฑ
- NMS๋ก ์ต์ข ๊ฒฝ๊ณ๋ฐ์ค ์ถ์ถ
- ๋จ์ : ์ฑ๋ฅ ํ๋ฝ
- ์ ์ผ ์ข์ํ๋ Object Detection ์๊ณ ๋ฆฌ์ฆ์ ๋ํด ์ค๋ช
ํ๊ณ ๊ทธ ์๊ณ ๋ฆฌ์ฆ์ ์ฅ๋จ์ ์ ๋ํด ์๋ ค์ฃผ์ธ์
- ๊ทธ ์ดํ์ ๋์จ ๋ ์ข์ ์๊ณ ๋ฆฌ์ฆ์ ๋ฌด์์ธ๊ฐ์?
- Average Pooling๊ณผ Max Pooling์ ์ฐจ์ด์ ์?
- Average Pooling: pool size ๋ด์ ๊ฐ์ ํ๊ท
- Max Pooling: pool size ๋ด์ ๊ฐ์ ์ต๋๊ฐ
- Deepํ ๋คํธ์ํฌ๊ฐ ์ข์ ๊ฒ์ผ๊น์? ์ธ์ ๊น์ง ์ข์๊น์?
- ๋ณด๋ค ๋ง์ ํน์ฑ์ ํ์ง ๋ฐ ํ์ตํ ์ ์๋ค
- ๋จ ๋คํธ์ํฌ๊ฐ ๊น์ด์ง๋ฉด gradient vanishing์ด ๋ํ๋ ์ ์์ผ๋ฉฐ ์ด๋ ๋ชจ๋ธ์ ํ์ต์ ๋ฐฉํดํ๋ค
- Residual Network๋ ์ ์๋ ๊น์? Ensemble๊ณผ ๊ด๋ จ๋์ด ์์๊น์?
- ResNet์์ building blocks๋ฅผ ์๋๋ค๋ ๊ฒ์ ์ ๋ ฅ๊ณผ ์ถ๋ ฅ์ ์ฐ๊ฒฐํ๋ O(2^n)๊ฐ์ implicit paths๋ฅผ ์ค์ ํจ๊ณผ ๊ฐ์
- ์ด๋ฌํ paths๋ค์ ์๋ก ๊ฐํ๊ฒ ์์กดํ์ง ์๊ณ ๊ฒฐ๊ตญ ensemble๊ณผ ์ ์ฌํ๊ฒ ํ๋ํจ
- [paper]
- CAM(Class Activation Map)์ ๋ฌด์์ธ๊ฐ์?
- ๋ถ๋ฅ ๊ณผ์ ๋ฅผ ์ํด์๋ Flatten layer, Fully connection layer๊ฐ ํ์ํจ
- ๊ทธ๋ฌ๋ ์ด๋ฅผ ๊ฑฐ์น๋ฉด์ ์์น ์ ๋ณด๊ฐ ์์ค๋จ
- CNN layer์ Global average pooling layer๋ฅผ ๋ถ์ฌ objects์ ์์น ์ ๋ณด๋ฅผ ๋ณด์กดํ ์ ์์
- ์ด๋ฅผ ํ์ฉํ์ฌ class specific activation map ์ถ์ถ. ์ฆ ๋ชจ๋ธ์ด ์ ๋ ฅ ์ด๋ฏธ์ง๋ฅผ ํน์ class๋ก ๋ถ๋ฅํ๋ ๋ฐ ์ํฅ์ ๋ฏธ์น object๋ฅผ heatmap ํํ๋ก ๋ํ๋
- Localization์ ๋ฌด์์ผ๊น์?
- ์ด๋ฏธ์ง ์ object์ ์์น๋ฅผ ์ค์ ํ๋ ์๊ณ ๋ฆฌ์ฆ
- ์์จ์ฃผํ ์๋์ฐจ์ ์๋ฆฌ๋ ๋ฌด์์ผ๊น์?
- Object detection: ์ ๋ฐฉ ์นด๋ฉ๋ผ์ ์กํ ๋ฌผ์ฒด์ ์ข ๋ฅ์ ์์น๋ฅผ ํ๋จํ ๋ ์ฌ์ฉ
- Semantic Segmentation์ ๋ฌด์์ธ๊ฐ์?
- ์ด๋ฏธ์ง์ ํฝ์ ๋ณ๋ก ํด๋์ค๋ฅผ ์์ธกํ๋ ์๊ณ ๋ฆฌ์ฆ
- Visual Q&A๋ ๋ฌด์์ธ๊ฐ์?
- ์ด๋ฏธ์ง์ ์ง๋ฌธ(์์ฐ์ด)์ด ์ฃผ์ด์ง๋ฉด ์ด๋ฏธ์ง์ ๋ด์ฉ์ ๋ฐํ์ผ๋ก ์ง๋ฌธ์ ๋ํ ๋ต(์์ฐ์ด)์ ์ ์ํ๋ ๋ชจ๋ธ
- [paper]
- Image Captioning์ ๋ฌด์์ธ๊ฐ์?
- ์ด๋ฏธ์ง๋ฅผ ์ค๋ช ํ๋ ํ ์คํธ๋ฅผ ์์ฑํ๋ ์๊ณ ๋ฆฌ์ฆ
- Fully Connected Layer์ ๊ธฐ๋ฅ์ ๋ฌด์์ธ๊ฐ์?
- ํฉ์ฑ๊ณฑ์ธต์์ ์ถ์ถ๋ ํน์ง์ ํ ๋๋ก ์ด๋ฏธ์ง๋ฅผ ๋ถ๋ฅํจ
- Neural Style Transfer๋ ์ด๋ป๊ฒ ์งํ๋ ๊น์?
- ์คํ์ผ ์ด๋ฏธ์ง์ ์คํ์ผ์ ์ถ์ถํ์ฌ ์ฝํ ํธ ์ด๋ฏธ์ง์ ์ ์ฉ
- CNN์ ๋ํด์ ์๋๋๋ก ์๊ธฐํ๋ผ
- CNN์ด MLP๋ณด๋ค ์ข์ ์ด์ ๋?
- MLP๋ฅผ ์ฌ์ฉํ๋ฉด (1) 2์ฐจ์ ์ด๋ฏธ์ง๊ฐ 1์ฐจ์ ๋ฒกํฐ๋ก ๋ฐ๋๋ฉฐ ์์ค๋๋ feature(๊ณต๊ฐ์ ํน์ง)๊ฐ ๋ง๋ค (2) ์ด๋ฏธ์ง์ ํฌ๊ธฐ๊ฐ ์ปค์ง์๋ก, ๊น์ด ์์์๋ก ํ๋ผ๋ฏธํฐ์ ์๊ฐ ๊ธ๊ฒฉํ ์ฆ๊ฐํ๋ค
- CNN: 2์ฐจ์ ๊ตฌ์กฐ์ ์ ๋ณด๋ฅผ ์์ง ์์ผ๋ฉด์๋ MLP(FCL)์ ๋นํด ํ๋ผ๋ฏธํฐ์ ์๊ฐ ์ ๋ค
- ์ด๋ค CNN์ ํ๋ผ๋ฏธํฐ ๊ฐ์๋ฅผ ๊ณ์ฐํด ๋ณธ๋ค๋ฉด?
- kernel params + bias params:
(kernel_h * kernel_w) * num_input_channels * num_filters + num_filters
- kernel params + bias params:
- ์ฃผ์ด์ง CNN๊ณผ ๋๊ฐ์ MLP๋ฅผ ๋ง๋ค ์ ์๋?
- ํ๋ง์์ ๋ง์ฝ Max๋ฅผ ์ฌ์ฉํ๋ค๋ฉด ๊ทธ ์ด์ ๋?
- pooling window ๋ด์์ ๊ฐ์ฅ ํน์ง์ ์ธ ๊ฐ์ ํตํด ์ ๋ ฅ ์ด๋ฏธ์ง์ ํน์ฑ์ ์ถ์ถํจ
- ์ํ์ค ๋ฐ์ดํฐ์ CNN์ ์ ์ฉํ๋ ๊ฒ์ด ๊ฐ๋ฅํ ๊น?
- CNN์ด MLP๋ณด๋ค ์ข์ ์ด์ ๋?
- CV models
- AlexNet: 5 CNN layers & 3 FC layers. Relu, image augmentation, Batch Normalization, dropout, L2 regularization
- VGGNet: same hyper-parameters through the whole convolution and pooling layers
- GoogLeNet: ๋ค์ํ ํฌ๊ธฐ์ ์ปค๋์ ๋์์ ์ฌ์ฉํ๊ณ reduce layer๊ฐ ์ ์ฉ๋ inception module ์ฌ์ฉ
- ResNet: Gradient vanishing ๋ฌธ์ ํด๊ฒฐ์ ์ํด Residual block(skip connection) ๋์
- MobileNet: ๋ชจ๋ธ ๊ฒฝ๋ํ๋ฅผ ์ํด Depthwise separable convolution ๋์
- EfficientNet: ์ ๊ฒฝ๋ง์ ์ธต์, ์ ๋ ฅ ์ด๋ฏธ์ง ํฌ๊ธฐ, ํฉ์ฑ๊ณฑ์ธต ํํฐ์ ์ ๋ฑ์ ์ต์ ํ
- One Hot ์ธ์ฝ๋ฉ์ ๋ํด ์ค๋ช
ํด์ฃผ์ธ์
- ํ ํน์ฑ์ unique value๊ฐ N๊ฐ๋ผ๊ณ ํ ๋, ๊ทธ ํน์ฑ์ 0๊ณผ 1๋ก ๊ตฌ์ฑ๋ N์ฐจ์์ ๋ฒกํฐ๋ก ํํํ๋ ๋ฐฉ๋ฒ
- POS ํ๊น
์ ๋ฌด์์ธ๊ฐ์? ๊ฐ์ฅ ๊ฐ๋จํ๊ฒ POS tagger๋ฅผ ๋ง๋๋ ๋ฐฉ๋ฒ์ ๋ฌด์์ผ๊น์?
- part-of-speech ์ฆ ํ์ฌ ํ๊น
- POS tagger๋ฅผ ๋ง๋๋ ๋ฐฉ๋ฒ
- ๋ฐ์ดํฐ์ : tokenized๋ ๋ฌธ์ฅ๊ณผ ๊ฐ ํ ํฐ์ ๋์๋๋ ํ์ฌ๋ก ๊ตฌ์ฑ๋ ๋ฐ์ดํฐ
- ๋ชจ๋ธ: RNN, LSTM ๋ฑ
- ๋ฌธ์ฅ์์ "Apple"์ด๋ ๋จ์ด๊ฐ ๊ณผ์ผ์ธ์ง ํ์ฌ์ธ์ง ์๋ณํ๋ ๋ชจ๋ธ์ ์ด๋ป๊ฒ ํ๋ จ์ํฌ ์ ์์๊น์?
- ๊ฐ์ฒด๋ช ์ธ์ ๋ชจ๋ธ์ ๊ตฌ์ถ
- ๋ด์ค ๊ธฐ์ฌ์ ์ธ์ฉ๋ ํ ์คํธ์ ๋ชจ๋ ํญ๋ชฉ์ ์ด๋ป๊ฒ ์ฐพ์๊น์?
- ์์ฑ ์ธ์ ์์คํ ์์ ์์ฑ๋ ํ ์คํธ๋ฅผ ์๋์ผ๋ก ์์ ํ๋ ์์คํ ์ ์ด๋ป๊ฒ ๊ตฌ์ถํ ๊น์?
- ์ ์ฌ๋ก ์ , ์๋ฏธ๋ก ์ ์์ธ์ ๋ฌด์์ด๊ณ ์ด๋ป๊ฒ ์ ์ฉํ ์ ์์๊น์?
- ์์ด ํ
์คํธ๋ฅผ ๋ค๋ฅธ ์ธ์ด๋ก ๋ฒ์ญํ ์์คํ
์ ์ด๋ป๊ฒ ๊ตฌ์ถํด์ผ ํ ๊น์?
- ์๊ณ ๋ฆฌ์ฆ: ๋ค๋๋ค ๋ชจ๋ธ. seq2seq, transformer ๋ฑ
- ๋ด์ค ๊ธฐ์ฌ๋ฅผ ์ฃผ์ ๋ณ๋ก ์๋ ๋ถ๋ฅํ๋ ์์คํ
์ ์ด๋ป๊ฒ ๊ตฌ์ถํ ๊น์?
- ํ ํฝ ๋ชจ๋ธ๋ง
- BoW ๊ธฐ๋ฐ: LSA, LDA ๋ฑ
- BERT ๊ธฐ๋ฐ: SBERT(๋ฌธ์ฅ ์๋ฒ ๋ฉ), CTM(Contextualized Topic Models), BERTopic ๋ฑ
- Stop Words๋ ๋ฌด์์ผ๊น์? ์ด๊ฒ์ ์ ์ ๊ฑฐํด์ผ ํ๋์?
- ๋ง๊ณผ ๋ง ์ฌ์ด์ ๊ด๊ณ, ๋ฌธ๋ฒ์ ๊ด๊ณ ๋ฑ์ ๋ํ๋ด๋ ๋ง
- ํน์ ํ ์๋๋ฅผ ๊ฐ์ง ๋ฌธ์ฅ์๋ง ๋ํ๋์ง ์๊ณ ๋๋ฃจ ๋ฑ์ฅ. ํ๊ตญ์ด์ ์กฐ์ฌ, ์ ์์ฌ ๋ฑ
- ํ ์คํฌ์ ๊ธฐ์ดํ์ฌ ํน์ ํ์คํฌ๋ฅผ ์ํํ๋ ๋ฐ ๋์์ด ๋์ง ์์. ๊ทธ๋ฌ๋ ์์ฃผ ๋ฑ์ฅํ๋ฏ๋ก ์ด๋ฅผ ์ ๊ฑฐํ์ง ์์ผ๋ฉด ๋ชจ๋ธ๋ง ์ ์์์ด ๋ถํ์ํ๊ฒ ์๋ชจ๋จ
- ๋ถ์ฉ์ด๋ฅผ ํ๋จํ๋ ์ ๋์ ๊ธฐ์ค์ ์์. ํ์คํฌ๋ ๋ฐ์ดํฐ์ ํน์ฑ์ ๋ง๊ฒ ์ค์ ํด์ผ ํจ
- ์ํ ๋ฆฌ๋ทฐ๊ฐ ๊ธ์ ์ ์ธ์ง ๋ถ์ ์ ์ธ์ง ์์ธกํ๊ธฐ ์ํด ๋ชจ๋ธ์ ์ด๋ป๊ฒ ์ค๊ณํ์๊ฒ ๋์?
- ๊ธ์ ํน์ ๋ถ์ ์ผ๋ก labeling๋ ์์ฐ์ด ๋ฌธ์ฅ ๋ฐ์ดํฐ์ ์ค๋น
- ํ ์คํธ ์ ์ฒ๋ฆฌ: tokenizing, encoding, stop words ์ ๊ฑฐ ๋ฑ
- ํ์ต ๋ฐ ๋ชจ๋ธ๋ง ๊ฒ์ฆ
- TF-IDF ์ ์๋ ๋ฌด์์ด๋ฉฐ ์ด๋ค ๊ฒฝ์ฐ ์ ์ฉํ๊ฐ์?
- ํ๊ตญ์ด์์ ๋ง์ด ์ฌ์ฉ๋๋ ์ฌ์ ์ ๋ฌด์์ธ๊ฐ์?
- Regular grammar๋ ๋ฌด์์ธ๊ฐ์? regular expression๊ณผ ๋ฌด์จ ์ฐจ์ด๊ฐ ์๋์?
- RNN์ ๋ํด ์ค๋ช
ํด์ฃผ์ธ์
- Recurrent Neural Network
- ํ์์ ์ ๊ฒฐ๊ณผ๋ฅผ ์์ธกํ๋ ๋ฐ ํ์์ ์ ์ ๋ ฅ๊ฐ๊ณผ ์ด์ ์์ ์ ์๋ ์ํ๋ฅผ ํจ๊ป ๊ณ ๋ คํ๋ ๋ชจ๋ธ
-
- Problem of long-term dependencies: ์์ ์ด ๊ธธ์ด์ง๋ฉด ์ด๊ธฐ ์์ ์ ์ ๋ณด๊ฐ ์์ค๋๋ ๋ฌธ์ ๋ฐ์
- ํ์์ ์ ์์ธกํ๋ ๋ฐ ์ค์ํ ๋ถ๋ถ๊ณผ ํ์์ ์ฌ์ด ๊ฑฐ๋ฆฌ๊ฐ ๊ธธ์ด์ง๋ฉด ์ฑ๋ฅ ํ๋ฝ
- LSTM์ ์ ์ ์ฉํ๊ฐ์?
- Long-Short Term Memory network
- long-term dependencies๋ฅผ ํ์ตํ๋ ๋ฐ ์ ํจํจ
- memory cell, input gate, forget gate, output gate
- implementation
- Translate ๊ณผ์ Flow์ ๋ํด ์ค๋ช ํด์ฃผ์ธ์
- n-gram์ ๋ฌด์์ผ๊น์?
- n๊ฐ์ ์ฐ์๋ ๋จ์ด๋ฅผ ํ๋์ ํ ํฐ์ผ๋ก ์ทจ๊ธ
- ์ธ์ด ๋ชจ๋ธ์์ ๋ฌธ์ฅ์ ๋ค์ ๋จ์ด๋ฅผ ์์ธกํ๋ ๋ฐ ํด๋น ๋จ์ด ์ง์ ๋ฑ์ฅํ N๊ฐ์ ๋จ์ด์ ๊ทผ๊ฑฐํ๋ ๋ฐฉ์. ๋ฌธ์ฅ ์ ์ฒด์ ๋งฅ๋ฝ์ ๊ณ ๋ คํ์ง ๋ชปํจ
- PageRank ์๊ณ ๋ฆฌ์ฆ์ ์ด๋ป๊ฒ ์๋ํ๋์?
- depedency parsing๋ ๋ฌด์์ธ๊ฐ์?
- Word2Vec์ ์๋ฆฌ๋?
- ์๋ฆฌ: ์ฃผ๋ณ(skip-gram) ํน์ ์ค์ฌ(CBOW) ๋จ์ด๋ฅผ ์์ธกํ๋ ์ธ๊ณต์ ๊ฒฝ๋ง์ ํ์ต, ๋จ์ด๋ฅผ ํน์ ์ฐจ์์ ์ค์ ๋ฒกํฐ๋ก ํํ. ๋จ์ด์ ์๋ฏธ๊ฐ ์์นํ๋๋ฉฐ ๋จ์ด ๊ฐ ์ ์ฌ๋๋ฅผ ๋น๊ตํ ์ ์์
- ๋จ์์ ์ฌ์๊ฐ ๊ฐ๊น์ธ๊น? ๋จ์์ ์๋์ฐจ๊ฐ ๊ฐ๊น์ธ๊น? - ํ์ตํ corpus์ ๋ฐ๋ผ ๋ค๋ฅผ ๊ฒ์ด๋ค
- ๋ฒ์ญ์ Unsupervised๋ก ํ ์ ์์๊น? - A์ธ์ด์ ๋จ์ด์ B์ธ์ด์ ๋จ์ด๊ฐ ๋์ผํ ๋ฒกํฐ ๊ณต๊ฐ์ ์๋ฒ ๋ฉ๋์ด ์๋ค๋ฉด, ๋จ์ด ๊ฐ ์ ์ฌ๋๋ฅผ ๋น๊ตํ๋ ๋ฐฉ์์ผ๋ก word-level ๋ฒ์ญ ๊ฐ๋ฅ
- NLP models.
- Seq2Seq ๊ณ์ด: RNN, LSTM, GRU ๋ฑ. ์ ๋ ฅ ๋๋ฉ์ธ์ ๋ฌธ์ฅ์ ์ถ๋ ฅ ๋๋ฉ์ธ์ผ๋ก ๋ฐ๊ฟ. ์ฅ๊ธฐ ๊ธฐ์ต ๋ฌธ์ , ๋ณ๋ ฌ ์ฒ๋ฆฌ ๋ถ๊ฐ ๋ฑ ๋ฌธ์ ๊ฐ ์กด์ฌ
- BERT: transformer encoder ์ฌ์ฉ. base - 12 layers, 768 dims. ์ฌ์ ํ์ต MLM, NSP
- Electra: ์ฌ์ ํ์ต Replaced token detection. generator & discriminator ๋คํธ์ํฌ ์ฌ์ฉ
- ์ถ์ฒ ์์คํ
์์ ์ฌ์ฉํ ์ ์๋ ๊ฑฐ๋ฆฌ๋ ๋ฌด์์ด ์์๊น์?
- cosine, jaccard, pearson, msd
- User ๋ฒ ์ด์ค ์ถ์ฒ ์์คํ
๊ณผ Item ๋ฒ ์ด์ค ์ถ์ฒ ์์คํ
์ค ๋จ๊ธฐ๊ฐ์ ๋น ๋ฅธ ํจ์จ์ ๋ผ ์ ์๋ ๊ฒ์ ๋ฌด์์ผ๊น์?
- item-based rec sys.
- ์ผ๋ฐ์ ์ผ๋ก ์ ์ ์ ์ซ์๋ ์์ดํ ์ซ์์ ๋นํด ๋งค์ฐ ํฌ๊ณ ๊ทธ ํน์ฑ ์ญ์ ๋ง๋ค. ๋๋ถ์ด ์์ ์ฃผ๊ธฐ์ ๋ฐ๋ผ ํน์ฑ์ด ๋ณํ๋ค
- ์ฑ๋ฅ ํ๊ฐ๋ฅผ ์ํด ์ด๋ค ์งํ๋ฅผ ์ฌ์ฉํ ๊น์?
- ์ ํ๋: mae, rmse
- ๋ญํน: hite rate, ndcg
- diversity
- novelty
- Explicit Feedback๊ณผ Implicit Feedback์ ๋ฌด์์ผ๊น์? Impicit Feedback์ ์ด๋ป๊ฒ Explicitํ๊ฒ ๋ฐ๊ฟ ์ ์์๊น์?
- explicit: ์ ์ ๊ฐ ํน์ ์์ดํ ์ ๋ํ ํธ๋ถํธ๋ฅผ ๋ช ์์ ์ผ๋ก ํํ. ์ข์์/์ซ์ด์, ํ์ ๋ฑ
- implicit: ์ ์ ์ ์์ดํ ๊ฐ์ ์ํธ์์ฉ. ์์ดํ ์กฐํ, ๊ตฌ๋งค ๋ฑ
- ํน์ ํ ๋ก์ง์ ์ค์ ํ๊ณ ๊ทธ์ ๋ฐ๋ผ implicit์ ํตํด explicit ์ถ์
- Matrix Factorization์ ๋ฌด์์ธ๊ฐ์? ํด๋น ์๊ณ ๋ฆฌ์ฆ์ ์ฅ์ ๊ณผ ๋จ์ ์?
- Utility matrix๋ฅผ user latent matrix์ item latent matrix์ ๊ณฑ์ผ๋ก ํํ
- ์ฅ์ : ๋น๊ต์ ๋์ ์ ํ๋, ํ์ฅ์ฑ(scalable), sparse dataset์๋ ์ ์ฉ ๊ฐ๋ฅ
- ๋จ์ : ์์ดํ ํน์ ์ ์ ์ ํน์ฑ์ ๋ฐ์ํ ์ ์์, cold start
- SQL์ผ๋ก ์กฐํ ๊ธฐ๋ฐ Best, ๊ตฌ๋งค ๊ธฐ๋ฐ Best, ์นดํ ๊ณ ๋ฆฌ๋ณ Best๋ฅผ ๊ตฌํ๋ ์ฟผ๋ฆฌ๋ฅผ ์์ฑํด์ฃผ์ธ์
- ์ถ์ฒ ์์คํ
์์ KNN ์๊ณ ๋ฆฌ์ฆ์ ํ์ฉํ ์ ์์๊น์?
- profile, latent factors ๋ฑ์ ์ด์ฉํด ์ ์ ๋ ์์ดํ ์ ๋ฒกํฐ ๊ณต๊ฐ์ ์๋ฒ ๋ฉํ ์ ์๋ค๋ฉด ๋ฒกํฐ ๊ฐ ์ ์ฌ๋(๊ฑฐ๋ฆฌ) ์ธก์ ๊ฐ๋ฅ
- ์ด๋ฅผ ๋ฐํ์ผ๋ก ์ต๊ทผ์ ์ด์์ ์ถ์ถ
- ์ ์ ๊ฐ 10๋ง๋ช , ์์ดํ ์ด 100๋ง๊ฐ ์์ต๋๋ค. ์ด ๊ฒฝ์ฐ ์ถ์ฒ ์์คํ ์ ์ด๋ป๊ฒ ๊ตฌ์ฑํ์๊ฒ ์ต๋๊น?
- ๋ฅ๋ฌ๋์ ํ์ฉํ ์ถ์ฒ ์์คํ ์ ์ฌ๋ก๋ฅผ ์๋ ค์ฃผ์ธ์
- ๋ ์ถ์ฒ์์ง๊ฐ์ ์ฑ๋ฅ ๋น๊ต๋ ์ด๋ค ์งํ์ ๋ฐฉ๋ฒ์ผ๋ก ํ ์ ์์๊น์? ๊ฒ์์์ง์์ ์ฐ๋ ๋ฐฉ๋ฒ์ ๊ทธ๋๋ก ์ฐ๋ฉด ๋ ๊น์? ์๋ ๊น์?
- Collaborative Filtering์ ๋ํด ์ค๋ช
ํ๋ค๋ฉด?
- ํ ์์ดํ ํน์ ์ ์ ์ ์ ์ฌํ ์์ดํ /์ ์ ๋ฅผ ์ฐพ์ rating์ ์ถ์
- ๋จ์ : cold start, sparsity, popularity bias, ์ต๊ทผ์ ์ด์ ์ถ์ถ ์ ์ปดํจํ ๋ฆฌ์์ค ์๋ชจ ํผ
- Cold Start์ ๊ฒฝ์ฐ์ ์ด๋ป๊ฒ ์ถ์ฒํด์ค์ผ ํ ๊น์?
- ์ ๊ท ์์ดํ : item profile ํ์ฉํด ์ ์ฌํ ์์ดํ ์ถ์ถ
- ์ ๊ท ์ ์ : popular item ์ถ์ฒ, ํ์๊ฐ์ ์ ์ค๋ฌธ์กฐ์ฌ
- ๊ณ ๊ฐ์ฌ๋ค์ ๊ธฐ์กด ์ถ์ฒ์๋น์ค์ ๋ํ ์๋ฌธ์ด ์์ต๋๋ค. ์ฃผ๋ก ๋งค์ถ์ด ์ค์ ์ค๋ฅด๋๊ฐ ํ๋ ๊ฒ์ธ๋ฐ, ์ด๋ฅผ ๊ฒ์ฆํ๊ธฐ ์ํ ๋ฐฉ๋ฒ์๋ ์ด๋ค ๊ฒ์ด ์์๊น์? ์ ๊ด์ ์์ ์ฐ๋ฆฌ ์๋น์ค์ ์ฑ๋ฅ์ ๊ณ ๊ฐ์๊ฒ ๋ช ํํ๊ฒ ์ธ์ง์ํค๊ธฐ ์ํ ๋ฐฉ๋ฒ์ ์๊ฐํด๋ด ์๋ค.
- PostgreSQL์ ์ฅ์ ์ ๋ฌด์์ผ๊น์?
- ์ธ๋ฑ์ค๋ ํฌ๊ฒ Hash ์ธ๋ฑ์ค์ B+Tree ์ธ๋ฑ์ค๊ฐ ์์ต๋๋ค. ์ด๊ฒ์ ๋ฌด์์ผ๊น์?
- ์ธ๋ฑ์ค Scan ๋ฐฉ์์ ๋ฌด์์ด ์๋์?
- ์ธ๋ฑ์ค ์ค๊ณ์ NULL๊ฐ์ ๊ณ ๋ ค๋์ผ ํ ๊น์?
- Nested Loop ์กฐ์ธ์ ๋ฌด์์ผ๊น์?
- Windows ํจ์๋ ๋ฌด์์ด๊ณ ์ด๋ป๊ฒ ์์ฑํ ๊น์?
- KNN ์๊ณ ๋ฆฌ์ฆ์ ์ฟผ๋ฆฌ๋ก ๊ตฌํํ ์ ์์๊น์?
- MySQL์์ ๋๋์ ๋ฐ์ดํฐ(500๋ง๊ฐ ์ด์)๋ฅผ Insertํด์ผํ๋ ๊ฒฝ์ฐ์ ์ด๋ป๊ฒ ํด์ผํ ๊น์?
- RDB์ char์ varchar์ ์ฐจ์ด๋ ๋ฌด์์ผ๊น์?
- ๊ตฌ๊ธ์ BigQuery, AWS์ Redshift๋ ๊ธฐ์กด RDB์ ๋ฌด์จ ์ฐจ์ด๊ฐ ์์๊น์? ์ ๋น ๋ฅผ๊น์?
- ์ฟผ๋ฆฌ์ ์ฑ๋ฅ์ ํ์ธํ๊ธฐ ์ํด ์ด๋ค ์ฟผ๋ฆฌ๋ฌธ์ ์์ฑํด์ผ ํ ๊น์?
- MySQL์ด ์์ ๋๋ฆฌ๋ค๋ ์ ๊ณ ๊ฐ ๋ค์ด์์ต๋๋ค. ์ฒซ๋ฒ์งธ๋ก ๋ฌด์์ ํ์ธํ์๊ณ ์กฐ์ ํ์๊ฒ ๋์?
- ๋์ํ๋ MySQL์ Alter table์ ํ๋ฉด ์๋๋ ์ด์ ๋ฅผ ์ค๋ช ํด์ฃผ์ธ์. ๊ทธ๋ฆฌ๊ณ ๋์์ ์ค๋ช ํด์ฃผ์ธ์
- ๋นก์ธ๊ฒ ๋์ํ๊ณ ์๋ MySQL์ ๋ฐฑ์ ๋จ๊ธฐ ์ํด์๋ ์ด๋ค ๋ฐฉ๋ฒ์ด ํ์ํ ๊น์?
- ๋คํธ์ํฌ ๊ด๊ณ๋ฅผ ์๊ฐํํด์ผ ํ ๊ฒฝ์ฐ ์ด๋ป๊ฒ ํด์ผํ ๊น์?
- Tableau๊ฐ์ BI Tool์ ์ด๋ ๊ฒฝ์ฐ ๋์ ํ๋ฉด ์ข์๊น์?
- "์ ๊ท/์ฌ๋ฐฉ๋ฌธ์๋ณ ์ง์ญ๋ณ(ํน์ ์ผ๋ณ) ๋ฐฉ๋ฌธ์์์ ๊ตฌ๋งค์ ํ์จ"์ด๋ "๊ณ ๊ฐ๋ฑ๊ธ๋ณ ์ต๊ทผ๋ฐฉ๋ฌธ์ผ๋ณ ๊ณ ๊ฐ์์ ํ๊ท ๊ตฌ๋งค๊ธ์ก"์ ๊ฐ์ด 4๊ฐ์ง ์ด์์ ์ ๋ณด๋ฅผ ์๊ฐํํ๋ ๊ฐ์ฅ ์ข์ ๋ฐฉ๋ฒ์ ์ถ์ฒํด์ฃผ์ธ์
- ๊ตฌ๋งค์ ์ํฅ์ ์ฃผ๋ ์์์ ๋ฐ๊ฒฌ์ ์ํ ๊ด์ ์์, ๊ฐ์ธ์ ๋ํ ์ผํ๋ชฐ ์น ํ๋์ ์๊ณ์ด ๋ฐ์ดํฐ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ์๊ฐํํ๊ธฐ ์ํ ๋ฐฉ๋ฒ์ ๋ฌด์์ผ๊น์? ํํ๋์ด์ผ ํ๋ ์ ๋ณด(feature)๋ ์ด๋ค ๊ฒ์ผ๊น์? ์ค์ ์ ์ด๋ค ๊ฒ์ด ๊ฐ์ฅ ๊ณ ๋ฏผ๋ ๊น์?
- ํ์ด์ฐจํธ๋ ์ ๊ตฌ๋ฆด๊น์? ์ธ์ ๊ตฌ๋ฆฐ๊ฐ์? ์๊ตฌ๋ฆด๋๋ ์ธ์ ์ธ๊ฐ์?
- ํ์คํ ๊ทธ๋จ์ ๊ฐ์ฅ ํฐ ๋ฌธ์ ๋ ๋ฌด์์ธ๊ฐ์?
- ์๋ํด๋ผ์ฐ๋๋ ๋ณด๊ธฐ์ ์์์ง๋ง ์ฝ์ ์ด ์์ต๋๋ค. ์ด๋ค ์ฝ์ ์ผ๊น์?
- ์ด๋ค 1์ฐจ์๊ฐ์ด, ๋ฐ์ดํฐ๊ฐ ๋ชฐ๋ ค์์ด์ ์ง์ ์์ ํํํ์ ๋ ๋ณด๊ธฐ๊ฐ ์ฝ์ง ์์ต๋๋ค. ์ด๋ป๊ฒ ํด์ผํ ๊น์?
- ๊ณ ๊ฐ์ด ๊ถ๊ธํ๋ค๊ณ ๋งํ๋ ์์๊ฐ ๋ด๊ฐ ์๊ฐํ๊ธฐ์๋ ์ค์ํ์ง ์๊ณ ๋ค๋ฅธ ๋ถ๋ถ์ด ๋ ์ค์ํด ๋ณด์ ๋๋ค. ์ด๋ค ์์ผ๋ก ๋ํ๋ฅผ ํ์ด๋๊ฐ์ผ ํ ๊น์?
- ํ์ ์นด์ดํฐ ํํธ์ ์์ฃผ ๋ง๋๋ฉฐ ์คํจํ ๋ถ์๊น์ง ๊ฐ์ด ๊ณต์ ํ๋ ๊ฒฝ์ฐ์, ์๊ฐ์ ๋๊ณ ๋ฉ์ง ๊ฒฐ๊ณผ๋ง ๊ณต์ ํ๋ ์ผ์ด์ค์์ ๋ฌด์์ ์ ํํ์๊ฒ ์ต๋๊น?
- ๊ณ ๊ฐ์ด ์ง๋ฌธ์ง ๋ฆฌ์คํธ๋ฅผ 10๊ฐ๋ฅผ ์ฃผ์์ต๋๋ค. ์ด๋ค ๊ธฐ์ค์ผ๋ก ์ฐ์ ์์๋ฅผ ์ ํด์ผ ํ ๊น์?
- ์คํ๋ผ์ธ ๋ฐ์ดํฐ๊ฐ ๊ฒฐํฉ์ด ๋์ด์ผ ํด์, ๋ฐ์ดํฐ์ ํผ๋๋ฐฑ ์ฃผ๊ธฐ๊ฐ ๋งค์ฐ ๋๋ฆฌ๊ณ ์ ํฉ์ฑ๋ ์์ฌ๋๋ ์ํฉ์ ๋๋ค. ์ฐ๋ฆฌ๊ฐ ํ ์ ์๋ ์ก์ ์ด๋ ๋ฐฉํฅ ์์ ์ ๋ฌด์์ผ๊น์?
- ๋์์ ์ฌ๋ฌ๊ฐ์ A/Bํ ์คํธ๋ฅผ ๋๋ฆฌ๊ธฐ์ ๋ชจ์๊ฐ ๋ถ์กฑํ ์ํฉ์ ๋๋ค. ์ด๋ป๊ฒ ํด์ผํ ๊น์?
- ๊ณ ๊ฐ์ฌ๊ฐ ๊ณผ๋ํ๊ฒ ์ ๋ณด์ฑ ๋์๋ณด๋๋ง์ ์์ฒญํ ๊ฒฝ์ฐ, ์ด๋ป๊ฒ ๋์ฒํด์ผ ํ ๊น์?
- ๊ณ ๊ฐ์ฌ์๊ฒ ์ํด๋ฆฌ ๋ฆฌํฌํธ๋ฅผ ์ ๊ณตํ๊ณ ์์๋๋ฐ, ๊ธ์ฃผ์๋ ๋ณ๋ค๋ฅธ ๋ด์ฉ์ด ์์์ต๋๋ค. ์ด๋ป๊ฒ ํ ๊น์?
- ์นดํ24, ๋ฉ์ดํฌ์ต ๊ฐ์ ์๋น์ค์์ ๋ฐ์ดํฐ๋ฅผ ์ด๋ป๊ฒ ๊ฐ์ ธ์ค๋ฉด ์ข์๊น์?
- ๊ธฐ์กด์ ๊ฐ์ ๋ชฉ์ ์ ์ ๋ฌด๋ฅผ ์ํํ๋ ์กฐ์ง์ด ์์ต๋๋ค. ์ด๋ป๊ฒ ๊ด๊ณ ํ์ฑ์ ํด ๋๊ฐ์ผ ํ ๊น์. ํน์ ์ผ์ด ๋๊ฒ ํ๊ธฐ ์ํด์๋ ์ด๋ค ๋ถ๋ถ์ด ํด์๋์ด์ผ ํ ๊น์.
- ์ธํฐ๋ทฐ๋ ๊ฐ์์ ํ์ฉํ๊ธฐ ์ํ ๋ฐฑ๋ฐ์ดํฐ๋ ์ด๋ ์์ค๊น์ง ์ผ๋ฐํ ํด์ ์ฌ์ฉํด์ผ ํ ๊น์?
- ๊ณ ๊ฐ์ฌ๊ฐ ์ฐ๋ฆฌ์ ์ผํ๊ณ ์ถ์๋ฐ ํ์ฌ๋ capa๊ฐ ๋์ง ์์ต๋๋ค. ์ด๋ป๊ฒ ๋์ฒํด์ผ ํ ๊น์?
- ์ด๋ค ์ ๋ณด๋ค์ด ๊ฐ์ธ์ ๋ณด์ ํด๋นํ ๊น์? ID๋ ๊ฐ์ธ์ ๋ณด์ ํด๋นํ ๊น์? ์ด๋ฅผ ์ด๊ธฐ์ง ์๋ ํฉ๋ฒ์ ๋ฐฉ๋ฒ์ผ๋ก ์๋ณํ๊ณ ์ถ์ผ๋ฉด ์ด๋ป๊ฒ ํด์ผํ ๊น์?
- ๊ตญ๋ด ๊ฐ์ธ ์ ๋ณด ๋ณดํธ ํํฉ์ ๋ํ ๊ฒฌํด๋ ์ด๋ ํ์ง์? ๋ง์ฝ ์ฌ์ ์ ์งํํ๋๋ฐ ์ฅ์ ์์๋ก ์์ฉํ๋ค๋ฉด, ์ด์ ๋ํ ํด๊ฒฐ ๋ฐฉ์์ ์ด๋ค ๊ฒ์ด ์์๊น์?
- ์ 3์ ์ฟ ํค๋ ์ ๋ฌธ์ ๊ฐ ๋๋์?
- ํ์ฉํธ๋ ์๋ฃ
- ๋จ์ธ๋๋ ์๋ฃ
- Data Science Interview Questions & Detailed Answers
- Deep Learning Interview Questions and Answers
- Must know questions deeplearning : ๊ฐ๊ด์ ๋ฅ๋ฌ๋ ๋ฌธ์
- My deep learning job interview experience sharing
- Natural Language Processing Engineer Interview Questions