아래 두가지로 나뉜다.
1. 사용자 기반(user based)
특정 사용자들의 특성들에 대해서 연결성을 지어낸다.
2. 아이템 기반(item based)
특정한 물건에 대해서 연결성을 지어낸다.
비지도 학습 알로리즘은 같지만 묶는것들 다르게함
비지도 학습은 예측을 못한다 예측을 못한다는건 성능평가를 못낸다고 할 수 있다. 이유는 - target이 없기 때문이다.
대신 비슷한 값끼리 그룹핑을 할 수 있다.
1. 사용자가 선호라는 상품과 유사한 다른 상품을 추천한다.
2. 사용자와 유사한 다른 사용자가 선호하는 상품을 추천한다.
사용자 기반 방식 [단점]
1. 계산복잡성 문제
2. 희소성 문제
유사도 설명
우영이가 아이언맨을 안 봤지만 명재랑 특성이 비슷하게 액션물을 좋아함. 그래서 아마 액셜물을 좋아하는 우영이도 아이언맨의 평점을 8과 가깝게 만족할것을 예상 해 볼수 있다.
서로 갖고 있는 것들을 서로에게 추천 할 수 있다.
우유(a>b)와 딸기잼(b>a)
정보수집
정보수집에는 명시적 정보와 암시적 정보가 있다.
명시적 정보는 예를들어 넷플릭스를 가입할때 맨처음에 액션, 로맨스 등등의 정보를 선택할때 정보를 말한다.
암시적 정보는 예를들어 넥플릭스영화를 보기위해 클릭했다가 타입이 아닌거 같아서 나올때에 입력된 정보를 말한다.
유사도 공식들 종류
피어슨 상관계수와 코사인 유사도를 가장 많이 사용한다.
코사인 유사도
-1 0 1 로 유사로를 알 수 있다.
-1,0 은 유사도가 없다고 볼 수 있다.
1에 가까울 수록 유사도가 높다.
참고 블로그
'workSpace > PYTHON' 카테고리의 다른 글
[DL] Linear Classification, Forward propagation, Full loss Function (0) | 2021.01.27 |
---|---|
[DL] Knowledge and Algorithm Overview (0) | 2021.01.27 |
[DL] Ensemble, Matrix Confusion and Linear Regression (0) | 2021.01.25 |
[DL] SNN의 구조 및 분류와 회귀, 수식적 이해와 작동원리 (0) | 2021.01.23 |
[DL] 딥러닝의 이해 (0) | 2021.01.22 |