-
Likelihood(우도, 가능도)와 MLE(Maximum Likelihood Estimaton)ML&DL 이야기/ML 2023. 7. 26. 17:51
Likelihood(우도, 가능도)
데이터가 만일 위의 그림처럼 1,4,5,6,9가 나왔을 때 분포는 주황색으로 추정하는 것이 옳을까?, 아니면 파란색으로 추정하는 것이 좋을까?
우도란 이런 정도를 나타내는 것으로, 정리하면
"데이터가 해당 분포로 부터 나왔을 가능성(liklihood)"
확률은 모수가 정해진 상태에서 특정 data가 관측될 확률이고(말이 이상하지만..!), Likelihood는 Data가 관측된 상태에서 특정 확률분포에 대한 "모수"를 추정할 수 있는 믿음의 정도..?이다.
즉, 특정 모수 하의 x가 나올 확률은 x에 관한 모수의 가능도와 같다!
우리가 가지고 있는 데이터는
MLE(최대 우도 법)최대우도법은 모수를 추정하는 방법으로, 데이터로부터 모수의 값을 추정할 때 사용하는 방법니다.
위의 주황색과 파란색 분포 부분을 다시 보자.
주황색의 경우 p(x)의 값이 큰 부분에 데이터들이 모여있기 때문에 해당 데이터들의 우도의 합은 파란색 분포일 때 보다 높을 것이다.
따라서 우리는 주황색 분포라고 예측하는 것이 더 옳을 것이다.
이를 수식으로 표현하면
아래와 같고. (2)와 달리 (3)의 경우 log를 씌워서 합으로 정의한 log likelihood라고 한다.
log를 사용하면 l ikelihood 식이 덧셈으로 변합니다. 또한 지수값이 곱셈으로 변화한다. 이는 연산을 용이하고 직관적으로 만들어준다.
(2)에서 곱하는 이유는 사건, 데이터를 뽑는 경우가 모두 iid이기 때문이다. 즉 독립사건임을 가정하기에 모든 데이터를 뽑는 경우는 이들의 곱으로 표현가능하다(결합확률분포를 생각해보자)
MLE 계산해보기
그럼 최대는 어떻게 구할까?? Likelihood 식을 미분해서 0인 지점을 찾으면 된다(2학년 때 통계 때 정규분포를 다 곱하고 미분을 했던 기억을 살리며..)
즉,
위 식을 풀고 값이 0이 될 때의 세타, 모수를 찾으면 된다.
출처:
최대우도법 소개:
https://angeloyeo.github.io/2020/07/17/MLE.html
우도 소개:
'ML&DL 이야기 > ML' 카테고리의 다른 글
[ML] Convolution 합성곱의 정의와 FFT 고속푸리에 변환에 관하여 (1) 2023.10.08 [ML] Regression과 Logit(승수)와 Sigmoid함수 그리고 Softmax함수 (0) 2023.10.02 [ML] Entropy와 Likelihood관점에서의 Loss function (0) 2023.10.02 [ML] Optimizer란 무엇인가 (0) 2023.08.24 [ML] L1함수와 L2함수 입장에서의 Loss Funtion (0) 2023.07.25