Estimasi kemungkinan maksimum

Dalam statistika, estimasi kemungkinan maksimum atau estimasi maksimum likelihood adalah metode mengestimasi parameter dari suatu distribusi peluang yang diasumsi apabila diketahui data hasil observasi. Metode ini didapatkan dengan memaksimalisasikan suatu fungsi likelihood, sehingga di bawah penggambaran pemodelan statistika, data hasil observasi itu yang mungkin terjadi. Berdasarkan hasil estimasi tersebut, terdapat titik berada di dalam ruang parameter yang memaksimumkan fungsi likelihood, dan titik itulah yang dinamakan estimasi maksimum likelihood.^[1] Logika dibalik metode ini bersifat intuitif dan fleksibel, sehingga kegunannya menjadi peran penting dalam inferensi statistik.^[2]^[3]^[4]

Prinsip

Himpunan observasi dimodelkan sebagai sampel acak dari distribusi peluang gabungan yang tidak diketahui, dinyatakan sebagai kumpulan parameter. Tujuan estimasi maksimum likelihood adalah untuk menentukan parameter, sehingga data hasil observasi memiliki peluang gabungan tertinggi. Disini, parameter yang menentukan distribusi gabungan dinyatakan dalam bentuk vektor $\theta =\left[\theta _{1},\,\theta _{2},\,\ldots ,\,\theta _{k}\right]^{\mathsf {T}}$ sehingga distribusi tersebut termasuk suatu keluarga parametrik $\{f(\cdot \,;\theta )\mid \theta \in \Theta \}$ , dengan $\Theta$ adalah ruang parameter, yakni subhimpunan berdimensi terhingga dari ruang Euklides. Mengevaluasi kepadatan gabungan pada sampel data hasil observasi $\;\mathbf {y} =(y_{1},y_{2},\ldots ,y_{n})\;$ memberikan suatu fungsi bernilai real, ${\displaystyle {\mathcal {L}}_{n}(\theta )={\mathcal {L}}_{n}(\theta$ yang dinamakan fungsi likelihood. Untuk variabel acak bebas, fungsi $f_{n}(\mathbf {y$ akan menjadi hasil kali dari fungsi-fungsi kepadatan univariat: $f_{n}(\mathbf {y$

Tujuan estimasi maksimum likelihood adalah mencari nilai dari parameter model yang memaksimalkan fungsi likelihood di ruang parameter.^[5] Dalam artian, ${\hat {\theta }}={\underset {\theta \in \Theta }{\operatorname {arg\;max} }}\,{\mathcal {L}}_{n}(\theta \,;\mathbf {y} )~.$

Secara intuitif, estimasi maksimum likelihood memilih nilai parameter yang menjadikan data hasil observasi mungkin terjadi. Nilai istimewa ${\hat {\theta }}={\hat {\theta }}_{n}(\mathbf {y} )\in \Theta$ yang memaksimalkan fungsi likelihood ${\mathcal {L}}_{n}$ dinamakan estimasi maksimum likelihood. Lebih lanjut, jika fungsi ${\hat {\theta }}_{n}:\mathbb {R} ^{n}\to \Theta$ yang didefinisikan sebagai fungsi terukurkan, maka fungsi itu adalah estimator maksimum likelihood. Suatu fungsi umumnya didefinisikan di ruang sampel, dalam artian mengambil suatu sampel yang diketahui sebagai argumennya. Adapun suatu syarat cukup tapi tak perlu mengenai keberadaannya, yakni bahwa fungsi likelihood adalah kontinu di suatu ruang parameter kompak $\Theta$ .^[6] Apabila ruang parameter $\Theta$ terbuka, fungsi likelihood dapat menaik tanpa benar-benar mencapai suatu nilai supremum.

Pada prakteknya, estimasi maksimum likelihood seringkali mudah dikerjakan bersamaan dengan logaritma natural dari fungsi likelihood, yang dinamakan log-likelihood: $\ell (\theta \,;\mathbf {y} )=\ln {\mathcal {L}}_{n}(\theta \,;\mathbf {y} )~.$ Karena fungsi logaritma bersifat monotonik, nilai maksimum dari fungsi $\ell (\theta \,;\mathbf {y} )$ muncul pada nilai yang sama dari $\theta$ , sebagaimana halnya dengan nilai maksimum dari ${\mathcal {L}}_{n}$ .^[7] Apabila fungsi $\ell (\theta \,;\mathbf {y} )$ terdiferensialkan di ruang parameter $\Theta$ , syarat yang perlu terjadinya maksimum (atau minimum) adalah ${\frac {\partial \ell }{\partial \theta _{1}}}=0,\quad {\frac {\partial \ell }{\partial \theta _{2}}}=0,\quad \ldots ,\quad {\frac {\partial \ell }{\partial \theta _{k}}}=0.$ Semua persamaan tersebut dinamakan persamaan likelihood. Untuk pemodelannya, persamaan-persamaan tersebut secara eksplisit dapat diselesaikan untuk ${\widehat {\theta \,}}$ . Akan tetapi, secara umum solusi bentuk tertutup untuk permasalahan maksimisasi masih belum diketahui, ataupun belum tersedia. Estimasi maksimum likelihood hanya dapat ditemukan melalui optimisasi numerik. Permasalahan lainnya adalah bahwa dalam sampel terhingga, terdapat banyak akar untuk persamaan likelihood.^[8] Menentukan akar ${\widehat {\theta \,}}$ dari persamaan-persamaan likelihood yang tentunya suatu maksimum (lokal) tergantung pada apakah matriks dari turunan parsial orde kedua dan parsial campuran $\mathbf {H} \left({\widehat {\theta \,}}\right)={\begin{bmatrix}\left.{\frac {\partial ^{2}\ell }{\partial \theta _{1}^{2}}}\right|_{\theta ={\widehat {\theta \,}}}&\left.{\frac {\partial ^{2}\ell }{\partial \theta _{1}\,\partial \theta _{2}}}\right|_{\theta ={\widehat {\theta \,}}}&\dots &\left.{\frac {\partial ^{2}\ell }{\partial \theta _{1}\,\partial \theta _{k}}}\right|_{\theta ={\widehat {\theta \,}}}\\\left.{\frac {\partial ^{2}\ell }{\partial \theta _{2}\,\partial \theta _{1}}}\right|_{\theta ={\widehat {\theta \,}}}&\left.{\frac {\partial ^{2}\ell }{\partial \theta _{2}^{2}}}\right|_{\theta ={\widehat {\theta \,}}}&\dots &\left.{\frac {\partial ^{2}\ell }{\partial \theta _{2}\,\partial \theta _{k}}}\right|_{\theta ={\widehat {\theta \,}}}\\\vdots &\vdots &\ddots &\vdots \\\left.{\frac {\partial ^{2}\ell }{\partial \theta _{k}\,\partial \theta _{1}}}\right|_{\theta ={\widehat {\theta \,}}}&\left.{\frac {\partial ^{2}\ell }{\partial \theta _{k}\,\partial \theta _{2}}}\right|_{\theta ={\widehat {\theta \,}}}&\dots &\left.{\frac {\partial ^{2}\ell }{\partial \theta _{k}^{2}}}\right|_{\theta ={\widehat {\theta \,}}}\end{bmatrix}}~,$

adalah semidefinit negatif di ${\widehat {\theta \,}}$ , karena matriks ini mengindikasi kecekungan lokal. Matriks ini dinamakan matriks Hessian. Biasanya, distribusi peluang yang paling umum, terutama dalam keluarga eksponensial, adalah fungsi cekung secara logaritmik.^[9]^[10]

Referensi

↑ Rossi, Richard J. (2018). Mathematical Statistics: An Introduction to Likelihood Based Inference. New York: John Wiley & Sons. hlm. 227. ISBN 978-1-118-77104-4.
↑ Hendry, David F.; Nielsen, Bent (2007). Econometric Modeling: A Likelihood Approach. Princeton: Princeton University Press. ISBN 978-0-691-13128-3.
↑ Chambers, Raymond L.; Steel, David G.; Wang, Suojin; Welsh, Alan (2012). Maximum Likelihood Estimation for Sample Surveys. Boca Raton: CRC Press. ISBN 978-1-58488-632-7.
↑ Ward, Michael Don; Ahlquist, John S. (2018). Maximum Likelihood for Social Science: Strategies for Analysis. New York: Cambridge University Press. ISBN 978-1-107-18582-1.
↑ Myung, I.J. (2003). "Tutorial on maximum likelihood Estimation". Journal of Mathematical Psychology. 47 (1): 90–100. doi:10.1016/S0022-2496(02)00028-7.
↑ Gourieroux, Christian; Monfort, Alain (1995). Statistics and Econometrics Models. Cambridge University Press. hlm. 161. ISBN 0-521-40551-3.
↑ Kane, Edward J. (1968). Economic Statistics and Econometrics. New York, NY: Harper & Row. hlm. 179.
↑ Small, Christoper G.; Wang, Jinfang (2003). "Working with roots". Numerical Methods for Nonlinear Estimating Equations. Oxford University Press. hlm. 74–124. ISBN 0-19-850688-0.
↑ Kass, Robert E.; Vos, Paul W. (1997). Geometrical Foundations of Asymptotic Inference. New York, NY: John Wiley & Sons. hlm. 14. ISBN 0-471-82668-5.
↑ Papadopoulos, Alecos (25 September 2013). "Why we always put log() before the joint pdf when we use MLE (Maximum likelihood Estimation)?". Stack Exchange.

[1] Rossi, Richard J. (2018). Mathematical Statistics: An Introduction to Likelihood Based Inference. New York: John Wiley & Sons. hlm. 227. ISBN 978-1-118-77104-4.

[2] Hendry, David F.; Nielsen, Bent (2007). Econometric Modeling: A Likelihood Approach. Princeton: Princeton University Press. ISBN 978-0-691-13128-3.

[3] Chambers, Raymond L.; Steel, David G.; Wang, Suojin; Welsh, Alan (2012). Maximum Likelihood Estimation for Sample Surveys. Boca Raton: CRC Press. ISBN 978-1-58488-632-7.

[4] Ward, Michael Don; Ahlquist, John S. (2018). Maximum Likelihood for Social Science: Strategies for Analysis. New York: Cambridge University Press. ISBN 978-1-107-18582-1.

[:0-5] Myung, I.J. (2003). "Tutorial on maximum likelihood Estimation". Journal of Mathematical Psychology. 47 (1): 90–100. doi:10.1016/S0022-2496(02)00028-7.

[6] Gourieroux, Christian; Monfort, Alain (1995). Statistics and Econometrics Models. Cambridge University Press. hlm. 161. ISBN 0-521-40551-3.

[7] Kane, Edward J. (1968). Economic Statistics and Econometrics. New York, NY: Harper & Row. hlm. 179.

[8] Small, Christoper G.; Wang, Jinfang (2003). "Working with roots". Numerical Methods for Nonlinear Estimating Equations. Oxford University Press. hlm. 74–124. ISBN 0-19-850688-0.

[9] Kass, Robert E.; Vos, Paul W. (1997). Geometrical Foundations of Asymptotic Inference. New York, NY: John Wiley & Sons. hlm. 14. ISBN 0-471-82668-5.

[10] Papadopoulos, Alecos (25 September 2013). "Why we always put log() before the joint pdf when we use MLE (Maximum likelihood Estimation)?". Stack Exchange.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

Prinsip

Referensi

Bagikan artikel ini