Dalam statistika, estimasi kemungkinan maksimum atau estimasi maksimum likelihood adalah metode mengestimasi parameter dari suatu distribusi peluang yang diasumsi apabila diketahui data hasil observasi. Metode ini didapatkan dengan memaksimalisasikan suatu fungsi likelihood, sehingga di bawah penggambaran pemodelan statistika, data hasil observasi itu yang mungkin terjadi. Berdasarkan hasil estimasi tersebut, terdapat titik berada di dalam ruang parameter yang memaksimumkan fungsi likelihood, dan titik itulah yang dinamakan estimasi maksimum likelihood. Logika dibalik metode ini bersifat intuitif dan fleksibel, sehingga kegunannya menjadi peran penting dalam inferensi statistik.
Sumber: Lihat artikel asli di Wikipedia
Dalam statistika, estimasi kemungkinan maksimum atau estimasi maksimum likelihood adalah metode mengestimasi parameter dari suatu distribusi peluang yang diasumsi apabila diketahui data hasil observasi. Metode ini didapatkan dengan memaksimalisasikan suatu fungsi likelihood, sehingga di bawah penggambaran pemodelan statistika, data hasil observasi itu yang mungkin terjadi. Berdasarkan hasil estimasi tersebut, terdapat titik berada di dalam ruang parameter yang memaksimumkan fungsi likelihood, dan titik itulah yang dinamakan estimasi maksimum likelihood.[1] Logika dibalik metode ini bersifat intuitif dan fleksibel, sehingga kegunannya menjadi peran penting dalam inferensi statistik.[2][3][4]
Himpunan observasi dimodelkan sebagai sampel acak dari distribusi peluang gabungan yang tidak diketahui, dinyatakan sebagai kumpulan parameter. Tujuan estimasi maksimum likelihood adalah untuk menentukan parameter, sehingga data hasil observasi memiliki peluang gabungan tertinggi. Disini, parameter yang menentukan distribusi gabungan dinyatakan dalam bentuk vektor sehingga distribusi tersebut termasuk suatu keluarga parametrik , dengan adalah ruang parameter, yakni subhimpunan berdimensi terhingga dari ruang Euklides. Mengevaluasi kepadatan gabungan pada sampel data hasil observasi memberikan suatu fungsi bernilai real, yang dinamakan fungsi likelihood. Untuk variabel acak bebas, fungsi akan menjadi hasil kali dari fungsi-fungsi kepadatan univariat:
Tujuan estimasi maksimum likelihood adalah mencari nilai dari parameter model yang memaksimalkan fungsi likelihood di ruang parameter.[5] Dalam artian,
Secara intuitif, estimasi maksimum likelihood memilih nilai parameter yang menjadikan data hasil observasi mungkin terjadi. Nilai istimewa yang memaksimalkan fungsi likelihood dinamakan estimasi maksimum likelihood. Lebih lanjut, jika fungsi yang didefinisikan sebagai fungsi terukurkan, maka fungsi itu adalah estimator maksimum likelihood. Suatu fungsi umumnya didefinisikan di ruang sampel, dalam artian mengambil suatu sampel yang diketahui sebagai argumennya. Adapun suatu syarat cukup tapi tak perlu mengenai keberadaannya, yakni bahwa fungsi likelihood adalah kontinu di suatu ruang parameter kompak .[6] Apabila ruang parameter terbuka, fungsi likelihood dapat menaik tanpa benar-benar mencapai suatu nilai supremum.
Pada prakteknya, estimasi maksimum likelihood seringkali mudah dikerjakan bersamaan dengan logaritma natural dari fungsi likelihood, yang dinamakan log-likelihood: Karena fungsi logaritma bersifat monotonik, nilai maksimum dari fungsi muncul pada nilai yang sama dari , sebagaimana halnya dengan nilai maksimum dari .[7] Apabila fungsi terdiferensialkan di ruang parameter , syarat yang perlu terjadinya maksimum (atau minimum) adalahSemua persamaan tersebut dinamakan persamaan likelihood. Untuk pemodelannya, persamaan-persamaan tersebut secara eksplisit dapat diselesaikan untuk . Akan tetapi, secara umum solusi bentuk tertutup untuk permasalahan maksimisasi masih belum diketahui, ataupun belum tersedia. Estimasi maksimum likelihood hanya dapat ditemukan melalui optimisasi numerik. Permasalahan lainnya adalah bahwa dalam sampel terhingga, terdapat banyak akar untuk persamaan likelihood.[8] Menentukan akar dari persamaan-persamaan likelihood yang tentunya suatu maksimum (lokal) tergantung pada apakah matriks dari turunan parsial orde kedua dan parsial campuran
adalah semidefinit negatif di , karena matriks ini mengindikasi kecekungan lokal. Matriks ini dinamakan matriks Hessian. Biasanya, distribusi peluang yang paling umum, terutama dalam keluarga eksponensial, adalah fungsi cekung secara logaritmik.[9][10]