Memahami Teorema Limit Pusat Dalam Statistik

Teorema Limit Pusat merupakan salah satu teori yang wajib diketahui oleh setiap orang yang bekerja dekat dengan data. Hal ini dikarenakan teori ini memberikan pengaruh besar terhadap ilmu statistik di seluruh dunia.

Dalam suatu populasi, nilai suatu variabel dapat mengikuti distribusi probabilitas yang berbeda. Distribusi ini bisa berbeda-beda tergantung dari kondisi data atau sampel yang anda gunakan.

Bila beruntung, anda akan mendapatkan data dengan distribusi normal. Namun, bisa jadi data yang anda gunakan menceng ke kiri (left skewed) atau condong ke kanan (right skewed).

Banyak sekali prosedur pengujian statistik inferensial terutama untuk pengujian rata-rata yang mengasumsikan bahwa data memiliki distribusi normal. Hal ini dikarenakan distribusi rata-rata sampel hampir mendekati distribusi normal.

Sehingga, pengujian statistik bisa dilakukan meskipun distribusi asli dari data yang kita gunakan hanya bersifat mendekati distribusi normal.

Adolphe Quetelet, seorang astronom berkebangsaan Belgia yang juga merupakan pakar matematika dan statistika, adalah orang yang pertama kali menerapkan distribusi normal dalam karakteristik manusia.

Beliau mencatat bahwa karakteristik seperti tinggi, berat, dan stamina terdistribusi secara normal.

Percaya atau tidak, penemuan Adolphe Quetelet ini bisa dikatakan benar karena berdasarkan banyak data, karakteristik manusia memang terdistribusi secara normal.

Memahami teorema limit pusat merupakan hal yang sangat penting dan menjadi ilmu dasar yang bisa anda manfaatkan dalam berbagai pengolahan dan analisis data.

Pengertian Teorema Limit Pusat

Teorema Limit Pusat adalah sebuah teori yang menyatakan bahwa jika ukuran sampel semakin besar, maka sifat dari rata-rata distribusi peluang sampelnya (sample mean distribution) akan semakin mendekati distribusi normal.

Hal ini mengakibatkan sampel tersebut juga memiliki karakteristik yang juga terdapat pada distribusi normal.

Karena itu, sampel tersebut kemungkinan besar akan memiliki rata-rata yang sangat dekat atau bahkan hampir sama dengan nilai parameternya, begitu juga dengan nilai variansnya.

Lalu, pasti anda akan bertanya, berapa kira-kira nilai sampel minimum yang perlu dipenuhi agar teorema limit pusat ini bisa digunakan?

Dalam beberapa teori statistika, ada yang mengatakan bahwa jumlah sampel minimal yang wajib digunakan dalam teorema ini adalah 30 observasi, ada juga ahli yang mengatakan 50 observasi. Tergantung dari sudut pandang anda saja.

Saya sendiri, biasa menggunakan 30 observasi untuk menggunakan teorema ini. Namun, tentu saya akan berusaha agar jumlah sampel yang saya gunakan sebesar mungkin agar menghasilkan distribusi yang semakin mendekati normal.

Given a population with a finite mean µ and a finite nonzero variance σ2, the sampling distribution of the mean approaches a normal distribution with a mean of µ and a variance of σ2/N as N, the sample size, increases.

onlinestatbook.com
pengertian-teorema-limit-pusat

Mengapa harus menggunakan Teorema Limit Pusat?

Dengan menggunakan teorema limit pusat, kita tidak perlu lagi menemukan informasi yang lebih rinci terkait karakteristik dari sampel atau variabel yang kita gunakan. Tapi, kita harus menggunakan sampel yang cukup besar dengan jumlah yang memenuhi kriteria distribusi normal sehingga teorema ini bisa diterapkan.

Bila data yang kita gunakan tidak memiliki ditribusi normal, kita akan kesulitan dalam menemukan kesimpulan dan melakukan pengujian terhadap data yang kita miliki.

Mungkin, anda juga akan bertanya, apakah dalam kehidupan nyata, data-data dari sebuah populasi pasti memiliki distribusi normal? Karena sepertinya, teorema ini memaksakan segala sesuatunya menjadi normal.

Ya tentu saja, TIDAK SEMUA distribusi populasi memiliki distribusi normal. Tetapi, secara umum, kondisi data berditribusi normal mewakili banyak sekali fenomena di dunia ini.

Karena itu, kita perlu melakukan normalisasi terhadap data yang kita miliki bila memang tidak memilki distribusi normal.

Contohnya saja, di sebuah sekolah unggulan, dari nilai 30 siswa yang mengikuti ujian matematika, 15 orang mendapatkan 90, dan 15 orang mendapatkan nilai 100.

Bila anda membuat distribusi data tersebut, apakah  kurva yang dihasilkan menyerupai lonceng yang sering diidentikkan dengan kurva normal? Ya tentu saja tidak.

Berdasarkan deteksi sekilas, hampir bisa dipastikan distribusi nilai ujian matematika di kelas tersebut tidak selalu terdistribusi secara normal. Namun, dengan jumlah sampel yang cukup besar yaitu 50 siswa, nilai rata-rata peluang sampelnya akan mendekati distribusi normal.

Tentu saja, kita harus melakukan transformasi data-data tersebut agar menjadi kurva normal (akan saya bahas di artikel lain). Dengan transformasi ini, berbagai pengujian statistik akan lebih mudah untuk dilakukan.

kurva-normal-dalam-teorema-limit-pusat
Kurva Distribusi Normal

Beberapa hal yang perlu diingat dalam Teorema Limit Pusat

1. Gunakan Teorema Limit Pusat saat distribusi tidak normal atau tidak diketahui

Ada banyak sekali jenis distribusi di dalam ilmu statistika. Ada distribusi normal, uniform, binomial, dll. Jangan serta merta langsung berasumsi bahwa data anda sudah pasti menggunakan distribusi normal.

Pahami dulu karakteristik sampel dengan baik dan bila anda memang tidak yakin bahwa distribusi data ini tidak normal atau tidak diketahui, barulah gunakan teorema limit pusat.

2. Tidak semua data yang anda gunakan pasti memiliki populasi yang berditribusi normal

Ini sudah saya jelaskan di awal sih, tapi sepertinya perlu saya tegaskan lagi.

Tidak semua di dunia ini selalu berdistribusi normal. Bisa jadi ada distribusi uniform, chi square, binomial, dll.  Distribusi normal hanyalah pendekatan yang paling lazim digunakan saat distribusi data tidak diketahui atau tidak berdistribusi normal

Penutup

Teorema limit pusat merupakan salah satu jenis formula yang memiliki pengaruh paling besar di dunia ini. Pengaruh teori ini tidak hanya di bidang statistik tetapi memengaruhi metodologi penelitian di berbagai sektor.

Dengan adanya teorema ini, kita bisa melakukan berbagai pengujian seperti uji hipotesis, analisis korelasi, dll dengan memiliki jumlah sampel yang cukup besar bahkan tanpa perlu pembuktian yang rumit apakah data yang kita gunakan berdistribusi normal atau tidak.