Distribusi Sampling: Penjelasan dan Contoh Lengkap!

Distribusi sampling adalah distribusi pengukuran statistik seperti rata-rata, standar deviasi, proporsi yang muncul sebagai akibat dari penggunaan sampel.

Bayangkan kita memiliki sekelompok populasi. Ketika kita mengambil sampel data, kita akan mendapatkan hasil bahwa terdapat berbagai perbedaan perhitungan dari satu sampel ke sampel lain.

Perbedaan hasil ini akan membuat perbedaan dalam pengukuran dan penentuan distribusi sampling.

Jika kita dapat mengukur ketinggian semua orang di dunia (misalkan melalui sensus) dan menyajikan hasilnya, maka kita telah mendapatkan distribusi tinggi dari seluruh populasi dunia.

Namun, jika kita hanya mengambil sebagian kecil dari populasi, mungkin sekitar 100 orang per negara, lalu rata-rata dan menyajikan hasilnya, maka kita telah memperoleh distribusi sampel tinggi dari populasi di seluruh dunia.

Perbedaan sampel dan populasi menyebabkan hadirnya ilmu statistik dalam menyelesaikan berbagai estimasi dan prediksi.

Sebelum membahas distribusi sampling lebih lanjut, ingat poin-poin berikut ini:

1. Populasi: seluruh hal yang ingin kita periksa
2. Sampel: data atau informasi yang kita miliki tentang populasi
3. Statistik: metode atau teknik yang dapat digunakan untuk memperkirakan populasi
4. Distribusi sampel: metode yang digunakan untuk menghasilkan nilai yang mampu menggambarkan kondisi populasi melalui proses statistik.

Distribusi sampel akan tergantung pada kondisi distribusi populasi. Sebelum memilih sampel, pelajari tentang populasi terlebih dahulu melalui referensi yang tersedia. Sampel yang digunakan harus acak dan independen.

Sama seperti yang lain, distribusi sampling juga memiliki statistik deskriptif seperti grafik, rata-rata, median, modus, skewness, dan varians tersendiri.

Mengapa distribusi sampling penting?

Ada beberapa alasan mengapa mengetahui distribusi sampling merupakan hal yang penting:

1. Distribusi sampling membantu kita untuk memilih sampel secara efektif dan efisien dengan mempertimbangkan waktu, biaya, dan energi sehingga kita dapat memperkirakan parameter dengan benar.

2. Teknologi informasi membantu kita menggunakan analisis dan pengukuran yang tepat dalam menghasilkan parameter populasi.

Untuk memberikan gambaran, berikut saya berikan ilustrasi distribusi sampling.

gambaran-distribusi-sampling

Rata-rata distribusi sampling

Secara umum, rata-rata populasi dan semua sampel yang memungkinkan adalah sama. Tetapi, kita harus menunjukkannya secara berbeda.

Untuk memahami rata-rata, saya sarankan anda membaca artikel mean, median, dan modus ini!

Hubungan standar deviasi, standar error, dan ukuran sampel

Dalam pendugaan parameter melalui statistik, tentu saja terdapat kemungkinan terjadinya kesalahan.

Silakan lihat formula berikut:

formula-standar-error-dan-korelasi-dengan-sampel

Sekarang, berdasarkan formula di atas, kita melihat bahwa semakin banyak jumlah sampel, nilai standar error semakin kecil.

Ini berarti memiliki lebih banyak data membuat varians dan kesalahan standar semakin kecil dan menghasilkan estimasi parameter lebih akurat.

Juga, semakin besar standar deviasi untuk populasi, semakin besar kesalahannya.

Untuk mendaparkan standar error yang kecil, kita harus menemukan standar deviasi populasi terkecil dan menggunakan sampel sebanyak mungkin.

Tentu saja, kita harus mempertimbangkan batasan seperti waktu, uang, dan kemampuan.

Sekilas Teorema Limit Pusat

Anggap saja, kita sudah memiliki nilai mean, standard error, dan standar deviasi dari kelompok sampel.

Sekarang, anda harus menentukan apa distribusi sampling. Biasanya, ada dua syarat dalam menentukan distribusi sampling.

Pertama, distribusi asli untuk populasi adalah normal, kedua, distribusi asli populasi tidak normal, kadang-kadang distribusi tidak diketahui.

Kita basa satu per satu!

1. Jika distribusi populasi normal

Jika populasi normal, maka sampel juga akan memiliki distribusi normal. Kita tidak perlu membahas ini secara rinci karena sudah terbukti.

2. Jika distribusi populasi tidak normal atau tidak diketahui

Jika distribusi populasi tidak normal atau mungkin tidak diketahui, kita tidak dapat menyimpulkan bahwa sampel tersebut memiliki distribusi normal.

Kita harus mendekati dan mengukur sampel dengan Teorema Limit Pusat. Teorema Limit Pusat menyatakan bahwa apapun distribusi populasinya, distribusi sampling mendekati normal jika ukuran sampel cukup besar.

Sederhananya, Teorema Limit Pusat tidak peduli berapa distribusi populasi selama sampelnya cukup besar.

Pertanyaannya adalah, berapa ukuran sampel yang bisa dikatakan “cukup besar” menurut CLT?

Yah, sebagian besar ahli dan ahli statistik sepakat bahwa jika jumlah sampel (n) setidaknya 30, Teorema Limit Pusat sudah bisa diterapkan pada kasus ini.

Saya tahu, terkadang ada beberapa pendapat berbeda. Tapi, ini yang paling banyak digunakan orang dalam rumus statistik.

Semakin besar ukuran sampel, semakin besar peluang untuk menjadi distribusi normal.

Menggunakan sampel sebanyak mungkin akan membuat hasilnya lebih baik karena distribusi sampel akan mendekati normal.

Ingat, Anda tidak perlu menggunakan CLT jika distribusi populasi normal pada awalnya.

Peluang untuk Sampel

Anggaplah “X” sebagai populasi, dan kita akan mengambil sampel populasi dari X. Untuk itu, kita perlu menentukan apakah sampel yang kita gunakan memiliki distribusi normal atau paling tidak mendekati normal.

Untuk menemukan probabilitas dari sampel tersebut, kita harus mengonversi nilai rata-rata sampel menjadi nilai-z (yang memuat peluang) dengan menggunakan Z-Tabel.

Rumusnya adalah:

rumus-formula-z-value-distribusi-sampling

Contoh: Misalkan X adalah populasi dengan tinggi siswa di sekolah dengan distribusi normal, rata-rata 170 cm dan standar deviasi adalah 10. Anda bertugas memilih 30 sampel dan mengukur tinggi badan mereka.

Berapa kemungkinan tingginya kurang dari 165 cm?

Jawab:

contoh-kasus-formula-z-distribusi-sampling

Kesimpulan: Probabilitas 30 siswa yang dipilih secara acak memiliki tinggi kurang dari 165 cm adalah 0,0031 atau 0,31 persen.

Catatan: Hal yang perlu anda ingat adalah selama sampel cukup besar (setidaknya 30 unit sampel), Anda masih dapat memperkirakan probabilitas menggunakan metode distribusi normal standar (Z) dan mengkonversi nilainya menggunakan Tabel-Z.

Bagaimana jika sampelnya tidak cukup besar atau kurang dari 30 unit? Untuk kasus ini, anda bisa selesaikan dengan menggunakan menggunakan distribusi-t.

Teorema Limit Pusat tidak hanya diterapkan untuk kasus sampel. Teorema ini juga dapat digunakan untuk proses statistik lain seperti proporsi sampel.

Proporsi populasi adalah jumlah individu dalam populasi yang memiliki karakteristik tertentu berdasarkan variabel acak binomial.

Proporsi sampel adalah jumlah individu dalam kelompok sampel yang memiliki karakteristik yang sama.

Misalnya, jika Anda mengambil 1000 orang di sebuah kota dan menemukan 200 orang yang berpenghasilan lebih dari Rp. 10.000.000 per bulan, proporsi sampel orang yang berpenghasilan lebih dari Rp. 10.000.000 per bulan adalah 0,2.

Catatan:

proporsi-populasi-dan-proporsi-sampel

Hal yang perlu dicatat tentang proporsi populasi:

proporsi-sampel-dan-hal-penting

Contoh:

Ada 1000 mahasiswa universitas yang berpartisipasi dalam survei kesehatan mental. Siswa ini dipilih secara acak. Ditemukan bahwa 35 persen dari siswa memiliki masalah kesehatan mental.

Misalkan 40 persen dari mereka mengatakan mereka membutuhkan perawatan kesehatan mental. Temukan probabilitas dari mahasiswa tersebut!

contoh-kasus-proporsi-sampel-distribusi-sampling

Kesimpulan: Jika 35 persen siswa memiliki masalah kesehatan mental, peluang untuk mengambil 1000 sampel siswa dan mendapatkan kurang dari 40 persen yang membutuhkan konselor adalah sekitar 0,998.

Kesimpulan

Distribusi sampling adalah distribusi pengukuran statistik seperti rata-rata, standar deviasi, proporsi yang muncul sebagai akibat dari penggunaan sampel.

Semakin besar jumlah sampel, semakin kecil standar error sehingga statistik yang dihasilkan semakin baik dalam menduga parameter.

Jika jumlah sampel 30, maka sampel sudah bisa diasumsikan memiliki distribusi normal.

Peluang distribusi sampling bisa didekati dengan tabel Z.

Distribusi sampling sangat memengaruhi berbagai estimasi inferensial statistik.