Distribusi-t: Solusi Pengujian Sampel Kecil!

Distribusi-t (atau yang sering dikenal dengan distribusi t-student) adalah distribusi sampling yang cukup populer yang memungkinkan kita melakukan berbagai pengujian statistik dalam kondisi sampel yang kecil.

Misalkan, kita akan melakukan penelitian menggunakan sampel secara random berdasarkan populasi yang memiliki distribusi normal.

Salah satu masalah yang sering muncul adalah kita tidak mengetahui parameter atau nilai sebenarnya dari standar deviasi populasi tersebut. Oleh karena itu, kita tidak bisa melakukan perhitungan statistik menggunakan distribusi normal.

Pertanyaan utamanya, apakah data yang kita gunakan masih layak untuk diuji jika tidak memiliki standar deviasi dari populasi?

Dalam kondisi seperti ini, terlebih jika sampel penelitian kita tergolong kecil, apa solusi yang mungkin kita gunakan sehingga prosedur pengujian statistik tetap bisa dilaksanakan?

Mari kita bahas pada artikel ini!

Apa itu distribusi-t?

Distribusi-t (distribusi t-student) merupakan distribusi sampling yang digunakan untuk pengujian statistik dengan kondisi ukuran sampel yang relatif kecil.

Dengan menggunakan distribusi-t, kita bisa melakukan pengujian statistik untuk memperkirakan parameter yang tidak diketahui (seperti standar populasi) dengan cara ,menggunakan distribusi sampel untuk mengubah standar deviasi populasi

Namun, tentu saja ada risiko dengan menggunakan distribusi sampel tersebut!

Karena sampel terdiri atas kelompok nilai yang berbeda, nilai standar deviasi juga cenderung selalu berubah dan semakin bervariasi antar satu kelompok sampel dengan sampel lainnya.

Jika standar deviasi standar populasi diketahui, peneliti akan cenderung menggunakan distribusi normal sebagai pendekatan pengujian statistic yang lebih valid.

Distribusi-t digunakan dalam estimasi statistik sampel kecil (small statistic estimation). Dalam hal ini,  para ahli sepakat menyimpulkan bahwa ukuran sampel kecil di bawah 30 unit. Ini juga sejalan dengan Teorema Limit Pusat (Central Limit Theorem).

Ada juga pendapat lain terkait ukuran jumlah sampel statistik kecil ini. Namun, jumlah 30 ini lah yang paling sering digunakan sebagai batas untuk menggunakan distribusi-t.

Dengan segala keterbatasannya, distribusi ini sangat menarik karena mampu menjelaskan fenomena ilmiah secara sistematis dengan menggunakan sampel kecil.

Distribusi-t adalah kelompok distribusi normal lain yang terlihat mirip tetapi lebih pendek dan datar.

Ukuran sampel yang lebih kecil berarti kurva yang lebih datar dan semakin besar ukuran sampel, semakin terlihat distribusi-t seperti distribusi normal standar (distribusi-Z).

Selang kepercayaan dan pengujian hipotesis adalah dua jenis analisis statistik yang paling sering digunakan dalam menggunakan distribusi-t.

Karakteristik distribusi-t

Distribusi-t merupakan distribusi sampling yang mirip dengan distribusi-Z (distribusi normal). Bila anda sudah pernah melihat bentuk distribusi normal, maka distribusi t memiliki bentuk yang sedikit berbeda.

Distribusi t memiliki bentuk lonceng dengan puncak yang datar dengan luas wilayah total adalah 1. Seperti distribusi normal standar, nilai rata-ratanya adalah nol dengan standar deviasi yang lebih besar dibandingkan dengan distribusi z.

kurva-distribusi-t

Semakin besar jumlah sampel pada distribusi t, bentuk distribusi ini akan semakin mendekati distribusi normal.

Kita bisa  menemukan nilai pastinya dengan melihat setiap titik pengamatan. Sama seperti saat kita mengubah skor-Z menjadi nilai-Z. Tapi, bentuknya berbeda. Ini memiliki bentuk lonceng dasar dengan luas 1 di bawahnya.

Seperti distribusi normal standar, nilai rata-ratanya adalah nol, tetapi standar deviasinya secara proporsional lebih besar dibandingkan dengan distribusi-Z.

Setiap distribusi-t memiliki derajat kebebasan. Derajat kebebasan ini mempengaruhi nilai kritis di setiap distribusi.

Derajat kebebasan ditentukan oleh jumlah sampel. Dalam distribusi-t, penentuan derajat kebebasan adalah n-1.

Formula penggunaan distribusi t

Ada 2 jenis formula yang perlu anda ketahui dalam penggunaan distribusi t. Formula tersebut bisa digunakan dan dimodifikasi dalam berbagai kasus.

1. Jika standar deviasi dari populasi diketahui, formula yang digunakan adalah:

2. Jika standar deviasi tidak diketahui, dengan menggunakan asumsi bahwa sampel yang kita gunakan memiliki distribusi standar normal dimana nilai rata-rata=0 dan nilai varians=1, maka:

Dalam kasus standar deviasi tidak diketahui, kita bisa menggunakan standar deviasi sampel seperti yang sudah saya jelaskan sebelum-sebelumnya. Tentu saja, risikonya adalah distribusi yang kita gunakan memiliki nilai varians yang besar.

Cara menemukan nilai kritis dan p-value dari distribusi-t

P-value adalah nilai peluang terjadinya hasil statistik uji. Setiap distribusi memiliki nilai dan rentang p-value yang berbeda. Statistik uji yang sama mungkin memiliki nilai p-value yang lebih besar dalam kasus distribusi-t daripada distribusi-Z.

Hal ini disebabkan luas tail area distribusi-t lebih gemuk daripada distribusi Z. Hal ini merupakan risiko dari penggunaan sampel dengan jumlah kecil.

P-value dapat ditemukan menggunakan tabel distribusi-t yang sudah baku dan tersebar di banyak tempat. Ingat, gunakan n-1 untuk derajat kebebasan.

Ini adalah tabel distribusi-t.

tabel-distribusi-t-student

Misalnya, Anda menggunakan 20 sampel dan tingkat signifikansi 5%. Jika menggunakan uji dua sisi, nilai t = t (0,025,19) = 2,0932

Terkadang p-value dalam distribusi t disebut t-value. Keduanya memiliki pengertian yang sama.

Sama seperti pengujian hipotesis, distribusi t juga memiliki nilai atau area kritis. Jika p-value atau statistik uji masuk dalam area kritis, berarti hipotesis nol berhasil ditolak.

Jika tidak, bisa disimpulkan bahwa kita gagal menolak hipotesis nol. Ini bukan berarti bahwa hipotesis nol itu benar. Hanya saja kita tidak memiliki bukti atau jumlah sampel yang digunakan belum cukup untuk menolah hipotesis nol.

Penggunaan uji hipotesis pada distribusi-t

Secara umum prosedur pengujian hipotesis untuk distribusi-t dan distribusi normal hampir sama. Bila distribusi normal digunakan saat data memiliki distribusi normal atau jumlah sampel relative besar, distribusi t digunakan khusus untuk jumlah sampel yang kurang dari 30 unit.

Berikut langkah-langkah untuk melakukan uji hipotesis distribusi-t:

1. Tentukan hipotesis nol dan hipotesis alternatif

2. Tentukan taraf signifikansi (alpha). Nilai taraf signifikansi yang biasa digunakan adalah 10 persen, 5 persen, dan 1 persen. Tentukan nilai kritis di table-t.

3. Cari uji statistik dengan menggunakan rumus uji-t.

4. Temukan p-value dan tentukan apakah nilai-p termasuk dalam area penolakan atau tidak

5. Buat keputusan berdasarkan hasil pengujian, apakah anda menolak hipotesis nol atau gagal menolak hipotesis. Lalu, buat kesimpulannya.

Contoh penggunaan uji-t

Secara umum, terdapat 3 jenis pengujian pada distribusi-t:

  1. Uji-t satu sampel
  2. Uji-t sampel berpasangan
  3. Uji-t satu sampel independen

Pada artikel ini, kita akan menggunakan uji t satu sampel.

Ada sebuah asumsi yang menyebutkan bahwa nilai rata-rata matematika di sebuah SMA unggulan adalah 90. Sebuah riset kecil-kecilan dilakukan untuk membuktikan asumsi ini!

Berikut data nilai siswa dari 25 sampel!

Lakukan pengujian hipotesis!

1. Penentuan hipotesis nol dan hipotesis alternatif

2.  Tentukan taraf signifikansi

╬▒=0.025 (5 persen dibagi 2 dikarenakan kita akan menggunakan uji 2 arah)

derarjat kebebasan = n-1 = 24

Karena ini merupakan uji 2 arah, maka:

Kriteria pengujian:

3. Menemukan statistik uji dengan formula uji-t

4. Temukan t0 berada di area penolakan atau tidak

5. Buat kesimpulan

Karena t0 berada di luar area penolakan, artinya kita gagal untuk menolak H0. Bisa disimpulkan bahwa hipoteses rata-rata nilai matematika siswa yang berada di sekolah unggulan adalah 90  adalah benar.

Selang kepercayaan pada distribusi-t

Dalam pengujian hipotesis, kita terbiasa membuat selang kepercayaan untuk mengetahui seberapa jauh nilai yang kita uji menyebar.

Hal ini juga bisa kita lakukan bila menggunakan distribusi-t. Selang kepercayaan juga bisa diterapkan dalam pengujian distribusi t. Jika jumlah sampel terlalu kecil dan standar deviasi tidak diketahui, kita bisa menggunakan standar deviasi yang kita dapatkan dari sampel.

Mari kita gunakan contoh di atas!

selang-kepercayaan-pada-uji-t

Dengan tingkat kepercayaan 95 persen, bisa disimpulkan bahwa rata-rata nilai matematika siswa di sekolah unggulan berada pada interval 88.29 hingga 92.90.

Kesimpulan

Berdasarkan penjelasan yang sudah saya sampaikan, ada beberapa kesimpulan yang bisa saya tuliskan:

  1. Distribusi t bisa digunakan untuk pengujian dengan sampel kecil dibawah 30 unit.
  2. Semakin besar nilai sampel, bentuk distribusi t semakin menyerupai distribusi normal.
  3. Prosedur uji hipotesis bisa digunakan dalam pengujian distribusi-t.
  4. Selang kepercayaan distribusi-t bisa digunakan dalam analisis.

Demikian penjelasan lengkap tentang distribusi-t. Sebagai salah satu distribusi sampling, ada baiknya anda mengetahui dengan jelas fungsi dan manfaat distribusi ini agar bisa bisa diterapkan dalam penelitian terutama dalam kasus sampel kecil.