Distribusi Chi-Square: Pengertian Hingga Contoh Lengkap

Distribusi Chi-Square merupakan salah satu distribusi sampling yang sering digunakan dalam pengujian non-parametrik. Distribusi ini menjadi solusi pengujian sampel terutama dalam kasus uji kesesuaian (goodness of fit-test)

Dalam kondisi sehari-hari yang kita lihat, hasil yang diperoleh dari sampel tidak selalu tepat sama dengan hasil hasil yang ada secara teoritis yang sesuai dengan kaidahnya.

Contohnya, menurut perhitungan teoritis kita mengharapkan 30 kali “kejadian sukses” dan 30 kali “kejadian gagal” dalam sebuah eksperimen sebanyak 60 kali, namun nyatanya hasilnya jarang yang tepat sempurna. Fakta ini merupakan salah satu bentuk dari pentingnya Uji Chi Square. Oleh karena itu, perlu untuk kita mempelajari lebih dalam Uji Chi Square.

Apa itu distribusi Chi Square?

Distribusi Chi Square diperkenalkan oleh oleh Karl Pearson menjadi salah satu uji non parametrik yang paling sederhana dan paling banyak digunakan.

Distribusi Chi-Square merupakan distribusi yang digunakan untuk mengetahui perbedaan observasi dengan nilai harapan dari kelompok sampel. Dalam aplikasinya, distribusi chi-square diterapkan dalam uji chi-square.

Uji Chi Square merupakan salah satu teknik analisis yang bersifat komparasional yang berdasar pada perbedaan frekuensi data yang sedang diobservasi. Perbedaan ukuran pada frekuensi observasi dan frekuensi yang diharapkan menggunakan uji Chi-Square atau (X2).

Adapun rumus Chi Square adalah:

formula-distribusi-chi-square

Hal ini menunjukkan semakin besar perbedaan antara frekuensi observasi dan frekuensi harapan, maka semakin besar pula nilai X2.

Beberapa hal menarik tentang distribusi Chi-Square:

1. Total area yang berada di bawah area kurva adalah 1.

2. Kurva distribusi Chi-Square selalu menceng kanan.

3. Semakin besar jumlah derajat kebebasan, kurva distribusi chi-square semakin mendekati distribusi normal.

4. Rata-rata dari distribusi chi-square adalah derajat kebebasan, sedangkan variansnya adalah 2 kali dari derajat kebebasan.

5. Ketika nilai derajat kebebasan adalah 3 atau lebih, puncak dari distribusi chi-square sama dengan df-2. Nilai ini merupakan cara untuk menentukan nilai modus pada distribusi chi-square.

Kapan Distribusi Chi Square digunakan?

Prinsip dasar pengujian Uj Chi-Square adalah ketika seorang observer ingin membandingkan frekuensi observasi dengan frekuensi yang diharapkan untuk melihat ada atau tidaknya perbedaan yang signifikan.

Uji Chi Square digunakan ketika:

  1. Ketika ada sedikit atau tidak ada asumsi tentang parameter dari populasi terkait
  2. Digunakan pada data kategorikal atau data kualitatif dengan menggunakan tabel kontingensi
  3. Digunakan untuk mengevaluasi sampel dan proporsi yang tidak berpasangan atau bersifat independent satu sama lain.
  4. Data harus dalam bentuk frekuensi
  5. Jumlah sampel (N) harus cukup besar

Jenis Uji Chi-Square

Berdasarkan jumlah sampel, terdapat 3 jenis uji chi-square

1. Uji Chi-Square Satu Sampel

Uji Chi-Square satu sampel merupakan pengujian hipotesis tentang perbandingan antara frekuensi sampel yang benar-benar terjadi (frekuensi sampel disimbolkan dengan observasi atau O) dengan frekuensi harapan berdasarkan hipotesis tertentu pada setiap pengujian (frekuensi harapan disimbolkan dengan E).

Contoh uji chi square satu sampel: Seorang direktur tertarik untuk mengetahui apakah jumlah kunjungan di RSUD sama setiap harinya. Untuk membuktikan hal tersebut, direktur mengumpulkan data pengunjung selama 7 hari dan melakukan pengujian.

2. Uji Chi-Square Dua Sampel

Uji Chi-Square dua sampel merupakan salah satu pengujian hipotesis yang digunakan untuk mengetahui apakah terdapat perbedaan yang signifikan antara dua kelompok sampel. Dua kelompk sampel ini nantinya dikelompokkan menurut klasifikasi tertentu.

Contoh Penggunaan Uji Chi-Square Dua Sampel adalah saat ingin mengetahui apakah terdapat perbedaan kondisi udara (bersih atau tercemah) dengan penyakit paru-paru yang diderita oleh warga sekitar (memiliki udara kulit atau tidak).

3. Uji Chi-Square k-sampel

Uji chi-square k-sampel merupakan salah satu penerapan distribusi chi-square untuk uji hipotesis yang bertujuan untuk mengetahui apakah terdapat perbedaan dan pengaruh antara lebih dari dua kelompok sampel menurut klasifikasi tertentu.

Contoh penggunaan uji chi-square k-sampel adalah seseorang ingin menguji efek samping penggunaan saus sambal terhadap kondisi lambung. Efek penggunaan saus sambal ini  dibagi dalam 4 kelompok yaitu tidak ada efek, pusing, perih, dan muntah. Kelompok umur di bagi atas 5-9 tahun, 10-14 tahun, 15-19 tahun, dan 20-24 tahun.

Cara Membuat Tabel Distribusi Chi-Square Dengan Excel

Selain menggunakan tabel, anda juga bisa menemukan nilai peluang distribusi Chi-Square dengan menggunakan Microsoft Excel.

Formula yang digunakan untuk melihat nilai chi-square adalah”

=CHIINV(nilai alpha,derajat kebebasan)

Dimana:

nilai alpha= gunakan nilai alpha atau taraf signifikansi yang digunakan

derajat kebebasan=  gunakan derajat kebebasan distribusi chi-square

Dengan menggunakan formula di atas, anda dengan mudah bisa membuat tabel distribusi chi-square seperti berikut.

cara-baca-tabel-distribusi-chi-square
tabel-distribusi-chi-square

Bagi anda yang ingin mengunduhnya, silakan klik tautan ini ya!

Cara Membaca Tabel Distribusi Chi-Square

Kurva distribusi Chi-Square akan selalu bernilai positf dan dipengaruhi oleh 2 faktor yaitu derajat bebas dan tingkat signifikansi.

Semakin besar nilai derajat bebas maka kurva Chi Square akan semakin mengikuti distribusi normal. Nilai dari X2 tabel dapat dilihat pada tabel berikut ini.

Ketika dari hasil perhitungan yang dilakukan diperoleh bahwa nilai derajat bebas sebuah observasi adalah 5 dengan taraf signifikansi 10%.

Maka cara membacanya adalah dengan melihat derajat bebas 5 pada tabel paling kiri, lalu sejajar dengan nilai dk 5 tarik ke kanan untuk mencari tingkat signifikansi 10%. Sehingga untuk derajat bebas (dk) = 5, taraf signifikansi 10%, nilai X2 tabelnya adalah sebesar 9.24

contoh-cara-baca-tabel-chi-square

Tujuan Penggunaan Uji Chi-Square

Uji Chi Square digunakan pada 3 tujuan yaitu:

  1. Untuk melakukan pengujian apakah frekuensi yang diamati berbeda secara signifikan dengan frekuensi teoritis

Sebagai contoh, kita memiliki sejumlah sampel tertentu berupa kejadian X1, X2, X3,…,Xn yang terjadi dengan frekuensi F1, F2, F3,…,Fn yang disebut frekuensi observasi dan berdasarkan probabilitas kejadian kejadian, maka diharapkan frekuensi e1, e2, e3,…, en yang disebut dengan frekuensi teoritis atau harapan. Dalam hal ini maka dapat dilihat bahwa:

KejadianX1, X2, X3,…,Xn
Frekuensi ObservasiF1, F2, F3,…,Fn
Frekuensi Harapane1, e2, e3,…, en

Maka adapun langkah pengujian Chi-Squarenya adalah:

  • Merumuskan hipotesis

Menetapkan taraf signifikansi dan derajat bebas, dengan ketentuan:

dk = k – 1, jika frekuensi yang diharapkan dapat dihitung tanpa harus menduga parameter populasi dengan statistik sampel

dk = k – 1 – m, jika frekuensi yang diharapkan dapat dihitung hanya dengan menduga parameter populasi sebanyak m dengan taksiran statistik sampel

  • Menentukan daerah kritis

H0 diterima ketika nilai X2 ≤ Xtabel,

H0 ditolak ketika nilai X2 > Xtabel,

  • Menentukan statistik uji
statistik-uji-chi-square
  • Penarikan kesimpulan

2. Untuk melakukan pengujian dengan distribusi sampel

Uji ini bertujuan untuk mengetahui sejauh mana tingkat kesesuaian antara distribusi sampel dengan distribusi populasi, yang akrab dikenal dengan Uji Kesesuaian (Uji Goodness of Fit).

Adapun langkah-langkah yang dilakukan dalam pengujian ini adalah:

  • Membuat distribusi frekuensinya
  • Menghitung nilai rata-rata (mean) dan standar deviasi dengan menggunakan data berkelompok
  • Menentukan nilai Z setiap kelas, dengan rumus: Z = (X-μ) / σ
  • Menentukan nilai harapan dengan mengalikan nilai probabilitas dengan jumlah data
  • Menentukan apakah distribusi bersifat normal atau dengan uji Chi Square

3. Untuk Melakukan Pengujian Independensi

Pengujian ini dilakukan untuk menguji ada tidaknya hubungan antara kedua faktor yang bersifat independent. Sebagai contoh, ingin melihat apakah terdapat hubungan antara motivasi belajar Siswa SMA dengan kondisi belajarnya.

Apabila tidak terdapat hubungan antar kedua faktor tersebut, maka kedua faktor itu saling bebas atau independen.

Contoh Penggunaan Distribusi Chi-Square

Sebuah rubik memiliki 6 warna yaitu merah, biru, kuning, hijau, putih, dan hitam. Rubik ini dilemparkan sebanyak 240 kali.

Frekuensi yang bisa muncul adalah warna pada rubik yaitu merah, biru, kuning, hijau, putih dan hitam dengan frekuensi masing masing adalah 36, 42, 48, 31, 35, 48. Ujilah apakah rubik tersebut simetris?

Warna RubikMerahBiruKuningHijauPutihHitam
Observasi364248313548
Ekspektasi404040404040

Karena peluang terpilihnya 1 warna adalah sama dengan yang lain maka, peluang terpilih 1 warna adalah 1/6, sehingga frekuensi ekspektasi adalah 1/6 x 240 = 40. 

1. Merumuskan hipotesis

H0: p1=p2=p3=p4=p5=p6 (Tidak ada perbedaan frekuensi munculnya semua warna)

H1: p1 ≠ pn (Setidaknya ada satu frekuensi warna yang tidak sama)

2. Menetapkan taraf signifikansi dan derajat bebas, dengan ketentuan:

α = 5% = 0.05

dk = n – 1 = 5

3. Menentukan daerah kritis

  • H0 gagal ditolak ketika nilai X2 hitung ≤ Xtabel,
  • H0 berhasil ditolak ketika nilai X2 hitung > Xtabel,

4. Melakukan pengujian statistik

contoh-distribusi-chi-square

5. Penarikan Kesimpulan

Pada X2 tabel dengan signifikansi 0.05 dan derajat bebas 5 diketahui nilainya adalah 11.07.

Maka karena nilai X2 hitung = 6.35 ≤ Xtabel = 11.07, maka kiga gagal menolak H0. Artinya, tidak terdapat perbedaan frekuensi munculnya semua warna yang menandakan bahwa dadu simetris.

Kesimpulan

Distribusi Chi-Square merupakan distribusi sampling yang digunakan untuk mengetahui perbedaan observasi dengan nilai harapan dari kelompok sampel. Dalam penerapannya, distribusi chi-square diterapkan dalam uji chi-square.

Terdapat 3 jenis uji chi-square berdasarkan jenis sampel:

1. Uji chi-square satu sampel

2. Uji chis-quare dua sampel

3. Uji chi-square k-sampel

Distribusi chi-square biasa digunakan dalam:

1. Pengujian apakah frekuensi yang diamati berbeda secara signifikan dengan frekuensi teoritis

2. Pengujian dengan distribusi sampel

3. Pengujian independensi