Analisis korelasi adalah asalah satu jenis pengukuran dalam statistik yang sering digunakan dalam pengolahan data. Korelasi merupakan metode statistik yang bisa digunakan bila anda memiliki minimal 2 variabel.
Berdasarkan definisi dari beberapa ahli, terdapat beberapa pengertian dari korelasi
Croxton dan Cowden : ketika seuatu hubungan bisa dibuktikan secara kuantitatif, maka metode statistik yang baik untuk mengukur hubungan tersebut dinamakan korelasi
A.M Tuttle : korelasi adalah analisis kovarian antara dua atau lebih variabel
L.R Conner : bila dua atau lebih variabel yang bergerak dan diikuti oleh variabel lain, maka hal ini bisa dikatakan terdapat hubungan korelasi
Secara umum, analisis korelasi adalah metode statistik yang digunakan untuk mengetahui dan mengukur bagaimana hubungan antara 2 variabel.
Dengan motode ini, kita bisa menentukan seberapa kuat hubungan antar variabel yang belum diketahui sebelumnya.
Manfaat analisis korelasi
Analisis korelasi seringkali digunakan untuk menyatakan derajat kekuatan hubungan antara dua variabel. Dengan mengetahui hubungan antar 2 variabel, kita bisa mendeskripsikan bagaimana gambaran yang lebih bermanfaat dari data-data yang kita miliki.
Korelasi seringkali digunakan dalam dunia riset ataupun bisnis.
Contohnya saja, seorang pemimpin perusahaan kerap kali menggunakan korelasi untuk mengetahui apakah terdapat hubungan yang kuat antara kenaikan gaji pegawai dengan jumlah pendapatan perusahaan.
Analisis korelasi mampu menjelaskan hal ini dan memberikan analisis yang bermanfaat bagi para pengambil keputusan.
Jenis hubungan korelasi
Ada 2 jenis korelasi :
1. Korelasi positif
Korelasi positif adalah hubungan antara 2 variabel dimana kenaikan satu variabel menyebabkan penambahan nilai pada variabel lainnya. Atau sebaliknya, semakin kecil nilai suatu variabel, nilai variabel lainnya juga akan ikut turun. Bisa dikatakan juga, korelasi ini merupakan hubungan yang searah.
Contohnya : penambahan usia berbanding lurus dengan penambahan tinggi badan, penambahan waktu produksi akan berbanding lurus dengan penambahan jumlah produksi.
2. Korelasi negatif
Korelasi negatif adalah hubungan antara 2 variabel dimana kenaikan satu variabel menyebakan penurunan nilai dari variabel lainnya. Begitu juga sebaliknya, semakin kecil nilai suatu variabel, semakin besar nilai variabel lainnya. Hubungan antara kedua variabel dalam kasus ini adalah berbalik arah.
Contohnya : semakin lama waktu belajar seseorang, semakin sedikit kesalahan yang dilakukan saat ujian.
Dalam pendugaan ada atau tidaknya korelasi, kita bisa mengacu kepada teori-teori yang sudah ada sebelumnya atau asumsi-asumsi yang sudah diyakini kebenarannya. Dengan teori ini, kita bisa menduga apakah terdapat korelasi antara kedua variabel atau tidak.
Misalkan saja, hubungan antara tingkat pendapatan dengan jumlah tabungan. Semakin tinggi pendapatan seseorang, semakin besar pula tabungan yang ia miliki.
Atau dengan contoh lain, semakin tinggi harga suatu produk, semakin rendah daya beli masyarakat.
Bila anda menemukan data-data dengan kondisi yang sudah memiliki dasar teori seperti itu, maka tentunya anda sudah bisa mengira apakah terdapat korelasi antar variabel atau tidak.
Maka langkah berikutnya yang perlu anda lakukan adalah mendeteksi hubungan korelasi tesebut dengan menggunakan metode statistik yang sudah valid.
Deteksi hubungan korelasi menggunakan scatterplot
Salah satu cara untuk mendeteksi apakah benar terdapat hubungan korelasi antara 2 variabel adalah dengan menuggunakan scatterplot. Dengan menggunakan scatterplot, kita bisa mendapatkan gambaran secara umum tentang kondisi dari dua variabel tersebut dan melihat apakah terdapat hubungan korelasia atau tidak.
Scatterplot juga membantu mendeteksi apakah terdapat outlier (data yang terlalu ekstrim) dari variebel tersebut.
Perhatikan gambar di bawah ini!
Berdasarkan gambar di atas, anda bisa melihat secara garis besar terdapat hubungan korelasi antara nilai ujian masuk dengan penjualan produk dari 30 orang sales.
Semakin besar nilai ujian, semakin tinggi pula nilai penjualan produk. Begitu juga sebaliknya.
Meskipun, data juga menunjukkan bahwa ada nilai yang tinggi tetapi menjual produk lebih sedikit dari yang nilainya lebih dibawahnya.
Namun secara umum, scatterplot ini membantu dalam deteksi awal apakah terdapat korelasi atau tidak.
Anda juga bisa menambahkan garis tren untuk penjelasan yang lebih mudah dimengerti. Diagram scatterplot menunjukkan bahwa tinggi hampir keseluruhan data berada pada kisaran garis tren yang bisa kita munculkan pada microsoft excel.
Interpretasi koefisien korelasi
Besaran nilai koefisien korelasi berkisar antara -1 hingga 1.
- 00 – 0.19 = korelasi antar variabel sangat lemah
- 20 – 0.39 = korelasi antar variabel lemah
- 40 – 0.59 = korelasi antar variabel cukup kuat
- 60 – 0.79 = korelasi antar variabel kuat
- 80 – 1.00 = korelasi antar variabel sangat kuat
Bila koefisien korelasi bernilai -1, artinya korelasi memiliki hubungan linier sempurna negatif.
Sedangkan, bila koefisien korelasi bernilai +1, artinya koefisien korelasi memiliki hubungan linier sempurna positif.
Bila koefisien korelasi bernilai nol, artinya tidak terdapat hubungan sama sekali antar kedua variabel tersebut.
Uji hipotesis pada analisis korelasi
Uji hipotesis juga bisa dilakukan pada analisis korelasi. Uji ini digunakan untuk membuktikan apakah antar variabel memiliki hubungan korelasi yang signifikan atau tidak.
(tidak terdapat hubungan korelasi yang signifikan antara variabel x dan y)
(t terdapat hubungan korelasi yang signifikan antara variabel x dan y)
Layaknya uji hipotesis lain, bila nilai p-value lebih kecil dari alpha, maka H0 ditolak dan H1 diterima. Begitu juga sebaliknya
Metode pengukuran korelasi
Secara umum, kita bisa mengetahui apakah 2 variabel memiliki hubungan korelasi atau tidak dengan menggunakan scatter plot seperti contoh di atas. Terlebih lagi, dengan menambahkan garis tren, kita bisa mengetahui apakah sebaran data terlalu jauh dengan garis tersebut atau berada di sekitar garis.
Tapi, sebagai seorang statistisi, tentu harus ada metode pengukuran yang bersifat eksak dan bisa menjelaskan dengan nilai yang akurat.
Secara umum, ada dua metode yang bisa digunakan dalam pengukuran korelasi
1. Koefisien korelasi pearson
Koefisien korelasi pearson merupakan metode pengukuran korelasi yang sering digunakan. Metode ini bisa digunakan dengan kondisi data sebagai berikut:
- Data memiliki skala interval atau rasio
- Korelasi antara 2 variabel haruslah linier, artinya distribusi data haruslah menunjukkan hubungan searah
Formula yang digunakan adalah:
Contoh :
Anggaplah kita memiliki data usia dan berat badan anak di sebuah kelas. Berdasarkan data tersebut, coba temukan nilai korelasi di antara keduanya!
Berdasarkan hasil pengujian, kita menemukan bahwa tingkat korelasi antara usia dan tinggi badan adalah 0,90. Artinya, terdapat hubungan yang sangat kuat antara usia dan berat badan.
Perhitungan koefisien korelasi pearson dengan microsoft excel
Bila anda kesulitan menggunakan rumus di atas, anda bisa menggunakan formula berikut pada microsoft excel
=correl(array1,array2)
array1 = blok seluruh data variabel pertama
array 2 = blok seluruh data variabel kedua
Perhitungan koefisien korelasi pearson dengan SPSS
Perhitungan dengan SPSS juga tidaklah rumit. Ikuti saja perintah berikut ini.
- Buka SPSS anda
- Input variabel dan data
- Pilih menu analyze >> corelate >> bivariate
- Pindahkan variable
- Klik opsi pearson
- Klik ok
Interpretasi yang anda dapatkan dari output SPSS di atas adalah
- Usia dan berat badan memiliki korelasi yang sangat kuat dengan nilai 0,90
- Nilai p-value antara usia dan berat badan adalah 0,000. Bila kita menggunakan nilai alpha sebesar 5 persen, Artinya, 0,000 < 0,05. Artinya H0 ditolak. Bisa disimpulkan bahwa korelasi antara usia dan berat badan signifikan.
2. Koefisien korelasi spearman
Koefisien korelasi spearman merupakan metode pengukuran korelasi yang digunakan bila data yang digunakan bersifat ordinal atau ranking.
Korelasi spearman sendiri memiliki dua kondisi penggunaan. Pertama, yaitu kondisi dimana data yang digunakan bersifat unik atau tidak ditemukan data ganda. Kedua, kondisi dimana data yang digunakan terdapat data ganda atau double.
Kita bahas dulu bila kondisi data yang digunakan semuanya unik atau tidak ada yang ganda. Formula yang digunakan adalah :
Sedangkan, untuk data ganda,rumus yang digunakan adalah
Dimana ada perhitungan faktor koreksi yaitu:
Karena terdapat data bernilai sama yang jumlahnya lebih dari 1, maka kita perlu menggunakan faktor koreksi dengan formula sebagai berikut.
Tahapan dalam menggunakan uji korelasi spearman :
- Susun peringkat data dari yang terkecil sampai terbesar. Bila ada data yang sama berikan nilai peringkat rata-rata.
- Cari selisih peringkat variabel pertama dengan variabel kedua.
- Gunakan formula perhitungan sesuai dengan kondisi data
Contoh penggunaan koefisien korelasi spearman
1.Tidak ada data ganda
Anggap saja, anda sebagai seorang guru dan ingin mengetahui apakah terdapat korelasi antara nilai matematika siswa dan nilai IPS siswa. Berikut data yang anda miliki.
Jadi, antara nilai IPS dan matematika memiliki korelasi negatif yang cukup kuat yaitu -0.66.
2. Terdapat data ganda
Pada variabel y, terdapat 2 data ganda sedangkan pada variabel x, tidak terdapat sama sekali data ganda. Maka, berikut hasil dari faktor koreksi:
Maka, kita bisa menggunakan formula analisis korelasi spearman secara lengkap!
Jadi, antara nilai biologi terdapat hubungan korelasi negatif yang sangat lemah yaitu sebesar -0,146.
Perhitungan koefisien korelasi spearman dengan SPSS
Perhitungan koefisien korelasi spearman dengan SPSS juga sama dengan korelasi pearson.
- Buka SPSS anda
- Input variabel dan data
- Pilih menu analyze >> corelate >> bivariate
- Pindahkan variabel yang akan dianalisis
- Klik bagian spearman
- Interpretasikan hasilnya
Interpretasi yang anda dapatkan dari output SPSS di atas adalah
- Nialai bilogi dan sosiologi memiliki korelasi yang sangat lemah dengan nilai -0.146
- Nilai p-value antara usia dan berat badan adalah 0.668. Bila kita menggunakan nilai alpha sebesar 5 persen, artinya, 0.688 > 010. Artinya H0 diterima. Bisa disimpulkan bahwa tidak terdapat hubungan korelasi yang signifikan antara nilai biologi dan nilai sejarah.
Hal yang perlu digarisbawahi dalam menggunakan analisis korelasi
Ada beberapa asumsi yang kerap kali salah ketika menggunakan analisis korelasi. Berikut saya tuliskan penegasan ulang agar kita memahami koefisien korelasi lebih baik.
1.Korelasi tidak bisa menjelaskan hubungan sebab akibat
Analisis korelasi hanya mampu menyatakan dan mengukur hubungan antar variabel, tapi tidak bisa meyatakan hubungan sebab akibat atau saling memengaruhi antar variabel. Korelasi tidak bisa menyatakan bila terdapat perubahan pada satu variabel, maka variabel lain akan terkena dampak perubahan juga.
2. Korelasi negatif bukan berarti tidak terdapat korelasi
Terkadang, kita berpikir bahwa korelasi negatif bermakna bahwa tidak terdapat hubungan sama sekali antar variabel. Korelasi negatif artinya terdapat hubungan berbalik arah antar variabel tersebut.
3. Kedua variabel yang dianalisis memiliki hubungan yang sama
Bila kita mendapatkan nilai korelasi antara variabel A dan B, maka hal ini juga berlaku sebaliknya. Nilai korelasi tersebut juga berlaku untuk hubungan antara variabel B dan A.
Sebelum melakukan analisis korelasi, pastikan jenis data yang digunakan terlebih dahulu.
Bila anda menggunakan data bersifat ranking atau ordinal, maka spearman adalah analisis yang baik.
Tapi, bila anda menggunakan data interval atau rasio, anda bisa menggunakan formula pearson.
Penutup
Analisis korelasi merupakan statistik inferensial yang mampu menjelaskan hubungan antarvariabel. Dalam menggunakan analisis korelasi, pastikan dulu jenis data yang digunakan sehingga anda bisa menentukan mana metode pengukuran yang tepat.
Hybrid government employee and internet marketing enthusiast. Blog ini berisi pengalaman-pengalaman saya dalam dunia birokrasi, statistik, internet marketing, bisnis online dan juga hal-hal menarik lainnya.