Korelasi Bagian I: Apa itu Korelasi
Korelasi atau Regresi? Pertanyaan seperti ini sering muncul ketika peneliti akan melakukan analisis statistik untuk melihat hubungan antar variabel. Jawaban yang sering saya dengar adalah: "Kalau korelasi itu untuk dua variabel, satu variabel independen dan satu variabel dependen.Sementara kalo regresi itu untuk lebih dari dua variabel, lebih dari satu variabel independen dan satu variabel dependen."
Ungkapan ini tidak sepenuhnya salah, karena regresi memang bisa digunakan untuk melihat hubungan antara lebih dari satu variabel independen dengan satu variabel dependen. Masalahnya adalah ungkapan ini tidak menggambarkan perbedaan utama antara regresi dan korelasi. Regresi juga bisa digunakan untuk menganalisis hubungan antara satu variabel independen dengan satu variabel dependen. Selain itu diperoleh kesan bahwa kedua teknik ini berbeda hanya pada tataran jumlah variabel yang ditangani, padahal perbedaan keduanya lebih dari itu.
Apa itu Korelasi?
Mungkin sebelum kita sampai ke sana, kita perlu membahas terlebih dulu apa itu teknik korelasi. Teknik korelasi merupakan teknik analisis yang melihat kecenderungan pola dalam satu variabel berdasarkan kecenderungan pola dalam variabel yang lain. Maksudnya, ketika satu variabel memiliki kecenderungan untuk naik maka kita melihat kecenderungan dalam variabel yang lain apakah juga naik atau turun atau tidak menentu. Jika kecenderungan dalam satu variabel selalu diikuti oleh kecenderungan dalam variabel lain, kita dapat mengatakan bahwa kedua variabel ini memiliki hubungan atau korelasi.
Ketika berbicara mengenai korelasi, biasanya orang (mahasiswa atau peneliti) akan berbicara mengenai korelasi antara dua atau lebih variabel yang memiliki skala pengukuran interval bukan kategorik. Sebenarnya pengertian korelasi juga dapat digunakan untuk menganalisis hubungan antara dua atau lebih variabel yang memiliki skala pengukuran kategorik. Tapi untuk sementara kita sisihkan dulu saja pembahasannya agar tidak terlalu rumit.
Angka yang digunakan untuk menggambarkan derajat hubungan ini disebut koefisien korelasi dengan lambang rxy. Teknik yang paling sering digunakan untuk menghitung koefisien korelasi selama ini adalah teknik Korelasi Product Momen Pearson. Teknik ini sebenarnya tidak terbatas untuk menghitung koefisien korelasi dari variabel dengan skala pengukuran interval saja, hanya saja interpretasi dari hasil hitungnya harus dilakukan dengan hati-hati.
Pemikiran utama korelasi product momen adalah seperti ini:
• Jika kenaikan kuantitas dari suatu variabel diikuti dengan kenaikan kuantitas dari variabel lain, maka dapat kita katakan kedua variabel ini memiliki korelasi yang positif. Jika kenaikan kuantitas dari suatu variabel sama besar atau mendekati besarnya kenaikan kuantitas dari suatu variabel lain dalam satuan SD, maka korelasi kedua variabel akan mendekati 1.
• Jika kenaikan kuantitas dari suatu variabel diikuti dengan penurunan kuantitas dari variabel lain, maka dapat kita katakan kedua variabel ini memiliki korelasi yang negatif. Jika kenaikan kuantitas dari suatu variabel sama besar atau mendekati besarnya penurunan kuantitas dari variabel lain dalam satuan SD, maka korelasi kedua variabel akan mendekati -1.
• Jika kenaikan kuantitas dari suatu variabel diikuti oleh kenaikan dan penurunan kuantitas secara random dari variabel lain atau jika kenaikan suatu variabel tidak diikuti oleh kenaikan atau penurunan kuantitas variabel lain (nilai dari variabel lain stabil), maka dapat dikatakan kedua variabel itu tidak berkorelasi atau memiliki korelasi yang mendekati nol.
Dari pemikiran ini kemudian lahirlah Rumus Korelasi Product Momen Pearson seperti yang sering kita lihat di buku. Ada beberapa rumus yang dapat diacu. Semuanya akan memberikan hasil r yang sama, hanya saja dengan melihatnya kita akan dapat melihat pemaknaan yang berbeda-beda.
Rumus pertama :
Ada beberapa hal yang dapat kita pelajari dari rumus ini :
1. Jika setiap subjek yang memiliki nilai X lebih rendah dari meannya, memiliki nilai Y yang juga lebih rendah dari meannya, nilai r akan menjadi positif. Begitu juga jika setiap subjek yang memiliki nilai X lebih tinggi dari meannya, memiliki nilai Y yang lebih tinggi dari meannya.
2. Jika setiap subjek yang memiliki nilai X yang lebih tinggi dari meannya, memiliki nilai Y yang lebih rendah dari meannya maka nilai r akan menjadi negatif. Begitu juga jika tiap subjek yang memiliki nilai X lebih rendah dari meannya memiliki nilai Y yang lebih tinggi dari meannya.
3. Jika tiap nilai X yang lebih tinggi dari meannya terkadang diikuti oleh nilai Y yang lebih tinggi terkadang lebih rendah dari meannya maka nilai r akan cenderung mendekati 0 (nol).
Rumus Kedua
Nah dari rumus kedua ini dapat kita simpulkan bahwa nilai korelasi sebenarnya nilai kovarian dari dua variabel x dan y yang distandardkan dengan menggunakan standard deviasi x dan standard deviasi y sebagai denominatornya. Mengapa nilai kovarian perlu distandardkan? (ada yang bertanya apa itu kovarian? lihat di posting berikutnya ya...). Nilai kovarian sangat dipengaruhi oleh satuan skala yang digunakan oleh kedua variabel. Misalnya kita menghitung kovarian dari tinggi badan dengan panjang rambut , pengen tahu apakah tinggi badan berkorelasi dengan panjang rambut (iseng banget yak...). Kita menghitung tinggi badan dan panjang rambut dalam satuan meter. Kemudian kita hitung kovariannya. Setelah itu kita menggunakan data yang sama, hanya mengubah satuannya menjadi centimeter, lalu menghitung kovariannya. Nah kovarian dari hasil perhitungan kedua akan terlihat lebih besar daripada yang pertama.
Lebih besar? Ya karena dengan menggunakan satuan centimeter, 1.4 meter akan menjadi 140 centimeter. Jika kita hitung kovariannya, perhitungan pertama akan menghitung dalam skala satuan (1.4, 1.5, dst) sementara perhitungan kedua akan menghitung dalam skala ratusan.
Oleh karena itu perlu distandardkan agar data yang sama akan menghasilkan angka yang sama meskipun diubah skalanya.
Rumus Ketiga
Rumus ketiga ini agak sulit ceritanya. Kalo nggak hati-hati bisa dimarah-marah sama Pedhazur (Pedhazur, 1997) soalnya. Begini:
• Zx dan Zy itu berbicara mengenai nilai X dan Y dalam satuan SD.
• Jika nilai X ada di bawah mean dari X maka nilai Zx akan negatif, jika nilai X ada di atas meannya maka nilai Zx akan positif. Begitu juga dengan Y.
• Seperti pada rumus pertama, jika Zx dan Zy sepakat (keduanya positif atau negatif) maka nilai r akan positif. Jika Zx dan Zy berlawanan (jika yang satu positif yang lain negatif) maka nilai r akan negatif.
• Nah misalnya ada seratus subjek memiliki nilai X dan Y. Lalu kita hitung satu-satu nilai Z dari X dan Y untuk tiap subjek. Tentu saja ada beberapa yang sangat sepakat yang lain agak sepakat yang beberapa berlawanan. Kemudian nilai-nilai Z ini dijumlahkan sehingga jika yang sepakat lebih banyak akan menghasilkan angka positif. Kalo yang berlawanan lebih banyak akan menghasilkan angka negatif. Kemudian hasil penjumlahan ini dicari rata-ratanya.
• Jadi bisa dibilang nilai r itu akan menggambarkan rata-rata keadaan X dan Y dari semua subjek dalam kelompok.
• Ribet ya? OK...OK... contohnya begini : misalnya ada sekelompok orang di stadion. Beberapa dari mereka (misalnya 80 orang) mengenakan baju hijau dan celana hijau, sisanya baju hijau celana merah (idih norak banget yak...). Kalo kamu ditanya bagaimana pakaian mereka? kita bisa bilang kebanyakan berpakaian sepakat hijau-hijau, karena tingkat kesepakatan hijau-hijau lebih dominan. Jadi bisa dibilang korelasi baju dan celana di kelompok itu positif. Semoga bisa lebih jelas ya. Fiuhh...
Rumus Keempat