Statistik deskriptif adalah bagian dari statistik yang paling mendasar yang tidak pernah bisa dipisahakan dalam analisis data. Statistik dekskriptif menjadi bagian yang wajib bagi setiap orang yang dekat dengan data.
Bila sebelumnya anda telah memahami pengertian statistik, seharusnya anda juga sudah sedikit mengenal bagaimana statistik deskriptif.
Statistik deskriptif merupakan proses analisis statistik yang fokus kepada manejemen, penyajian, dan klasifikasi data. Dengan proses ini, data yang disajikan akan menjadi lebih menarik lebih mudah dipahami, dan mampu memberikan makna lebih bagi pengguna data.
Bisa dikatakan, ini adalah analisis dasar yang wajib dikuasai oleh setiap orang yang bekerja dengan data.
1. Penyajian numerik
Penyajian numerik merupakan statistika deskriptif yang bertujuan untuk membuat data lebih sederhana dalam bentuk ukuran numerik. Dalam hal ini, terdapat berbagai pengukuran seperti mean, median, modus, variance, dll.
2. Visualisasi data
Visualisasi data bertujuan merupakan statistika deskriptif yang bertujuan untuk menyajikan data dalam bentuk visual atau grafik sehingga lebih menarik dan lebih mudah dipahami.
Dalam visualisasi ini, kita bisa menggambarkan data dalam beragam bentuk seperti menggunakan tabel, diagram batang (bar chart), diagram garis (line chart), diagram kue (pie chart), pemetaan wilayah, dll yang tentunya semakin berkembang sesuai dengan kemajuan teknologi.
Manfaat dari statistik deskriptif
Statistik deskriptif sangatlah bermanfaat dalam penyajian sebuah data.
1. Memberikan gambaran dan deskripsi bagaimana informasi yang dimiliki data tersebut
Statistik deskriptif haruslah mampu memberikan gambaran informasi apa saja yang bisa didapat secara dari data yang kita gunakan. Daripada hanya menggunakan angka-angka tanpa format yang baku, akan lebih menarik bila ditampilan dalam bentuk grafik dan tabel.
2. Menjelaskan karakteristik sebuah data
Statistik deskriptif juga memberikan karakteristik tentang data yang digunakan. Hal ini penting karena kondisi data yang digunakan akan memengaruhi seluruh analisis data yang kita lakukan.
Dengan memahami karakteristik, kita bisa memilih perlakuan yang tepat dalam analisis yang lebih mendalam nantinya.
Ukuran statistik deskriptif
Secara umum, ada 2 jenis pengukuran statistik deskriptif.
1. Ukuran pemusatan
Ukuran pemusatan adalah metode paling lazim yang digunakan dalam analisis deskriptif. Metode ini fokus untuk menggambarkan kondisi data di titik pusat.
Secara umum, kita bisa melihat bagaimana kondisi data dengan melihat dimana letak pusat data tersebut. Biasanya, pusat data sendiri akan berada pada nilai tengah, meskipun tida selalu demikian.
Untuk membuktikan hal ini secara matematis maka pengukuran yang sering digunakan adalah mean, median, dan modus. Kita bahas satu per satu.
Mean merupakan rata-rata dari sekumpulan data yang kita miliki. Formulanya sangat sederhana. Anda hanya perlu menjumlah nilai dari seluruh data yang dimiliki dan membaginya dengan jumlah data tersebut.
Median adalah nilai tengah dari sebuah data. Bila kita memiliki sekumpulan data, kita bisa mengurutkan data tersebut dari nilai terkecil hingga terbesar. Jika kita memiliki jumlah data ganjil, maka nilai tengah data tersebut akan langsung menjadi median. Namun bila kita memiliki data genap, kita perlu menemukan nilai rata-rata dari nilai tengah data tersebut.
Modus adalah nilai yang paling sering muncul dalam sekelompok data. Kita hanya perlu melihat nilai mana yang paling sering muncul dalam kelompok tersebut. Bila jumlah frekuensi setiap data sama, maka nilai modus tidak ada.
2. Ukuran keragaman
Ukuran keragaman merupakan ukuran untuk menyajikan bagaimana sebaran dari data tersebut. Ukuran keragaman menunjukkan bagaimana kondisi sebuah data menyebar di kelompok data yang kita miliki. Hal ini memungkinkan kita untuk menganalisis seberapa jauh data-data tersebut tersebar dari ukuran pemusatannya.
Bila sebaran datanya rendah, ini menunjukkan bahwa data tersebar tidak jauh dari pusatnya. Bila sebarannya jauh ini menunjukkan bahwa data tersebar jauh dari pusatnya.
Untuk menggambarkan hal ini, anda bisa menggunakan beberapa nilai pengukuran berikut.
1.Range
Range atau rentang merupakan selisih dari nilai terbesar dan nilai terkecil yang kita miliki. Range merupkan hal yang paling sederhana dan paling mudah dimengerti dalam ukuran penyebaran. Range menunjukkan seberapa jauh sebaran dengan mengabaikan bentuk distribusinya.
2. Quartiles Range
Rentang Quartiles atau rentang kuartil merupakan ukuran penyebaran yang membagi data menjadi 4 bagian. Sesuai dengan namanya, kuartil membagi data menjadi 25 persen di setiap bagiannya.
Ada 3 jenis nilai kuartil yang perlu kita tahu :
- Q1 atau kuartil bawah yang memuat 25 persen dari data dengan nilai terendah
- Q2 atau kuartil tengah, yang membagi data menjadi 2 bagian sama besar 50 persen terkecil dan 50 persen terbesar. Q2 juga memiliki nilai yang sama dengan median.
- Q3 atau kuartil atas yang memuat 25 persen dari data dengan nilai tertinggi.
3. Persentil
Persentil merupakan ukuran penyebaran yang membagi data menjadi 100 bagian sama besar.
4. Desil
Desil merupakan ukuran penyebaran yang membagi data menjadi 10 bagian sama besar.
4. Varians
Varians merupakan ukuran seberapa jauh menyebar dari nilai rata-ratanya. Semakin kecil nilai varians, semakin dekat sebaran data dengan rata-rata. Semakin besar nilai varian, semakin besar sebaran data terhadap nilai rata-ratanya.
5. Standar deviasi
Standar deviasi merupakan ukuran lain dari sebaran data terhadap rata-ratanya. Bila anda menggunakan varians, maka nilai yang anda dapatkan sangatlah besar. Nilai ini tidak mampu menggambarkan bagaimana sebaran data yang sebenarnya terhadap rata-rata.
Untuk mendapatkan nilai yang lebih mudah diinterpretasikan, standar deviasi adalah ukuran yang lebih tepat. Standar deviasi menghasilkan nilai yang lebih kecil dan mampu menjelaskan bagaimana sebaran data terhadap rata-rata.
Standar deviasi disebut juga dengan simpangan baku.
6. Skewness
Skewness merupakan ukuran yang menunjukkan bagaimana kemencengan sebuah data terhadap rata-ratanya. Skewness juga bisa dikatakan sebagai ukuran ketidaksimetrisan sebuah data.
- Sk > 0 artinya kurva dikatakan menceng kanan (positif)
- Sk = 0 artinya kurva normal
- Sk < 0 artinya menceng kiri (negatif)
7. Kurtosis
Kurtosis merupakan ukuran yang menunjukkan bagaimana keruncingan sebuah data di dalam distribusinya. Kurtosis biasa disebut juga sebagai derajat keruncingan. Kurtosis dihitung dengan formula momen keempat dari rata-rata.
- Nilai kurtosis = 3, artinya data memiliki distribusi normal
- Nilai kurtosis > 3, artinya data memiliki distribusi leptokurtic (lebih runcing)
- Nilai kurtosis < 3 artinya data memiliki distribusi platikurtik (lebih rata)
Contoh penggunaan statistik deskriptif
Oke, langsung saja ke praktek dan aplikasi ya. Saya tidak akan menunjukkan bagaimana perhitungan secara manual pada contoh ini.
Kenapa? Karena sudah banyak software yang bisa membantu anda menghasilkan keseluruhan analisis tersebut dengan sangat mudah. Dengan bantuan softaware, hasil yang kita dapatkan tentunya jauh lebih akurat.
Namun bagi anda yang diberi tugas untuk melakukan perhitungan secara manual, tetaplah hitung secara manual agar pola pikir anda terhadap berbagai pengukuran statistik deskriptif semakin mantap ini semakin mantap.
Pada artikel kali ini, saya akan menggunakan Microsoft Excel. Anda bisa saja menggunakan formula secara manual satu per satu, tetapi saya lebih memilih menggunakan perangkat analisis yang lebih lengkap dan komprehensif.
Tahapan yang perlu anda lakukan adalah sebagai berikut:
- Buka Micosoft Excel anda
- Pastikan data yang anda analisis sudah tersedia, bila tidak, anda bisa menggunakan data fiktif yang anda buat sendiri
- Pastikan anda sudah mengaktifkan fitur data analysis, bila belum silakan ke menu File > Options > Add-ins
- Aktfkan fitur tambahan pada Analysis ToolPak, klik ok.
- Anda akan mendapatkan fitur tambahan pada menu Data
Sekarang, mari kita lakukan analisis deskriptif sederhana. Dengan menggunakan microsoft excel dan fitur data analysis yang sudah aktif, anda dapat memunculkan beragam analisis deskriptif hanya dengan sekali klik!
Tabel 1. Tinggi Badan 15 Siswa di Kelas A
No. | Tinggi Badan (cm) |
1 | 156 |
2 | 164 |
3 | 166 |
4 | 158 |
5 | 158 |
6 | 152 |
7 | 171 |
8 | 169 |
9 | 154 |
10 | 173 |
11 | 177 |
12 | 155 |
13 | 165 |
14 | 155 |
15 | 173 |
Tahapan yang perlu anda lakukan:
- Pilih menu Data Analysis
- Pilih Descriptive Statistics
- Pada input range, block data yang akan anda analisis. Anda bisa mengaktifkan centang pada kata-kata label in first row jika pada cell pertama yang anda blok adalah keterangan dari data, dalam hal ini saya tidak mengaktifkan
- Pada output option, pilih dimana data hasil analisis akan muncul
- Aktifkan centang summary statistics
- Klik ok
Inilah hasil yang anda dapatkan
Berdasarkan hasil analisis di atas, ada beberapa kesimpulan penting yang bisa kita ambil:
- Siswa dengan tinggi badan tertinggi adalah siswa nomor 11 dengan tinggi 177 cm
- Siswa dengan tinggi badan terendah adalah siswa nomor 6 dengan tinggi 152 cm
- Jarak siswa tertinggi dan terendah adalah 25 cm
- Nilai tengah dari tinggi siswa adalah 164cm
- Rata-rata tinggi badan siswa adalah 163 cm (pembulatan)
- Data yang digunakan menceng kanan (Nilai Skewness < 0)
- Data yang digunakan leptokurtis (Nilai Kurtosis < 3)
Visualisasi Data Dalam Statistik Deskriptif
Visualisasi data bertujuan untuk menyampaikan dan menyajikan data agar informasi tersebut lebih mudah dipahami oleh pengguna data. Dengan adanya visualisasi, data bisa dipresentasikan dalam bentuk yang lebih menarik dan memiliki makna yang lebih berarti.
Hal paling dasar dalam visualisasi data yang paling dekat dengan kehidupan kita adalah tabel. Dengan menggunakan tabel, kita bisa meringkas informasi dalam bentuk baris dan kolom sehingga membuat penyajian data menjadi lebih sederhana.
Hanya saja, tabel terasa kurang informatif bila digunakan dalam ukurang yang sangat besar. Kita akan kesulitan mandapatkan poin-poin penting dari data yang dimiliki hanya dengan menampilkan data dalam bentuk tabel.
Karena itu, kita membutuhkan media lain yang bisa mendeskripsikan data sehingga menghasilkan informasi yang lebih bermakna.
Salah satu media yang paling sering digunakan dalam visualisasi data adalah grafik. Grafik merupakan metode yang digunakan untuk menyajikan informasi agar terlihat lebih menarik, informative dan lebih mudah dipahami sesuai dengan karakteristik dari data tersebut.
Selama ini, kita terbiasa menggunakan grafik dalam bentuk batang, garis, dll. Masing-masing grafik ini memiliki karakteristik tersendiri sehingga anda harus menyesuaikan penggunaannya. Ada grafik yang bertujuan untuk membandingkan data, ada yang menunjukkan penyebaran data, ada yang digunakan dalam melihat komposisi, dan ada juga grafik yang dalam melihat hubungan dari data yang dimilki.
Bila anda ingin membandingkan data, anda bisa menggunakan barchart atau diagram batang. Dengan mudah, anda bisa membandingkan perbedaan data tersebut antar waktu atau antar kategori.
Bila anda ingin melihat komposisi data, anda bisa menggunakan pie chart. Dengan pie chart, anda bisa melihat berapa proporsi dari tiap kelompok data yang anda miliki.
Bila anda ingin melihat karakteristik, anda bisa menggunakan stacked bar chart. Dengan grafik ini, anda bisa melihat karakteristik antar waktu atau antar kelompok data sehingga lebih mudah dipahami.
Bila anda ingin melihat hubungan antar data, anda bisa menggunakan scatterplot. Hal ini lazim digunakan sebagai deteksi awal dalam penggunaan analisis korelasi dan analisis regresi.
Di era milenial ini, data lebih populer dideskripsikan dalam bentuk infografis. Hal ini dikarenakan data akan terlihat lebih menarik dan lebih mudah dipahami.
Masih banyak lagi jenis visualisasi data yang bisa anda gunakan dalam statistik deskriptif. Visualisasi data saat ini menjadi elemen menarik dalam penyajian statistik deskriptif. Hal ini dikarenakan data memiliki peran yang semakin vital dalam kehidupan masyarakat.
Bila anda ingin mempelajari analisis deskriptif dengan Microsoft Excel, silakan simak video berikut!
Jangan pernah remehkan statistik deskriptif
Banyak yang meremehkan analisis statistik deskriptif dan menganggap sepele penggunannya. Mungkin hal ini dikarenakan formula yang digunakan sangatlah sederhana sehingga dirasa kurang bermanfaat.
Benarkah demikian?
Sejujurnya, statistik deskriptif dan statistik inferensia memiliki manfaat yang sama. Keduanya memberikan gambaran yang lebih mudah kepada pembaca bagaimana kondisi dari data yang digunakan.
Sayangnya, banyak yang menggunakan statistik deskriptif hanya untuk menggambarkan kondisi data, tanpa melakukan elaborasi yang lebih dalam dan bermakna.
Sebagai contoh, nilai mean tidak hanya sekedar bermakna rata-rata, tetapi juga memberikan gambaran bagaimana kondisi data secara umum. Anda juga bisa membandingkan satu rata-rata dengan rata-rata lain sebagai perbandingan yang lebih menarik.
Sebagai contoh, anda bisa melihat bagaimana debat capres dan debat cawapres berjalan. Tanpa memihak kepada salah satu pasangan (karena ASN memang diwajibkan netral), anda bisa melihat bahwa banyak data yang digunakan dari debat adalah bagian dari statistik deskriptif.
Beberapa data seperti rasio ibu meninggal, rasio elektrifikasi, rata-rata produksi, dan lain-lain merupakan bentuk statistik deskriptif yang sangat bermanfaat bila digunakan dalam narasi yang tepat.
Angka rata-rata saja sudah mampu memacu perdebatan dan menghasilkan informasi yang menarik bagi yang menontonnya. Begitulah manfaat statistik deskriptif dalam kehidupan.
Bila anda mendeskripsikan statistik deskriptif hanya dalam bentuk analisis sederhana, tentu analisis ini akan terasa kurang bermanfaat.
Sebagai contoh, rata-rata nilai matematika kelas A adalah 80 dan rata-rata nilai kelas B adalah 90, tentu kita hanya mendapatkan informasi bahwa kelas B memiliki nilai yang lebih tinggi dari kelas A.
Tetapi, bila kita mendalami lebih jauh, kita bisa menambahkan analisis ini dengan berbagai penjelasan sehingga angka tersebut tidak hanya sekedar angka, tetapi memberi makna yang lebih luas.
Anda bisa menambahkan penjelasan lain seperti bagaimana budaya belajar dari kelas A dan kelas B, bagaimana guru-guru mengajar di masing-masing kelas tersebut sehingga penjelasan analisis deskriptif tersebut akan jauh lebih berbobot dan berisi.
Penutup
Statistik deskriptif merupakan salah satu jenis statistik dasar yang mampu menjelaskan bagaimana karakteristik dasar sebuah kelompok data.
Penjelasan yang baik dalam penggunaan ini akan membuat data-data yang kita miliki memberikan pemahaman yang lebih berarti.
Gunakan sebaik mungkin agar data yang anda miliki menjadi lebih bermanfaat dan mudah dipahami!
Hybrid government employee and internet marketing enthusiast. Blog ini berisi pengalaman-pengalaman saya dalam dunia birokrasi, statistik, internet marketing, bisnis online dan juga hal-hal menarik lainnya.