Memahami pengertian data adalah hal fundamental sebelum melakukan penelitian. Hal ini akan menentukan jenis dan kemana arah penelitian yang kita gunakan.
Terkadang, masih ada juga yang masih bingung antara pengertian data dan statistik. Apakah data itu sama dengan statistik? Bagaimana hubungan antara data dan statistik?
Mari kita bahas pada artikel ini.
Dalam penggunaannya, terdapat beberapa jenis data yang perlu kita pahami. Dengan mengetahui jenis-jenis ini, kita bisa memilih metodologi statistik dan perlakuan yang tepat dalam menganalisis data yang kita miliki.
Tapi sebelum lebih jauh, mari kita bahas dulu definisi data.
Pengertian data
Berikut pengertian data berdasarkan beberapa sumber:
Menurut kbbi, data artinya keterangan yang benar dan nyata.
Berdasarkan Peraturan Presiden Nomor 39 tahun 2019, data adalah catatan atas kumpulan fakta atau deskripsi berupa angka, karakter, simbol, gambar, peta, tanda, isyarat, tulisan, suara, dan/atau bunyi, yang merepresentasikan keadaan sebenarnya atau menunjukkan suatu ide, objek, kondisi, atau situasi.
Secara umum, pengertian data adalah kumpulan informasi yang diperoleh dengan berbagai macam cara. Data bisa menjadi bukti dari sebuah kejadian yang dan dapat diukur dengan metode ilmiah.
Data bukan hanya sekedar asumsi, opini, atau sesuatu yang bersifat khayalan atau imajinasi. Data adalah sesuatu yang kuat dan sulit ditolak oleh semua orang. Data tidak bisa dibuat hanya berdasarkan perkiraan.
Data disusun dengan cara yang terstruktur dan sistematis sehingga bisa diterima, dimengerti, diolah, dan dianalisis oleh banyak orang.
Sedangkan statistik adalah hasil dari data yang sudah diolah tadi. Statistik bisa saja berbentuk rata-rata, persentase, nilai tengah, modus, dll. Statistik memuat informasi yang sudah diolah dan bisa diinterpretasikan lebih detail daripada data.
Syarat data yang baik
Dalam menggunakan data, ada syarat dan kriteria yang harus kita perhatikan agar data tersebut memang layak kita gunakan.
- Objektif
Data haruslah objektif dan sesuai dengan fakta dan keadaan yang sebenarnya.
- Representatif
Data harus bisa mewakili gambaran dari sebuah kondisi. Satu atau dua kejadian saja tidak cukup dijadikan sebagai data
- Memiliki standard error harus kecil
Data yang baik hendaknya memiliki standar error yang kecil. Hal ini untuk menjamin kualitas data yang kita miliki memang sesuai dengan kondisi yang sebenarnya.
- Up to date
Data yang kita miliki harus bisa menggambarkan sebuah kondisi di waktu tertentu. Data tidak bisa digunakan untuk menggeneralisir kondisi pada keseluruhan waktu.
- Relevan
Data yang dikumpulkan harus memiliki hubungannya dengan masalah atau kondisi yang ingin kita teliti.
Contoh penggunaan data dengan tepat
Silakan baca ilustrasi di bawah ya.
Dalam agenda rutin tahunan perusahaan, seorang CEO biasanya selalu memberikan penghargaan terbak perlu melakukan pengecekan tahunan dan mengevaluasi kinerja karyawan. Tujuannya adalah untuk memberikan penghargaan bagi karyawan dengan kinerja terbaik, atau biasanya disebut “Employee of The Year”.
Berdasarkan beberapa kriteria, sang CEO mendapatkan 3 kandidat terbaik. Mereka adalah Joni, Bagus, dan Dela.
Joni adalah orang yang rendah hati dan sopan. Dia selalu bersikap baik kepada semua orang, bahkan kepada satpam dan juru bersih. Dia selalu tersenyum ketika menyapa orang lain. Semua karyawan di kantor menyukai Joni.
Tetapi, berdasarkan laporan bagian administrasi, Joni pernah tersangkut masalah keuangan dimana ia terlambat beberapa bulan dalam mengembalikan pinjaman pada koperasi kantor sehingga menjadi catatan indisipliner bagi Joni.
Bagus juga kandidat yang layak untuk mendapatkan penghargaan karyawan terbaik. Dia sangatlah disiplin dan tidak pernah terlambat untuk bekerja. Terkadang, dia bekerja lembur bahkan tanpa instruksi. Pekerjaannya selalu memuaskan. Dia juga tak segan memberikan ide dan masukan.
Tetapi, berdasarkan catatan kepegawaian, Bagus pernah teledor lupa mengirim surat yang menyebabkan kerugian immaterial bagi perusahaan. Memang bukan kerugian dalam bentuk uang, tetapi tetap saja ada catatan tidak baik dalam karir Bagus.
Dela adalah kandidat terakhir yang direkomendasikan. Sepintas, Dela terlihat seperti seperti karyawan biasa saja. Tetapi, hampir seluruh pekerjaannya selesai dengan sempurna.
Orangnya tidak banyak bicara dan bahkan terkadang kehadirannya tidak disadari. Dia selalu datang dan pulang tepat waktu. Tidak pernah sedikitpun terdengar ada masalah yang dibuat oleh Dela.
Akhirnya, setelah banyak pertimbangan, CEO memilih Dela sebagai karyawan terbaik tahun ini. Banyak orang terkejut dengan keputusan ini. Beberapa orang bahkan menyampaikan ketidakpuasan atas hal ini.
Tetapi, data yang dimiliki perusahaan mengatakan bahwa Dela unggul dalam banyak aspek dan tidak memiliki catatan kinerja yang buruk.
Begitulah cara dan penggunaan data yang tepat dalam membantu mengambil keputusan terbaik. Keputusan yang berbasis data seringkali sulit untuk ditolak karena memuat pengukuran yang sama dan jelas bagi setiap orang.
Seharusnya, setiap kebijakan di negeri ini dibuat berdasarkan data yang tepat dan akurat sehingga setiap program yang disusun akan memberikan ouput yang maksimal.
Mengapa kita harus mengetahui tipe-tipe data dalam statistik?
- Untuk mengidentifikasi masalah dengan tepat
Mengetahui jenis data akan membuat kita memahami kondisi data dan memilih perlakuan yang tepat agar nantinya solusi yang dihasilkan bisa tepat sasaran.
- Untuk memilih analisis yang sesuai
Setiap data memiliki karakteristik masing-masing. Dengan mengetahui kelebihan dan kekurangan setiap jenis data, kita bisa memilih alat analisis yang tepat.
- Agar setiap data bisa menyelesaikan masalahnya
Setiap penggunaan dan analisis data bertujuan untuk menghasilkan kesimpulan dan solusi yang bisa kita pergunakan. Dengan mengetahui tipe dan jenis data, tentunya kita bisa menentukan kesimpulan dan solusi yang bisa digunakan nantinya.
Setiap tipe data memiliki perlakuan dan analisis yang berbeda
Jenis-jenis data
Secara umum, terdapat 2 jenis data berdasarkan sifatnya:
- Data Kualitatif
Data kualitatif adalah jenis data yang bukan dalam bentuk angka, tetapi bisa dalam bentuk sifat atau kategori. Contohnya, data tentang kepuasan konsumen yang mengandung tiga jenis dikategorikan, sangat puas, puas, dan tidak puas. Ini sering digunakan dalam analisis sosial atau psikologi.
- Data Kuantitatif
Data kuantitatif adalah data yang memiliki nilai atau angka dan bisa dihitung. Secara singkat, itu adalah sesuatu yang dapat dihitung atau dihitung.
Contohnya, data berat badan, tinggi badan, pendapatan rumah tangga, pengeluaran per kapita, dll.
Berdasarkan skala pengukurannya, data terbagi atas:
- Data nominal
Data nominal adalah tingkatan data yang paling rendah dan mudah dipahami. Data ini sifatnya hanya membedakan antar kelompok dan terlihat paling sederhana dibandingkan jenis data lain.
Contohnya, anggaplah menggunakan gender sebagai subjek penelitian. Kemudian, kita melakukan klasifikasi dengan memberikan kode 1 untuk pria, dan 2 untuk wanita. Tidak ada maksud khusus dalam pemberian angka pada klasifikasi ini, hanya sekadar angka saja tanpa ada makna yang berarti.
- Data Ordinal
Data Ordinal adalah data yang memiliki sifat-sifat data nominal yang menunjukan tingkatan, peringkat, urutan, atau hirarki.
Contohnya, peringkat siswa di sekolah (ranking 1-10), kelompok pendapatan masyarakat (bawah, menengah, atas), dll.
- Data interval
Data interval adalah data yang memiliki sifat-sifat data ordinal dimana skala pengukuran di mana kita tidak hanya hanya mempertimbangkan level, tetapi juga nilai tertentu. Pada data interval, titik nol memiliki nilai yang tidak tepat.
Contoh sederhana dari data interval adalah suhu. 100 celcius, 200 celcius, dan 800 celcius memiliki tingkat panas yang berbeda. Tapi bukan berarti 200 celcius dua kali lebih panas dari 100 celcius.
- Data rasio
Data rasio merupakan tingkatan data tertinggi. Skala ini memiliki semua kelebihan dari data interval. Pada data rasio, nilai nol merupakan nilai mutlak dan memiliki arti yang bisa dibandingkan satu sama lain. Jenis data ini paling sering digunakan untuk penelitian.
Contoh: Bila berat badan seseorang 80kg, artinya ia 2 kali lebih berat daripada orang yang memiliki berat 40 kg.
Jenis data berdasarkan sumber data:
- Data internal
Data internal adalah data yang sudah dimiliki oleh lembaga atau perusahaan dan siap digunakan tanpa proses yang memerlukan bantuan pihak luar.
Contoh, data perusahaan untuk gaji dan karyawan, data pengeluaran pemerintah, dll.
- Data eksternal
Data eksternal adalah data yang dibutuhkan oleh perusahaan atau lembaga tetapi sayangnya tidak tersedia. Jadi, untuk memenuhi kebutuhan data tersebut, institusi mulai melakukan pengumpulan data dengan metode-metode tertentu seperti survei dan sensus.
Contoh pengunaan data internal dan eksternal dalam sebuah perusahaan.
Ebay adalah sebuah perusahaan e-commerce yang memfasilitasi berbagai perdagangan berbagai jenis produk hingga seluruh dunia. Setiah harinya, Ebay selalu mengumpulkan berbagai jenis data yang terjadi lewat website yang mereka miliki.
Setiap harinya, Ebay melakukan analisis data jumlah produk, klasifikasi produk, produk berdasarkan lokasi, produk paling sering dicari, dll. Data-data seperti ini bisa disebut sebagai data internal.
Sementara itu, data lain seperti produk terlaris, produk dengan rating terburuk, produk dengan keluhan terbanyak, dll yang berasal dari pengunjung atau pembeli di E-bay, bisa disebut sebagai produk eksternal.
Menurut proses pengumpulan, data dikategorikan berdasarkan:
- Data primer
Data primer adalah data yang dikumpulkan secara langsung oleh seseorang atau institusi . Proses pengumpulan data bisa dilakukan dengan cara wawancara langsung, telepon, email, inspeksi lapangan, pengamatan, observasi, dan lainnya.
Karena data tersebut langsung diperoleh dari objek penelitian, maka tentu harapannya memiliki tingkat akuraasi yang tinggi. Di sisi lain, pengumpulan pata primer membutuhkan biaya, waktu, dan tenaga, yang relatif lebih besar daripada data sekunder.
Contoh data primer adalah bila kita ingin mengetahui pola konsumsi rumah tangga di suatu wilayah. Karena tidak ada data tersedia, mau tidak mau kita harus menyusun kuesioner dan memilihi metodologi pengambilan sampel yang tepat untuk mendapatkan data tersebut.
- Data sekunder
Data sekunder data yang dikumpulkan dengan cara mengumpulkan data-data yang sudah tersedia oleh para penyedia data sehingga kita bisa menggunakan data tersebut secara langsung. Dalam prosesnya, kita hanya perlu menghubungi orang atau institusi penyedia data sehingga jauh lebih efisien dari segi biaya, tenaga dan waktu bila dibandingkan data primer.
Contoh data sekunder adalah data yang disediakan langsung oleh website Bank Dunia atau dari Badan Pusat Statistik.
Berdasarkan waktu pengumpulan, data dikategorikan berdasarkan:
- Data Runtun Waktu (Time Series)
Data runtun waktu adalah data yang dikumpulkan untuk tujuan tertentu dengan mengamati tren atau pola yang berubah berdasarkan waktu. Dengan mengamati perubahan yang terjadi antar waktu, kita bisa melihat bagaimana waktu memengaruhi sebuah variabel.
Contohnya,bagaimana pola penjualan produk pakaian secara musiman. Bila anda menggunakan google trend, anda akan melihat bahwa puncak penjualan akan terjadi mendekati hari raya Idul Fitri dan akhir tahun.
- Data Cross Section
Data cross section adalah data yang dikumpulkan dalam satu titik waktu tertentu, tetapi mempertimbangkan banyak kondisi dan aspek yang terjadi di waktu tersebut.
Contohnya saja, data indikator makro strategis Indonesia seperti pertumbuhan ekonomi, inflasi, koefisien gini, jumlah penduduk miskin, dll pada tahun 2018.
Jenis Data Berdasarkan Kondisi Data
Berdasarkan kondisi data, terdapat 2 jenis data yang perlu diketahui:
- Data Terstruktur
Data terstruktur merupakan data yang memiliki informasi yang lengkap dan sesuai dengan kriteria yang dibutuhkan sehingga lebih mudah untuk dibaca dan diolah.
Contoh data terstruktur adalah misalkan anda menggunakan data jenis kelamin. Biasanya, jenis kelamin laki-laki diberi kode 1 dan jenis kelamin perempuan diberi kode 2.
Hal ini akan sangat memudahkan pengolahan karena sudah memiliki struktur yang baku dan tidak akan berubah-ubah.
2. Data tidak terstruktur
Data tidak terstruktur merupakan data yang memiliki informasi yang kurang lengkap atau tidak sesuai dengan kriteria yang dibutuhkan sehingga dibutuhkan proses lanjutan agar mudah untuk dibaca dan diolah.
Contoh data tidak terstruktur adalah data jenis kelamin yang belum diberikan kode secara baku.
Misalkan saja, saat pengisian data jenis kelamin pada kuesioner, terdapat isian seperti: Laki-laki, pria, laki-laki,lk, perempuan, wanita, dll.
Hal ini sangat menyulitkan pengolahan dan analisis data sehingga diperlukan tahapan cleaning atau pembersihan data.
Data seperti di atas harus dirapikan sesuai dengan aturan pengolahan sehingga mudah untuk dilakukan tabulasi hasil.
Penutup
Mengetahui pengertian data dan jenis data merupakan tahapan yang penting.
Data adalah kumpulan informasi yang diperoleh dengan berbagai macam cara.
Syarat data yang baik adalah objektif, representatif, memiliki standar error yang kecil, uptodate, dan relevan.
Hal ini akan membuat kita lebih paham terhadap kekurang dan kelebihan masing-masing data sehingga bisa memilih metode analisis yang tepat.
Memahami pengertian data beserta jenisnya akan membantu kita dalam menentukan jenis analisis yang tepat nantinya.
Hybrid government employee and internet marketing enthusiast. Blog ini berisi pengalaman-pengalaman saya dalam dunia birokrasi, statistik, internet marketing, bisnis online dan juga hal-hal menarik lainnya.