Statistika Dalam Dunia Data (Vol. 1.2) : Teknik Pengumpulan Data dalam Ilmu Statistika
Memahami bentuk dan variasi pengumpulan pada data (data collection) dalam ilmu statistika.
Pengantar
Setelah di materi sebelumnya, di Vol.1, kita sudah mengenal tentang pengertian statistika secara dasar dan jenis atau tipe data dalam ilmu statistika, disini kita akan bahas materi pengenalan lagi dalam statistika, khususnya statistika deskriptif. Di kesempatan kali ini kita akan membahas terkait bentuk pengumpulan data, yang mana ini merupakan materi fundamental yang sangat penting dalam penenerapannya di dunia data.
Secara umum dalam proses Data Life-Cycle, kita aka melewati proses pengumpulan data (data collection) sebelum kita melakukan analisa data dan ini merupakan proses yang sangat menentukan terkait data yang akan kita analisa nantinya. Oleh karena itu, memahami metode-metode dalam pengumpulan data dalam ilmu statistika sangat penting sebagai dasar sebelum melakukan pengolahan dan analisa data lebih lanjut.
Pengumpulan Data (Data Collection)
Dalam melakukan pengumpulan data, kita perlu memahami tentang bagaimana cara kita menerapkan teknik yang tepat agar proses pengumpulan yang kita lakukan tidak bias. Dalam ilmu statistika sendiri, teknik pengumpulan data dapat dilakukan dengan 2 pendekatan, yaitu :
- Sensus
- Sensus merupakan metode pengumpulan data yang dilakukan pada skala atau tingkat populasi.
- Data yang dikumpulkan dengan metode ini sangat lengkap dan akurat, namun waktu dan biaya yang dibutuhkan sangat tinggi.
- Sampling
- Sampling merupakan metode pengumpulan data yang dilakukan pada skala atau tingkat sample dalam suatu populasi.
- Data yang dikumpulkan dengan metode sampling kurang lengkap dan berpotensi tidak akurat, dan juga dari segi waktu dan biaya yang dibutuhkan tergolong rendah apabila dibandingkan dengan penggunaan metode sensus.
- Penggunaan metode ini cukup umum digunakan dalam pengimplementasian statistik. Oleh karena itu, sample yang bagus merupakan sample yang sapat merepresentasikan populasinya dan alhasil dibutukan pengimplementasian metode sampling yang tepat untuk dapat membuat sample yang nilai representatifnya tinggi.
- Karena sifat sample sendiri merupakan hasil representatif atau sub-bagian dari populasi, maka selisih atau perbedaan nilai (dalam statistik : Sampling Error) antara sample dengan populasi pasti ada dan tidak bisa dihindari, entah sebaik atau sebagus apapun pengimpelementasian metode sampling yang dilakukan.
Setalah penjelasan ini, kita akan jauh lebih banyak membahas metode pengumpulan data menggunakan metode sampling, karena ini merupakan metode yang paling banyak digunakan dalam bidang statistik, di luar dari faktor biaya dan waktu penerapan metode sensus yang tergolong tinggi dibandingkan metode sampling.
Jenis Sampling dalam Statistika
Pemilihan sample dalam penerapan metode sampling di bagi menjadi 2 jenis, yaitu :
- Sampling with Replacement
- Sampling with replacement merupakan bentuk pemilihan anggota populasi (unit sampling) yang memungkinkan anggota populasi yang telah terpilih menjadi anggota sample dapat terpilih lagi (lebih dari satu kali) untuk menjadi anggota sample, dan hal ini akan dikembalikan lagi ke populasi
- Sampling without Replacement
- Sampling without replacement merupakan bentuk pemilihan anggota populasi yang memungkinkan anggota populasi yang terpilih menjadi anggota sample hanya dapat terpilih satu kali saja.
Macam-Macam Teknik Sampling dalam Statistika
Teknik sampling atau pengambilan sampel merujuk pada proses memilih anggota dari populasi dalam sebuah data populasi penelitian. Pada sesi kali ini, saya akan membahas tentang 3 teknik sampling yang umum digunakan:
- Simple Random Sampling Technique
- Teknik Simple Random Sampling merupakan teknik pengumpulan data sample yang dilakukan secara acak atau random, dengan dasar bahwa setiap unit anggota populasi memiliki bentuk peluang yang sama untuk dapat terpilih sebagai anggota sample.
Contoh :
kasus : Terdapat 10.000 penduduk yang terdaftar sebagai penduduk di kabupaten wakanda dan kita akan mengambil 100 orang penduduk untuk dilibatkan ke dalam suatu penelitian demografi sosial.
sampling : Setiap penduduk diberikan nomer dari angka 1 hingga 10.000 melalui SMS dan setelah itu dilakukan pemilihan menggunakan alat random number generator (alat pemilihan nomor automatis secara acak) sebanyak 10 kali dengan rentang nilai 1–10.000 .
- Stratified Sampling Technique
- Teknik Stratified Sampling merupakan teknik pengumpulan data sample secara acak dengan terlebih dahulu melakukan pengelompokan anggota populasi (istilah kelompoknya disebut strata) berdasarkan kesamaan karakteristik tertentu, seperti : jenis kelamin, umur, dan lain-lain. Setelah itu, anggota dari setiap kelompok (strata) akan di pilih secara acak untuk dijadikan sebagai anggota sample
- Sampling yang dilakukan pada setiap kelompok (strata) harus proporsional dengan proporsinya dalam populasi, seperti pada ilustrasi di bawah
Pada gambar diatas terlihat terdapat strata biru, merah, dan hijau. yang dimaksud proporsional adalah jumlah pemilihan acak (per-unit) pada setiap strata (strata biru, merah, dan hijau) untuk data sample yang disesuaikan dengan banyaknya/besarnya/volume nilai pada strata tersebut. Contoh, pada strata biru hanya diambil 1 anggota populasi (dari 3 anggota populasi) untuk dijadikan anggota sample, strata merah hanya diambil 2 (dari 6 anggota populasi), dan strata hijau hanya diambil 1 (dari 3 anggota populasi).
Contoh :
Kasus : Dilakukan survei terhadap 1000 pengungsi perang terkait layanan negara Wakanda sebagai negara penyedia layanan bantuan dan korban perang. Dari data populasi yang terdata, sebanyak 40.000 pengungsi, dibentuk 2 strata berdasarkan jenis kelamin mereka, yaitu strata pria dan strata wanita.
Sampling : Dari data populasi pengungsi (40.000 pengunsi), tetapi kita hanya memerlukan data sampling sebanyak 1000 pengungsi untuk survei penelitian kita. Setelah dilakukan pembagian data berdasarkan 2 strata jenis kelamin (laki-laki dan perempuan), diketahui bahwa jumlah persentase proporsi populasi pengungsi laki-laki dan perempuan adalah 35% : 65% (35% laki-laki dan 65% perempuan). Oleh karena itu, sampling yang akan dilakukan harus proporsional sesuai dengan proporsi jumlah laki-laki dan perempuan pada populasinya, yaitu dengan mengambil anggota populasi secara acak pada strata laki-laki sebanyak 350 pengungsi dan pada strata perempuan sebanyak 650.
- Cluster Sampling Technique
- Teknik Cluster Sampling merupakan teknik pengumpulan data secara acak atau random dengan membagi pengelompokan anggota populasi (istilah kelompoknya disebut cluster) berdasarkan pengelompokan yang sudah terbentuk di awal, seperti : Desa, Kecamatan, Negara, dan lain-lain. Setelah itu, anggota dari setiap kelompok (cluster) akan di pilih secara acak untuk dijadikan sebagai anggota sample.
- Sampling yang dilakukan pada setiap kelompok (cluster) harus proporsional dengan proporsinya dalam populasi, seperti pada ilustrasi di bawah.
Secara pengambilan anggota populasi untuk dijadikan anggota sample sama dengan teknik stratifiedn sampling
Contoh :
Kasus: Dilakukan survey pendataan jenis pekerjaan pada tiap penduduk di Madura
Sampling : Karena Madura terbagi menjadi 4 Kabupaten, maka pendataan dilakukan secara acak atau random pada tiap Kabupaten dengan syarat jumlah sample yang akan dipilih per-Kabupaten harus proporsional dengan persentase jumlah penduduk di setiap Kabupatennya (tentu penyelesaiannya sama dengan teknik stratified sampling)
Penutup
Setelah pembelajaran terkait pengumpulan data ini, saya harap teman-teman dapat memahami konteks dan pengimplementasian dalam melakukan pengumpulan data secara baik, jelas, dan benar. Di luar materi yang saya jelaskan, masih banyak macam-macam teknik yang bisa teman-teman eksplore lebih jauh lagi dan semoga materi yang saya sampaikan menjadi dasar pembalajaran teman-teman dalam memahami ilmu statistika lebih dalam dan lebih advance. Terima kasih.
Tambahan
Teman-teman bisa ikuti akun medium atau LinkedIn saya untuk diskusi terkait materi ini atau materi lainnya mengenai data. Karena pada dasarnya akun medium ini akan membahas seputar data dari Fundamental hingga Advance pada tagline #BelajarDataLagi di LinkedIn.