Statistika deskriptif dan inferensia

Ada dua ranah statistika yang perlu dikethui yaitu ranah statistika deskriptif dan ranah statistika inferensia/ induktif/ analisis. Perbedaan kedua ranah tersebut terletak pada tujuan dan asumsi yang mendasarinya.

Statistika deskripsi adalah meringkas atau menggambarkan data, sehingga tujuan dari statistika deskriptif adalah peringkasan atau penggambaran. Peringkasan dapat menggunakan ukuran-ukuran statistik/ parameter seperti rataan, nilai tengah, modus, quartil, ragam, dsb. Penggambaran diterapkan pada data dengan membuat tabulasi, gambar/ diagram visualisasi misalnya diagram kotak baris (box whiskers plot), diagram batang (bar chart), histogram, diagram kue (pie chart), diagram dahan-daun (stem and leaf), dsb. Pada prosedur statistika deskripsi ini tidak melibatkan asumsi.

pie chart

Gambar diatas adalah contoh dari diagram kue dari proporsi nilai impor komoditas kopi negara Austria tahun 2016 yang menggambarkan negara Brazil sebagai negara pengimpor paling besar yaitu mencapai setengah nilai impor dari negara tersebut (sumber: ITC).

Statistika inferensia digunakan untuk mengevaluasi perbedaan atau hubungan di dalam data. Dua masalah yang muncul dalam statistika inferensia adalah pendugaan dan uji hipotesis. Dasar data yang digunakan adalah data yang diambil dari sampel/ contoh (statistic) yang akan digunakan untuk menyimpulkan populasi (parameter). Misalnya uji tentang hubungan berat badan dengan tinggi badan, perbedaaan penghasilan berdasarkan latar belakang tingkat pendidikan, dsb. Pendugaan/ pengestimasian seberapa besar perbedaan tersebut dapat dilakukan dalam statistika inferensia Statistika inferensia klasik berlandaskan pada asumsi tertentu dari sebaran populasi.

Berikut adalah contoh statistika inferensia dengan uji t. Uji ini ingin mengetahui apakah nilai matematika dikelas A tidak sama dengan 68. Ada 10 sample mahasiswa yang diambil untuk menduga rataan populasi nilai matematika di kelas A (40 mahasiswa). Dalam contoh statistika inferensia ini akan diperoleh, nilai dugaan rataan populasi dan kesimpulan dari uji.


set.seed(2016)
nilai <- rnorm(40, 70, 10)
sample_nilai <- sample(1:40, 10)
(matematika <- nilai[sample_nilai])
#[1] 62.98133 62.36491 59.96520 60.06626 60.94410 63.14990 71.82997 65.80858 61.94418
#[10] 61.22908
t.test(matematika, mu = 68)
#
# One Sample t-test
#
#data: matematika
#t = -4.4454, df = 9, p-value = 0.001611
#alternative hypothesis: true mean is not equal to 68
#95 percent confidence interval:
# 60.49841 65.55830
#sample estimates:
#mean of x
# 63.02835

Author: Weksi Budiaji

Saya adalah dosen di Jurusan Agribisnis Universitas Sultan Ageng Tirtayasa (Untirta), Serang, Banten dengan minat di bidang statistika terapan (pertanian).