Rizki Seorang pemuda yang tinggal bersama Kakek dan Nenek.

Statistika Deskriptif

4 min read

Statistika adalah cabang matematika yang berhubungan dengan pengumpulan, interpretasi, pengorganisasian, dan interpretasi data. Awalnya, ketika kami mendapatkan data, alih-alih menerapkan algoritma mewah dan membuat beberapa prediksi.

Pertama-tama kami mencoba membaca dan memahami data dengan menerapkan teknik statistik. Dengan melakukan ini, kami dapat memahami jenis data distribusi apa yang dimiliki.

Pengertian Statistika Deskriptif

Statistika deskriptif adalah ilmu yang melibatkan ringkasan dan pengorganisasian data sehingga mudah dipahami. Statistik deskriptif, tidak seperti statistik inferensial, berupaya menggambarkan data.

Biasanya menggambarkan data dalam sampel. Ini umumnya berarti bahwa statistik deskriptif, tidak seperti statistik inferensial, tidak dikembangkan berdasarkan teori probabilitas.

Jenis Statistik Deskriptif

Statistika deskriptif dipecah menjadi dua kategori. Ukuran tendensi sentral dan ukuran variabilitas (penyebaran).

Penyajian Data Numerik

Penyajian data secara numerik terdiri dari beberapa macam – macam, yaitu diantaranya :

  • Pertama, Central Tredency.
  • Kedua, Dispersion atau pencaran.
  • Ketiga, Fractile.
  • Keempat, Skewness.
  • Kelima, Pengukuran Keruncingan.

Mengukur Tendensi Pusat

Kecenderungan sentral mengacu pada gagasan bahwa ada satu angka yang paling baik merangkum seluruh rangkaian pengukuran, angka yang dalam beberapa cara “sentral” ke himpunan.

Rata-Rata

Rata-rata atau Average adalah kecenderungan sentral dari data yaitu angka di mana seluruh data tersebar. Di satu sisi, ini adalah angka tunggal yang dapat memperkirakan nilai seluruh kumpulan data.

Mari kita hitung rata-rata dari kumpulan data yang memiliki 8 bilangan bulat.

Median

Median adalah nilai yang membagi data dalam 2 bagian yang sama yaitu jumlah istilah di sisi kanan sama dengan jumlah istilah di sisi kiri ketika data disusun dalam urutan naik atau turun.

Catatan: Jika Anda mengurutkan data dalam urutan menurun, itu tidak akan memengaruhi median tetapi IQR akan negatif.

Median akan menjadi jangka menengah, jika jumlah istilahnya ganjil.

Median akan menjadi rata-rata dari 2 istilah tengah, jika jumlah istilahnya genap.

Mode

Mode adalah istilah yang muncul waktu maksimum dalam kumpulan data yaitu istilah yang memiliki frekuensi tertinggi.

Dalam kumpulan data ini, mode adalah 67 karena memiliki lebih dari sisa nilai, yaitu dua kali.

Tetapi mungkin ada kumpulan data di mana tidak ada mode sama sekali karena semua nilai muncul jumlah yang sama kali. Jika dua nilai muncul waktu yang sama dan lebih dari sisa nilai maka set data adalah bimodal.

Jika tiga nilai muncul waktu yang sama dan lebih dari sisa nilai maka set data adalah trimodal dan untuk mode n, set data tersebut multimodal.

Ukuran Penyebaran / Dispersi

Simpangan Baku

Simpangan baku adalah pengukuran jarak rata-rata antara setiap kuantitas dan rata-rata. Artinya, bagaimana data disebarkan dari mean.

Deviasi standar yang rendah menunjukkan bahwa titik data cenderung dekat dengan rata-rata kumpulan data, sementara deviasi standar yang tinggi menunjukkan bahwa titik data tersebar pada rentang nilai yang lebih luas.

Ada situasi ketika kita harus memilih antara sampel atau populasi Deviasi Standar. Ketika kita diminta untuk menemukan SD dari beberapa bagian populasi, segmen populasi; maka kita menggunakan sampel Deviasi Standar.

Di mana x̅ adalah mean dari sampel.

Tetapi ketika kita harus berurusan dengan seluruh populasi, maka kita menggunakan standar Deviasi populasi.

Di mana μ adalah rata-rata populasi.

Meskipun sampel adalah bagian dari populasi, rumus SD mereka seharusnya sama, tetapi tidak. Dalam statistik deskriptif, biasanya menangani data yang tersedia dalam sampel, bukan dalam populasi.

Jadi jika kita menggunakan kumpulan data sebelumnya, dan gantikan nilainya dalam rumus sampel.

Dan jawabannya adalah 29,62.

Mean Deviasi

Ini adalah rata-rata perbedaan absolut antara setiap nilai dalam satu set nilai, dan rata-rata semua nilai dari set itu.

Jadi jika kita menggunakan kumpulan data sebelumnya, dan gantikan nilainya.

Dan jawabannya adalah 23,75.

Perbedaan

Varians adalah kuadrat jarak rata-rata antara setiap kuantitas dan rata-rata. Itu adalah kuadrat dari deviasi standar.

Dan jawabannya adalah 877,34.

Range

Range adalah salah satu teknik statistik deskriptif paling sederhana. Ini adalah perbedaan antara nilai terendah dan tertinggi.

Kisarannya adalah 99-12 = 87

Persentil

Persentil adalah cara untuk mewakili posisi nilai dalam kumpulan data. Untuk menghitung persentil, nilai dalam kumpulan data harus selalu dalam urutan menaik.

Median 59 memiliki 4 nilai kurang dari itu sendiri dari 8. Dapat juga dikatakan sebagai: Dalam kumpulan data, 59 adalah persentil ke-50 karena 50% dari total istilah kurang dari 59. Secara umum, jika k adalah persentil ke-n, maka menyiratkan bahwa n% dari total persyaratan kurang dari k.

Kuartil

Dalam statistik dan probabilitas, kuartil adalah nilai yang membagi data Anda menjadi empat perempat asalkan data diurutkan dalam urutan naik.

Ada tiga nilai kuartil. Nilai kuartil pertama adalah 25 persen. Kuartil kedua adalah 50 persen dan kuartil ketiga adalah 75 persen. Kuartil kedua (Q2) adalah median dari seluruh data.

Kuartil pertama (Q1) adalah median dari setengah bagian atas data. Dan Kuartil Ketiga (Q3) adalah median bagian bawah dari data.

Jadi di sini, dengan analogi,

  • Q2 = 67: adalah 50 persen dari seluruh data dan median.
  • Q1 = 41: adalah 25 persentil dari data.
  • Q3 = 85: adalah 75 persentil dari tanggal.
  • Rentang interkuartil (IQR) = Q3 – Q1 = 85 – 41 = 44

Catatan: Jika Anda mengurutkan data dalam urutan menurun, IQR akan menjadi -44. Besarnya akan sama, tanda saja akan berbeda. IQR negatif baik-baik saja, jika data Anda dalam urutan menurun. Hanya saja kita meniadakan nilai yang lebih kecil dari nilai yang lebih besar, kita lebih memilih urutan naik (Q3 – Q1).

Skewness

Skewness adalah ukuran dari asimetri distribusi probabilitas dari variabel acak bernilai riil tentang nilai rata-ratanya. Nilai skewness bisa positif atau negatif, atau tidak terdefinisi.

Dalam distribusi normal yang sempurna, ekor di kedua sisi kurva adalah gambar cermin yang tepat satu sama lain. Ketika distribusi miring ke kiri, ekor di sisi kiri kurva lebih panjang daripada ekor di sisi kanan, dan rata-rata kurang dari mode.

Situasi ini juga disebut kecenderungan negatif. Ketika distribusi miring ke kanan, ekor di sisi kanan kurva lebih panjang daripada ekor di sisi kiri, dan rata-rata lebih besar dari mode. Situasi ini juga disebut kemiringan positif.

Bagaimana dengan koefisien skewness?

Untuk menghitung koefisien skewness sampel, ada dua metode:

Pearson Koefisien Skewness Pertama (Skewness Mode)

Pearson Second Coefisien of Skewness (Medew skewness)

Interpretasi

  • Arah kemiringan diberikan oleh tanda. Nol berarti tidak ada kemiringan sama sekali.
  • Nilai negatif berarti distribusi condong negatif. Nilai positif berarti distribusi condong positif.
  • Koefisien membandingkan distribusi sampel dengan distribusi normal. Semakin besar nilainya, semakin besar distribusi berbeda dari distribusi normal.

Contoh masalah: Gunakan Koefisien Pearson # 1 dan # 2 untuk menemukan kemiringan data dengan karakteristik berikut:

  • Berarti = 50.
  • Median = 56.
  • Mode = 60.
  • Simpangan baku = 8,5.

Koefisien Skewness Pertama Pearson: -1,17.

Koefisien Skewness Kedua Pearson: -2.117.

Catatan: Koefisien kemiringan Pearson yang pertama menggunakan mode. Oleh karena itu, jika frekuensi nilai sangat rendah maka itu tidak akan memberikan ukuran kecenderungan sentral yang stabil. Misalnya, mode di kedua set data ini adalah 9:

1, 2, 3, 4, 4, 5, 6, 7, 8, 9.

Pada set data pertama, mode hanya muncul dua kali. Jadi bukan ide yang baik untuk menggunakan Koefisien Skewness Pertama Pearson. Namun di set kedua.

1, 2, 3, 4, 4, 4, 4, 4, 4, 4, 4, 5, 6, 7, 8, 9, 10, 12, 12, 13.

Mode 4 muncul 8 kali. Karenanya, Koefisien Skewness Kedua Pearson kemungkinan akan memberi Anda hasil yang masuk akal.

Kurtosis

Penafsiran yang tepat dari ukuran Kurtosis dulu diperdebatkan, tetapi sekarang diselesaikan. Ini tentang keberadaan outlier. Kurtosis adalah ukuran apakah data berekor berat atau berekor ringan relatif terhadap distribusi normal.

Jenis Kurtosis

Mesokurtik

Mesokurtik adalah distribusi yang memiliki kurtosis yang sama dengan kurtosis distribusi normal, yaitu nol.

Leptokurtik

Distribusi adalah distribusi yang memiliki kurtosis lebih besar dari distribusi Mesokurtik. Ekor distribusi seperti itu tebal dan berat. Jika kurva suatu distribusi lebih memuncak daripada kurva Mesokurtik, itu disebut sebagai kurva Leptokurtik.

Platykurtic

Distribusi adalah distribusi yang memiliki kurtosis lebih rendah dari distribusi Mesokurtik. Ekor distribusi semacam itu lebih tipis. Jika kurva distribusi kurang memuncak dari kurva Mesokurtik, itu disebut sebagai kurva Platykurtic.

Baca Juga : Rumus Amplitudo

Korelasi

Korelasi adalah teknik statistik yang dapat menunjukkan apakah dan seberapa kuat pasangan variabel terkait.

Hasil utama dari suatu korelasi disebut koefisien korelasi (atau “r”). Itu berkisar dari -1.0 hingga +1.0. Semakin dekat r ke +1 atau -1, semakin dekat kedua variabel terkait.

Jika r mendekati 0, itu berarti tidak ada hubungan antara variabel. Jika r positif, itu berarti bahwa ketika satu variabel semakin besar yang lain semakin besar.

Jika r negatif, itu berarti bahwa ketika seseorang semakin besar, yang lain semakin kecil (sering disebut korelasi “terbalik”).

Demikian Saya harap anda dapat pemahaman tentang apa sebenarnya statistik deskriptif itu. Terima Kasih

Rizki
Rizki Seorang pemuda yang tinggal bersama Kakek dan Nenek.

SPLTV

Rizki Rizki
2 min read

1 Kwintal Berapa Kg

Rizki Rizki
1 min read

1 kg Berapa Ons

Rizki Rizki
1 min read
close