Header Ads Widget

Ticker

6/recent/ticker-posts

Pentingnya Kuartil dalam Big Data

Istilah kuartil memiliki artian sebagai ukuran letak yang membagi data kelompok menjadi empat bagian yang sama besar. Kuartil  membagi data menjadi empat bagian dengan jumlah yang kurang lebih sama. Kuartil pertama atau kuartil bawah merupakan nilai tengah antara nilai terkecil dan median dari kelompok data.

Kuartil dilambangkan dengan titik Q1, Q2, dan Q3, yang menunjukkan titik data dengan ukuran bin 25%. Dalam distribusi, 25% dari titik data akan berada di bawah Q1, 50% di bawah Q2, dan 75% di bawah Q3.

Plot box whisker adalah cara visual sederhana untuk menunjukkan distribusi variabel kontinu dengan informasi seperti kuartil, median, dan pencilan, yang dilapisi dengan mean dan deviasi standar.

Daya tarik utama bagan box whisker atau kuartil adalah bahwa distribusi beberapa atribut dapat dibandingkan secara berdampingan dan tumpang tindih di antara keduanya dapat disimpulkan.
 
Simbol Kuartil

  • Poin Q1 dan Q3 dalam plot box whistler dilambangkan dengan tepi kotak.
  • Titik Q2, median distribusi, ditunjukkan dengan tanda silang baris di dalam kotak.
  • Pencilan dilambangkan dengan lingkaran di ujung garis kumis.
  • Dalam beberapa kasus, titik rata-rata dilambangkan dengan hamparan titik padat diikuti dengan deviasi standar sebagai hamparan garis.

Dalam eksplorasi data, petal length dapat diamati memiliki kisaran terluas dan sepal width memiliki kisaran yang sempit, dari keempat atribut tersebut.
Satu atribut juga dapat dipilih — petal length — dan dieksplorasi lebih lanjut menggunakan bagan kuartil dengan memperkenalkan label kelas. Pada plot Gambar 3.8, kita dapat melihat distribusi tiga spesies untuk pengukuran petal length.
Mirip dengan perbandingan sebelumnya, distribusi beberapa spesies dapat dibandingkan.

Contoh gambar plot kuartil di dataset Iris

Contoh Gambar Plot Kuartil Class-stratified di dataset Iris


Posting Komentar

0 Komentar