Gambar Scatterplot di dataset Iris |
Scatter plot adalah jenis plot atau diagram matematika menggunakan koordinat
Cartesian untuk menampilkan nilai-nilai untuk biasanya dua variabel
untuk satu set data. Jika poin diberi kode, satu variabel tambahan dapat
ditampilkan (Wikipedia)
Scatterplot juga dapat dipahami sebagai salah satu plot visual paling canggih namun sederhana yang tersedia. Dalam scatterplot, titik data ditandai dalam ruang Cartesian dengan atribut set data yang selaras dengan koordinat.
Salah satu observasi kunci yang dapat disimpulkan dari scatter plot adalah adanya hubungan antara dua atribut yang diteliti. Jika atribut berkorelasi linier, maka titik datanya sejajar lebih dekat ke garis lurus imajiner; jika tidak berkorelasi, titik datanya tersebar. Selain korelasi dasar, scatterplots juga dapat menunjukkan adanya pola atau kelompok cluster dalam data dan mengidentifikasi outlier dalam data.
Scatterplot sangat berguna untuk kumpulan data berdimensi rendah.
Gambar diatas menunjukkan diagram sebar antara petal length (sumbu x) dan petal width (sumbu y).
Kedua atribut ini sedikit berkorelasi, karena ini adalah ukuran bagian bunga yang sama. Ketika penanda data diwarnai untuk menunjukkan spesies yang berbeda menggunakan label kelas, lebih banyak pola dapat diamati.
Ada sekelompok titik data, semuanya termasuk spesies I. setosa, di sisi kiri bawah plot. I. setosa memiliki kelopak yang jauh lebih kecil.Fitur ini dapat digunakan sebagai aturan untuk memprediksi spesies pengamatan tak berlabel. Salah satu batasan dari scatterplots adalah bahwa hanya dua atribut yang dapat digunakan dalam satu waktu, dengan atribut tambahan mungkin ditampilkan dalam warna penanda data. Namun, warna biasanya disediakan untuk label kelas.
Semoga artikel kecil dapat memuaskan dahaga keilmuan untuk semuanya.
0 Komentar