Penggunaan Data Visualization
Data visualization adalah aspek penting dari aplikasi AI, Big data dan machine learning yang bertujuan untuk mendapatkan insight dari representasi grafik. Data visualization dibuat untuk memudahkan orang non-technical untuk memahami dan menginterpretasi data secara visual yang terdiri dari informasi yang kompleks
Ketika kita berbicara lebih spesifik, data visualization bisa digunakan untuk apa aja?
- Apakah untuk melakukan comparison nilai?
- Melihat composition data?
- Mengerti tentang distribution data?
- Atau melihat relationship beberapa variable di dataset?
Comparison adalah membandingkan 2 atau lebih variable pada suatu data. Contohnya adalah ketika kita ingin membandingkan sales dan profit dari berbagai kategori dan segment produk menggunakan bar chart.
Pada gambar diatas ada beberapa informasi yang bisa dihighlight
- Technology mempunyai sales yang paling tinggi
- Segment corporate dan home office penjualannya kurang baik
- Profit terkecil pada furniture, sedangkan technology memiliki profit tertinggi
- Kesimpulan : invest lebih banyak di teknologi? Atau perbaiki produk yang lain?
Penggunaan selanjutnya adalah composition. Composition berguna untuk melihat rasio atau proposi dari data terhadap data keseluruhan. Untuk dapat memahami composition, kalian bisa merujuk pada contoh berikut.
Pada kasus composition diatas ada beberapa informasi yang bisa dihighlight
- Sales untuk sub-category chair dan phones adalah yang paling tinggi dibanding yang lain
- Art, Envelops, Fasteners, dan Labels memiliki sales terkecil
Kemudian kita mengenal adanya distribution. Distribution digunakan untuk melihat distribusi data yang berguna saat kita ingin melihat detail pattern, trend, cluster, dan outlier dari suatu data. Pada contoh berikut, terdapat chart yang menunjukkan count of orders untuk tiap quantity of orders.
Pada kasus distribution diatas ada beberapa informasi yang bisa dihighlight
- Mostly orang berbelanja dengan 2 atau 3 item.
- Jarang ada yang berbelanja lebih dari 8 item.
Pertanyaan terbesarnya adalah kenapa yang pesan 1 item memiliki frekuensi yang lebih kecil dibandingkan 2 dan 3? Apakah ada diskon tertentu atau penawaran seperti free ongkir dan sebagainya?
Penggunaan yang terakhir adalah untuk melihat relationship. Relationship dalam hal ini adalah dependency, correlation, atau cause and effect antara 2 variable/feature atau lebih. Berikut contoh visualisasi untuk melihat laporan total sales versus profit tiap sub-category yang terjual.
Pada kasus relationship diatas ada beberapa informasi yang bisa dihighlight
- Sub-category Table berkontribusi untuk sales 200K tetapi ternyata juga menyebabkan loss sebesar 20K
- Sementara itu, copiers memiliki sales $150K dengan profits lebih dari 50K.
Sekian contoh basic penggunaan data visualization. Sebenarnya ada beberapa contoh lain yang bisa digunakan. Hal ini tentunya masih berkaitan dengan analytics descriptive dan diagnostic. Untuk lebih lanjut, kalian bisa mencari informasi ditempat lainnya.
Penulis : Wahyu Fadli Satrya
Sumber :
Comments :