Pramusaji Data

Data merupakan serangkaian angka yang merepresentasikan kondisi tertentu. Pada era digitalisasi, sumber data menjadi sangat banyak. Bahkan beberapa ahli mengatakan bahwa data adalah new oil. Data mengandung informasi penting jika bisa dilakukan ekstraksi dengan baik dan benar. Seorang pramusaji data bertugas menyederhanakan tampilan data yang kompleks kepada pengambil manfaat dari data tersebut. Ada 3 jenis media visualisasi data yang paling dasar yaitu diagram batang, diagram garis, dan diagram lingkaran. Diagram batang digunakan untuk membuat perbandingan antara data satu, data dua, dan seterusnya. Diagram garis biasanya digunakan untuk melihat trend perubahan berdasarkan waktu. Sedangkan diagram lingkaran biasanya digunakan untuk melihat komposisi dari suatu keadaan.

Setelah beberapa data penting atau yang menjadi prioritas dibuat dengan media visualisasi maka akan ditampilkan dalam bentuk scorecard (spesifik pada data tertentu), dashboard (menampilkan secara keseluruhan), report (menampilkan nilai-nilai tertentu), dan report analytical (nilai-nilai tertentu yang tampil dianalisis mengapa bisa seperti itu). Seorang pramusaji data harus mengetahui data tersebut akan disampaikan. Tentu saja bentuk data akan berbeda jika ditampilkan untuk seorang pengusaha dan untuk seorang data analis. Jika salah dalam melakukan penyajian data maka bukan tidak mungkin pengguna akan menilai itu hal yang tidak perlu dan kurang relevan. Ada 3 pertanyaan penting bagi seorang pramusaji sebelum menyajikan data pada target audiens, yaitu siapa, apa, dan bagaimana.

Alat paling umum yang digunakan untuk menyajikan data adalah pengolah angka seperti Excel, Calc, dan Google Sheet. Adanya operator, rumus, logika memungkinkan dibuatnya pengolahan data secara lebih mudah. Biasanya penyaji data menggunakan tektik pivot untuk menghindari pembuatan rumus secara manual. Tentu saja jika ingin mendapatkan hasil olahan yang lebih baik diperlukan pendekatan statistik yang lebih detail seperti pengujian distribusi data hingga pada pengambilan keputusan. Data di bawah contoh penggunaan Google sheet dengan pivot.

Dalam menyajikan data perlu disusun prioritas, yaitu mana data yang perlu ditampilkan dan mana data yang tidak perlu ditampilkan. Sebagai informasi seperti diagram lingkaran lebih efektif jika hanya menyampaikan 4 data proporsi. Itu artinya jika ada lebih dari 4 data maka nilai efektivitasnya berkurang sedangkan jika kurang dari 4 data maka nilai efisiensinya berkurang. Kesalahan umum yang perlu dihindari seorang pramusaji data adalah nilai persentase yang tidak sesuai, terlalu banyak data, tidak mengikuti standar penulisan, terdapat sumbu yang terpotong, penggunaan grafik 3D yang tidak sesuai, dan data sulit dibandingkan. Termasuk pencatatan data atau history dari data harus ada. Hal ini diatur di dalam ISO 19115-2:2019 tentang metadata.

Sebagai seorang pramusaji data penting untuk membedakan cara menyampaikan informasi dari hasil pengolahan data. Ini berkaitan dengan mengajak pendengar untuk mengetahui hasil eksplorasinya atau mengajak pendengar untuk mengetahui inti dari hasil. Pramusaji data tentu saja lebih cenderung untuk mengajak pendengar untuk mengetahui hasil eksplorasinya karena itu akan menunjukkan kerjanya. Namun, secara umum kebanyakan pendengar hanya ingin mengetahui inti dari hasil dan tampak tidak terlalu perduli dengan darimana inti dari hasil tersebut didapatkan. Jadi alih-alih mengajak pendengar untuk mengetahui hasil eksplorasinya, lebih baik seorang pramusaji data untuk menyampaikan inti dari hasilnya. Sayangnya untuk menyampaikan inti dari hasil diperlukan 3 hal, yaitu:

  1. Siapa pendengar kita? (posisi struktural)
  2. Bagaimana mengkomunikasikannya? (tools, attitude)
  3. Cara menggunakan data untuk menegaskan inti dari hasil? (5W)

Ada beberapa tips untuk menyajikan data secara efektif dan efisien, yaitu gunakan teks untuk data yang sedikit (misalnya hanya 2 data), hindari penggunaan tabel dengan garis yang tebal, buat gradasi warna berdasarkan nilai data, dan usahakan menggunakan grafik untuk data yang banyak. Inti dari penyajian data adalah agar informasi dari data tersebut sampai dengan mudah kepada pendengar. Dengan kata lain jika informasi dari data tersebut sulit dicerna oleh pendengar maka penyajian data masih buruk. Sebisa mungkin untuk data yang berbeda letakkan di tempat yang berjarak, gunakan warna untuk membedakan data, dan perhatikan pola yang mungkin salah dibaca oleh pendengar.

Sebagai seorang pramusaji data merupakan hal penting untuk membuat pendengar itu nyaman yaitu dengan menghindari pendengar berpikir terlalu berat dan kerumitan dari data. Perlu dicatat selain data yang disajikan itu nyaman untuk pendengar, data tersebut harus cepat dapat dicerna oleh pendengar. Jangan sampai menyajikan data yang nyaman namun informasi yang ingin disampaikan tidak dicerna dengan baik oleh pendengar. Agar pendengar dapat lebih cepat mencerna informasi biasanya digunakan font yang berbeda pada teks atau gradasi warna pada grafik.

Alat-alat seperti Excel, Calc, atau Google Sheet masih terbatas untuk menyajikan data secara premium. Untuk mencapai penyajian data yang lebih premium diperlukan bantuan bahasa pemrograman seperti Python. Bahasa Python sudah menjadi rahasia umum untuk digunakan pada pengolahan data. Sebelum menggunakan Python ada baiknya melakukan instalasi Pycharm sebagai IDE yang khusus dibuat untuk pengembangan dengan Python. Rilis pertama dari bahasa Python adalah pada tahun 1991 oleh Guido van Rossum. Di bahasa Python ada 4 tipe data koleksi yang fundamental, yaitu list [], tuple (), set {}, dan dictionary {:}.

Sumber: python

Dalam meramu data dengan bantuan Python sangat dimungkinkan akan menggunakan struktur data list. Sayangnya penggunaan struktur data list akan menggunakan banyak memori saat data yang diolah besar. Untuk mengatasinya perlu digunakan library seperti NumPy. Jalankan kode di bawah untuk mendapatkan perbandingan:

  • import sys
  • import numpy as np

  • # List Python
  • data_list = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
  • size_list = sys.getsizeof(data_list)

  • # NumPy Array
  • data_numpy = np.array(data_list)
  • size_numpy = data_numpy.nbytes  # Numpy menyediakan nbytes untuk menghitung ukuran dalam byte

  • print(f"Ukuran memori List Python: {size_list} bytes")
  • print(f"Ukuran memori NumPy Array: {size_numpy} bytes")

Dengan memperhatikan perbandingan penggunaan memori tersebut maka perlu dipertimbangkan pemilihan metode untuk meramu data oleh seorang pramusaji data seperti penggunaan library apa dan sebaiknya menghindari cara-cara tradisional. Perlu dibedakan antara modul, package, dan library. Modul adalah kumpulan function yang saling berkaitan, package adalah kumpulan modul, dan library adalah kumpulan modul. Contoh modul adalah file.py yang terdiri atas beberapa function saling berkaitan, contoh package adalah NumPy, dan contoh library adalah TensorFlow. Inti dari semuanya adalah kumpulan function yang akan berulangkali digunakan. Dalam function dikenal adanya parameter dan argumen. Perlu diketahui, parameter adalah variable dari function misalnya a, b, c, sedangkan argumen adalah nilai dari variable tersebut yang akan dimasukkan misalnya a=2, b=5, c=10.

  • Argumen
    • Deklarasi
      • def penjumlahan(a,b):
      •    m = a+b
      •    return m

      • print(penjumlahan(b=3,a=7))
    • Tanpa Deklarasi
      • def penjumlahan(a,b):
      •    m = a+b
      •    return m

      • print(penjumlahan(7,3))
  • Parameter
    • def penjumlahan(angka1, angka2): bisa deklarasi dan tidak
    • def penjumlahan(a, b, /): tanpa perlu mendeklarasi
    • def penjumlahan(*, angka1, angka2): harus menggunakan keyword
    • def penjumlahan(*args): bisa memasukkan angka tanpa batas
    • def penjumlahan(*kwargs): menerima argumen dictionary

Bagi pramusaji data yang membutuhkan kecepatan dalam pengolahan data yang besar maka sulit dihindari penggunaan bahasa seperti Python. Dengan menggunakan Python sebagai alat mempercepat pengolahan data maka akan memberikan konsekuensi pemahaman yang baik mengenai Object Oriented Programming atau OOP. Konsep seperti class, object, method, decorator tidak akan terhindarkan untuk membuat sajian data yang lebih optimal. Misalnya saja dalam pembuatan kode yang sama, maka cukup menggunakan super dalam konsep OOP. Super dapat digunakan untuk memanggil method yang ada di kelas induk dalam pewarisan atau inheritance.

Seperti bahasa pemrograman lain, tentu saja Python memiliki panduan gaya menulis. Paket-paket yang dapat membantu menyesuaikan dengan panduan menulis di Python seperti pylint (mengoreksi tulisan) dan black (format kode). Sebagai catatan akhir ada beberapa library penting yaitu string, regex (re), math, argparse, Pandas, NumPy, matplotlib, seaborn, os, json, pickle, beautifulsoup, urllib, scikit-learn, tensorflow, PyTorch, Django, Flask, dan Fast API.


ref:
python.org
aws.amazon.com

Komentar