kontan.co.id
banner langganan top
| : WIB | INDIKATOR |
KOLOM / bigdata

Panama papers dan kartu kredit

oleh Feris Thia - Founder of Lightora UMN Incubator


Senin, 11 April 2016 / 12:06 WIB

Reporter: Feris Thia | Editor: hasbi.maulana

Belakangan ini ada dua berita yang menghebohkan tanah air dan dunia. Pertama, adalah berita tentang keharusan perbankan nasional untuk melaporkan data transaksi kartu kredit nasabah yang diterbitkan mereka kepada Direktorat Jenderal Pajak (DJP).

Dengan tambahan data tersebut, DJP dapat mencocokkan profil antara nilai transaksi kartu kredit dan profil kewajiban pembayaran pajaknya.

Kedua, adalah skandal Panama Papers, yaitu bocornya data nama-nama tokoh terkenal dari seluruh dunia yang mendirikan perusahaan di luar negara mereka dengan berbagai alasan. Salah satu alasan yang dicurigai adalah untuk menghindari kewajiban pajak.

Dengan jumlah dokumen sebanyak 11.6 juta dan ukuran data 2.6 terabytes, Panama Papers diklaim sebagai kebocoran data terbesar dalam sejarah.

Di luar pro dan kontranya, penulis lebih tertarik untuk coba membayangkan implementasi teknologi Big Data apa yang digunakan di belakang stakeholder berita tersebut. Dan, apakah teknologi ini bisa digunakan untuk kepentingan bisnis praktis?

Ada dua hal yang terpikirkan saat ini, yaitu distributed computing dan crowdsourcing platform.

Distributed Computing adalah platform komputasi dari banyak komputer untuk mengolah data besar sebagai satu kesatuan. Masalah konsistensi pengolahan data tidak perlu dikhawatirkan jika ada satu atau beberapa komputer mati. Produk distributed computing yang paling populer saat ini adalah Hadoop.

Hadoop sangat cocok digunakan untuk kondisi data yang berkembang dengan cepat, dengan variasi yang tinggi dan berukuran besar. Variasi disini termasuk data teks yang tidak konsisten, misalkan ‘Kontan Academy’ dituliskan sebagai ‘Kontan Akademi’ dan ‘Academy Kontan’.

Divisi Teknologi Informasi (TI) perlu menyusun kamus data untuk menghubungkan ketiga entri ‘serupa tapi tidak sama’ tersebut.
Jika data yang diolah sangat besar, maka kamus data sudah harus dilakukan secara otomatis dan cepat. Dan ini merupakan proses kompleks yang membutuhkan penyimpanan dan daya komputasi tinggi sehingga Hadoop tepat untuk digunakan.

Penggunaan lainnya adalah untuk mendapatkan perilaku belanja konsumen dari proses data jutaan transaksi penjualan, mendeteksi fraud, mengenal dan menggali teks dari foto dan gambar, dan membuat ringkasan statisik dari miliaran data operator telekomunikasi. Tentu saja masih banyak sekali contoh lainnya yang tidak dapat disebutkan satu per satu disini.

Panama Papers merupakan hasil kerja kolaborasi. Data-data masif tersebut diserahkan dan dianalisa oleh sekitar 400 jurnalis yang berasal dari 107 organisasi media di 80 negara.

Bagaimana cara merekrut, berkomunikasi, membagi tugas, melakukan analisa dan investigasi, dan merahasiakan aktivitas ini tentunya bukan pekerjaan gampang.

Dari kacamata penulis, organisasi pekerjaan yang kompleks ini sangat mirip dengan teknologi crowdsourcing platform.
Ini adalah software khusus yang dirancang untuk mengatur bagaimana satu pekerjaan diselesaikan melalui kontribusi dari banyak orang dan dengan mekanisme online.

Bagaimana rekrutmen dilakukan, membentuk organisasi proyek, mendefinisikan tugas dan objektif, mengawasi perkembangan, menilai hasil pekerjaan, mekanisme penghargaan, pengenaan sanksi, dan lain-lain. Semuanya harus dapat dikerjakan di atas platform.

Salah satu contoh produk dari hasil crowdsourcing dan banyak Anda nikmati adalah Android pada smarphone.



TERBARU

×