BIG DATA
Pengertian
Big Data
Big Data
adalah sebuah sistem teknologi yang diperkenalkan untuk menanggulangi 'ledakan
informasi' seiring dengan semakin bertumbuhnya ekosistem pengguna perangkat
mobile dan data internet. Pertumbuhan perangkat mobile dan data internet
ternyata sangat mempengaruhi perkembangan volume dan jenis data yang terus
meningkat secara signifikan di dunia maya.
Berbagai
jenis data, mulai data yang berupa teks, gambar atau foto, video hingga bentuk
data-data lainnya membanjiri sistem komputasi. Tentunya hal ini perlu jalan
keluar. Dan Big Data adalah solusi yang kerap digaungkan beberapa waktu
belakangan ini, dan kemunculannya memang dianggap solusi dari fakta yang
menunjukkan bahwa pertumbuhan data dari waktu ke waktu telah melampaui batas
kemampuan media penyimpanan maupun sistem database yang ada saat ini.
Pengertian
Big Data Menurut Para Ahli
Menurut
(Eaton,
Dirk, Tom, George, & Paul) Big Data merupakan istilah yang berlaku untuk informasi yang tidak
dapat diproses atau dianalisis menggunakan alat tradisional.
Menurut
(Dumbill, 2012) , Big Data adalah data yang melebihi
proses kapasitas dari kovensi sistem database yang ada. Data terlalu besar dan
terlalu cepat atau tidak sesuai dengan struktur arsitektur database yang ada.
Untuk mendapatkan nilai dari data, maka harus memilih jalan altenatif untuk
memprosesnya.
Berdasarkan
pengertian para ahli di atas, dapat disimpulkan bahwa Big Data adalah data yang
memiliki volume besar sehingga tidak dapat diproses menggunakan alat
tradisional biasa dan harus menggunakan cara dan alat baru untuk mendapatkan
nilai dari data ini.
Pembahasan Big Data
Setiap hari, kita
menciptakan 2,5 triliun byte data - begitu banyak bahwa 90% dari data di dunia
saat ini telah dibuat dalam dua tahun terakhir saja. Data ini berasal dari
mana-mana, sensor digunakan untuk mengumpulkan informasi iklim, posting ke
situs media sosial, gambar digital dan video, catatan transaksi pembelian, dan
sinyal ponsel GPS untuk beberapa nama. Data ini adalah big data.
Big Data
mengacu pada dataset yang ukurannya diluar kemampuan dari database software
tools untuk meng-capture, menyimpan,me-manage dan menganalisis. Definisi ini
sengaja dibuat subjective agar mampu digabungkan oleh definisi Big Data yang
masi belum ada baku. Ukuran big data sekitar beberapa lusin TeraByte sampai ke
beberapa PetaByte tergantung jenis Industri
Isi
dari Big Data adalah Transaksi+interaksi dan observasi atau bisa di bilang
segalanya yang berhubungan dengan jaringan internet, jaringan komunikasi, dan jaringan
satelit
(Connolly, 2012)
Big Data dapat juga
didefinisikan sebagai sebuah masalah domain
dimana teknologi tradisional seperti
relasional database tidak mampu lagi untuk melayani.
Big data lebih dari
hanya masalah ukuran, itu adalah kesempatan untuk menemukan wawasan dalam jenis
baru dan muncul data dan konten, untuk membuat bisnis Anda lebih gesit, dan
menjawab pertanyaan yang sebelumnya dianggap di luar jangkauan Anda.
Big
data
dapat di artikan kedalam 9 karakter (IBM) menurut responden
sehingga disimpulkan oleh IBM, Big data adalah data yang memiliki scope
informasi yang sangat besar, model informasi yang real-time, memiliki volume
yang besar, dan berasalkan social media data jadi dapat disimpulkan bahwa Big
data adalah dataset yang memiliki volume besar dan salah satu isinya
berdasarkan social media data, dan informasi dari Big data selalu yang terbaru
(latestdata) sehingga model informasi nya real-time, dan scope informasi nya
tidak terfocus pada industri-indrustri kecil saja atau industri-indrustri besar
saja melainkan semuanya baik industry kecil maupun besar.
(IBM)
Dimensi
-Dimensi Big Data
Ada
3 dimensi awal dalam Big Data yaitu 3V: Volume, Variety dan Velocity
1. Volume
Perusahaan tertimbun dengan data
yang terus tumbuh dari semua jenis sektor, dengan mudah mengumpulkan terabyte
bahkan petabyte-informasi.
Ø Mengubah 12 terabyte Tweet dibuat
setiap hari ke dalam peningkatan sentimen analisis produk.
Ø Mengkonvert 350 milliar pembacaan
tahunan untuk lebih baik dalam memprediksi kemampuan beli pasar.
Mungkin karakteristik ini yang paling
mudah dimengerti karena besarnya data. Volume juga mengacu pada jumlah massa
data, bahwa organisasi berusaha untuk memanfaatkan data untuk meningkatkan
pengambilan keputusan yang banyak perusahaan di banyak negara. Volume data juga
terus meningkat dan belum pernah terjadi sampai sethinggi ini sehingga tidak dapat
diprediksi jumlah pasti dan juga ukuran dari data sekitar lebih kecil dari
petabyte sampai zetabyte. Dataset big data sekitar 1 terabyte sampai 1 petabyte
perperusahaan jadi jika big data digabungkan dalam sebuah organisasi / group
perusahaan ukurannya mungkin bisa sampai zetabyte dan jika hari ini jumlah data
sampai 1000 zetabyte, besok pasti akan lebih tinggi dari 1000 zetabyte.
2. Variety
Volume data yang banyak tersebut
bertambah dengan kecepatan yang begitu cepat sehingga sulit bagi kita untuk
mengelola hal tersebut. Kadang-kadang 2 menit sudah menjadi terlambat. Untuk
proses dalam waktu sensitif seperti penangkapan penipuan, data yang besar harus
digunakan sebagai aliran ke dalam perusahaan Anda untuk memaksimalkan nilainya.
Ø Meneliti 5 juta transaksi yang
dibuat setiap hari untuk mengidentifikasi potensi penipuan
Ø Menganalisis 500 juta detail catatan
panggilan setiap hari secara real-time untuk memprediksi gejolak pelanggan
lebih cepat.
Berbagai jenis data dan sumber data. Variasi adalah
tentang mengelolah kompleksitas beberapa jenis data, termasuk structured data,
unstructured data dan semi-structured data. Organisasi perlu mengintegrasikan
dan menganalisis data dari array yang kompleks dari kedua sumber informasi
Traditional dan non traditional informasi, dari dalam dan luar perusahaan.
Dengan begitu banyaknya sensor, perangkat pintar (smart device) dan teknologi
kolaborasi sosial, data yang dihasilkan dalam bentuk yang tak terhitung
jumlahnya, termasuk text, web data,
tweet, sensor data, audio, video, click stream, log file dan banyak lagi.
3. Velocity
Big
Data adalah setiap jenis data - data
baik yang terstruktur maupun tidak terstruktur seperti teks, data sensor,
audio, video, klik stream, file log dan banyak lagi. Wawasan baru ditemukan
ketika menganalisis kedua jenis data ini bersama-sama.
· Memantau
100 video masukan langsung dari kamera pengintai untuk menargetkan tempat
tujuan.
· Mengeksploitasi
80% perkembangan data dalam gambar, video, dan dokumen untuk meningkatkan
kepuasan pelanggan.
Data
dalam gerak. Kecepatan di mana data dibuat, diolah dan dianalisis terus
menerus. Berkontribusi untuk kecepatan yang lebih tinggi adalah sifat
penciptaan data secara real-time, serta kebutuhan untuk memasukkan streaming
data ke dalam proses bisnis dan dalam pengambilan keputusan. Dampak Velocity
latency, jeda waktu antara saat data dibuat atau data yang ditangkap, dan ketika itu juga dapat
diakses. Hari ini, data terus-menerus dihasilkan pada kecepatan yang mustahil
untuk sistem tradisional untuk menangkap, menyimpan dan menganalisis. Jenis
tertentu dari data harus dianalisis secara real time untuk menjadi nilai bagi
bisnis.
Big
Data for development
Big Data untuk keperluan development
berkaitan dengan, tetapi berbeda dari, 'tradisional Data pembangunan '(misalnya
data survei, statistik resmi), dan sektor swasta dan media mainstream
menyebutnya 'Big Data’. Big Data
untuk sumber Pengembangan umumnya memiliki beberapa / semua fitur ini:
a. Digitally
generated
Data yang dihasilkan
secara digital (sebagai lawan yang didigitalkan manual), dan dapat disimpan
dengan menggunakan rangkaian satu dan nol, dan dengan demikian dapat
dimanipulasi oleh computer
b. Passively
produced
Data ini merupakan data
yang dihasilkan atau produk dari kehidupan kita sehari-hari atau interaksi
dengan jasa digital.
c. Automatically
collected
Data-data yang
terbentuk dari data-data operasional dan transaksi yang dikumpulkan dan telah
diproses (ETL) dan si simpan kedalam data mart
d.
Geographically
or temporally trackable
Data –data yang menunjukan
lokasi atau posisi, misalnya data lokasi ponsel atau durasi waktu panggilan
e.
Continuously analysed
Informasi yang relevan dengan
kesejahteraan manusia dan pembangunan dan dapat dianalisis secara real-time
Pengunaan Big Data dalam perusahaan
a. IT logs Analytics
Penyimpanan
Log jangka panjang, digunakan untuk analisa proses sistem yang sedang berjalan
untuk mencegah dan menaggulangi kegagalan dalam sistem, mengunakan hasil
analisa log untuk menemukan dan mentukan secara pasti kegagalan apa yang
terjadi didalam sistem, menyiapkan langkah-langkah pasti yang dapat digunakan
sebagai solusi masalah sistem.
b. Fraud Detection Pattern
Banyak
digunakan dalam Bidang keuangan atau dimana saja transaksi finasial terlibat,
Memaksimalkan pengunaan data-data yang ada untuk memberikan kemampuan unutk
mendeteksi fraud ketika transaksi sedang berlangsung
c. The Social Media
Pattern
Pengunaan
Big data untuk analisa media social dan sentiment pelangan, memberikan
kemampuan bagi perusahan untuk mengetahui keinginan customer secara luas,
mendapatkan feedback secara langsung, dan mengenali langsung dampak sentimen
terhadap penjualan, serta efektivitas dan penerimaan pelangan terhadap
pemasaran yang dilakukan.
d. The Call centere Mantra
Penyimpanan
hasil perbincangan atau laporan customer dalam bentuk text yang kemudian
digunakan sebagai data untuk analisa masalah yang dihadapai customer,
memberikan kemampuan bagi perusahaan untuk memberikan tanggapan yang cepat
maupun secara langsung terhadap masalah yang dihadapi customer, serta kemampuan
unutk mendeteksi penurunan loyalitas customer dikarenakan masalah dan
ketidakpuasaan.
e. Risk: Patterns for Modeling and Management
Memberikan
kempuaan pengunaan data secara penuh dan analisis dalam pemodelan resiko dan
menejemen resiko untuk memberikan pengetahuan akan resiko dan penanggulangannya
secara tepat dan langsung
f. Big data and The Energy
Sector
Memberikan
kemampuan penyimpanan dan pemrosesan data secara langsung dari berbagai
sumber(sensor), analisa dan kemudahan dalam pengenalan noise untuk memisahkannya dari signal.
Tantangan dalam
pemanfaatan Big Data
Dalam usaha pemanfaatan Big Data dapat terdapat banyak hambatan dan tantangan, beberapa hal
diantaranya berhubungan dengan data dimana melibatkan acquisition, sharing dan
privasi data, serta dalam analisis dan pengolahan data
a. Privasi
Privasi
merupakan isu yang paling sensitif, dengan konseptual, hukum, dan teknologi,
Privasi dapat dipahami dalam arti luas sebagai usaha perusahaan untuk
melindungi daya saing dan konsumen mereka. Data-data yang digunakan / disimpan
sebagai big data
b. Access dan sharing
Akses
terhadap data, baik data lama maupun data baru dapat menjadi hambatan dalam
mendapatkan data untuk big data, terlebih pada data lama dimana data- data
tersimpan dalam bentuk – bentuk yang berbeda-beda dan beragam ataupun dalam
bentuk fisik, akses terhadap data baru juga membutuhkan usaha yang lebih kerana
diperlukannya izin dan lisensi untuk mengakses data-data non-public secara
legal.
c. Analisis
Bekerja dengan
sumber data baru membawa sejumlah tantangan analitis. relevansi dan tingkat keparahan
tantangan akan bervariasi tergantung pada jenis analisis sedang dilakukan, dan
pada jenis keputusan yang akhirnya akan bisa diinformasikan oleh data.
Tergantung dari jenis
data terdapat 3 kategori dalam analisis data
1. Penentuan gambaran yang
benar
Masalah
ini biasanya ditemukan dalam penanganan unstructured
user-generated text-based data dimana data yang didapatkan belum tentu
benar karena data atau sumber yang salah.
2. Interpreting Data
Kesalahan
–kesalahan seperti Sampling selection bias merupakan hal yang sering ditemukan
dimana data yang ada tidak dapat digunakan untuk mepresentasikan semua populasi
yang ada, dan apophenia, melihat adanya pola walaupun tidak benar-benar ada
dikarenakan jumlah data yang besar, dan kesalahan dalam menginterpreasikan hubungan
dalam data.
3. Defining and detecting anomalies
Tantangan sensitivitas terhadap
spesifisitas pemantauansistem. Sensitivitas mengacu pada kemampuan sistem
pemantauan untuk mendeteksi semua kasus sudah diatur untuk mendeteksi sementara
spesifisitas mengacu pada kemampuannya untuk mendeteksi hanya kasus-kasus yang
relevan. kegagalan untukmencapai hasil yang terakhir "Tipe I kesalahan
keputusan", juga dikenal sebagai "positif palsu"; kegagalanuntuk
mencapai mantan "Type II error", atau "negatif palsu."
Kedua kesalahan yang tidak diinginkan ketika mencoba untuk mendeteksi malfungsi
atau anomali, bagaimanapun didefinisikan, untuk berbagai alasan. Positif palsu
merusak kredibilitas sistem sementara negatif palsu dilemparkan ragu pada
relevansinya. Tapi apakah negatif palsu lebih atau kurang bermasalah daripada
positif palsu tergantung pada apa yang sedang dipantau, dan mengapa itu sedang
dipantau.
Contoh Industri yang
Menggunakan Big Data
Berikut tiga contoh industri yang dapat
memanfaatkan penggunaan Big Data :
1. Industri Penerbangan
Setiap perusahaan penerbangan
mempunyai data masing-masing, namun perusahaan penerbangan saat ini umumnya
hanya menggunakan data pembelian tiket penumpang, seperti kota asal dan kota
tujuan, serta pembelian tiket melalui situs resmi atau tidak. Perusahaan penerbangan tidak melihat data di
luar itu, misalnya data interaksi ketika calon penumpang berada di depan
komputer untuk membeli tiket. Mereka mungkin hanya melihat pelanggan terbang
dari Jakarta-Jogja misalnya, tapi sebelum memutuskan itu sebenarnya dia ingin
menuju Solo.
Penting bagi perusahaan penerbangan untuk
melihat pola interaksi calon penumpangnya. Sebagai contoh, ketika penumpang
mengetik Solo dalam situs penjualan tiket, kemudian menge-klik back dan
mengetik Jogja, kota dengan bandara terdekat dari Solo, perusahaan patut
mencurigai pola interaksi seperti ini. Bisa jadi penumpang membeli tiket Jogja
karena penerbangan Solo lebih terbatas atau lebih mahal.
Perusahaan
penerbangan dapat memanfaatkan Big Data tersebut untuk kemudian memperbanyak
jumlah penerbangan ke Solo atau memberikan harga promo atau bekerja sama dengan
travel agent untuk memfasilitasi penumpang dari Jogja ke Solo.
Jika perusahaan penerbangan mengetahui data
ini (Big Data aktivitas penumpang di website), mereka mungkin bisa mengambil
keputusan yang lebih tepat, dengan membuat rute yang lebih atraktif karena
mengetahui market yang potensial.
2.
Industri Perbankan
Pada
saat nasabah melakukan transaksi melalui mesin atm, Bank mungkin hanya
menyimpan data transaksi banking, seperti nominal penarikan uang. Di luar itu,
Bank dapat melihat data interaksi para nasabah di depan mesin atm. Bank dapat mengetahui berapa lama waktu yang
dibutuhkan nasabah untuk memasukkan pin dan menekan jumlah nominal penarikan
uang. Lebih dari itu Bank juga dapat menganalisa kebiasaan seorang nasabah
dalam menarik uang di atm.
Jika kita tahu kebiasaan seorang nasabah
mengambil uang 500 ribu, kenapa tidak ketika nasabah memasukkan kartu,
kemudaian memencet pin, langsung menawarkan pilihan 500ribu. Hal tersebut dapat
menjadi nilai tambah bagi Bank di mata para nasabah agar nasabah tetap setia
dan menambah saldo rekeningnya.
3.
Industri Otomotif
Dapat disimpulkan bahwa Big Data itu bukan
semata-berbicara data dalam ukuran besar, Big Data itu muncul ketika orang
mulai sadar bahwa ada data-data baru yang sebelumnya belum dianalisa.
Referensi :
-
Jessica, 2013, Pengenalan Big Data
Makalah Topik Lanjutan, Binus University, Jakarta
-
Emirul Bahar