Big data dan privasi

Pile of data, magnifier, boxes with papers and folders on a light background

Selama beberapa dekade terakhir, dunia sudah sangat berubah dalam banyak aspek, khususnya dalam aspek IT. Jumlah orang yang bisa kita ajak berkomunikasi setiap hari sudah sangat bertambah, sama seperti jumlah informasi yang dapat kita akses. Namun, hal ini juga berlaku terhadap jumlah informasi yang perusahaan-perusahaan besar kumpulkan tentang kita. Terminologi seperti big data semakin sering digunakan seiring berjalannya waktu. Namun apa artinya, sebenarnya? Apa itu big data? Apakah berbahaya? Bagaimana hal tersebut mempengaruhi privasi kita? Itu adalah beberapa pertanyaan yang akan kami bahas dalam artikel ini.

Apa itu big data?

List with magnifying glassTerminologi “big data” menggambarkan kuantitas data (pribadi) yang sangat besar yang secara terus-menerus dikumpulkan oleh beragam pihak. Contohnya adalah semua informasi yang dikumpulkan Google tentang permintaan pencarian penggunanya. Fenomena big data ini adalah perkembangan yang relatif baru dan dimulai karena perusahaan dan organisasi (besar), seperti Facebook, Google dan sebagian besar pemerintah, mulai mengumpulkan lebih banyak data tentang pengguna, pelanggan dan masyarakat mereka dibanding sebelumnya. Teknologi-teknologi baru, dunia yang berbasis digital dan internet telah banyak membantu perkembangan ini.

Kumpulan big data sering kali sangat banyak sehingga mustahil untuk bisa menganalisis mereka menggunakan cara analisis data yang tradisional. Namun, jika seseorang menganalisis big data secara tepat, pola dan kesimpulan menarik bisa didapatkan. Contohnya, big data sering kali digunakan untuk riset pasar berskala besar: produk-produk mana yang kemungkinan besar akan dibeli? Apa jenis iklan yang paling efektif saat ingin menggapai dan meyakinkan pelanggan?

Supaya sebuah dataset untuk dilihat sebagai big data, biasanya perlu memenuhi tiga kriteria berikut ini, yang juga dikenal sebagai 3 v:

  • Volume: Big data bukan sample yang kecil. Isinya merupakan koleksi beragam data, hasil pengamatan jangka panjang yang dilakukan terus-menerus.
  • Velocity: Hal ini berkaitan dengan kecepatan yang memukau saat pengumpulan big data. Selain itu, big data sering kali langsung bisa diakses (pada saat proses pengumpulan data).
  • Variety: Dataset yang besar sering kali berisi banyak jenis informasi. Data di dalam dataset besar yang berbeda bahkan bisa digabungkan untuk mengisi kekosongan apapun dan membuat datasetnya lebih lengkap lagi.

Selain 3 v, big data punya beberapa karakter lain. Contohnya, big data bagus untuk tingkat pemahaman mesin. Ini artinya kumpulan data tersebut bisa secara efektif digunakan untuk mengajarkan tugas-tugas tertentu kepada komputer dan mesin. Lebih dari itu, seperti yang sudah sedikit kami jelaskan, big data bisa digunakan untuk mendeteksi pola. Hal ini sebagian besar terjadi dengan sangat efektif, yaitu komputer yang akan bekerja mempelajari datanya. Terakhir, big data adalah cerminan atas digital fingerprint pengguna. Ini berarti data tersebut merupakan hasil samping dari aktivitas digital dan online orang-orang dan bisa digunakan untuk membangun profil pribadi seorang individu.

Ragam jenis big data

Ada beragam cara untuk mengklasifikasi big data. Cara pertama, yang paling sering digunakan, adalah membedakan big data berdasarkan jenis data yang dikumpulkan. Tiga kemungkinan kategori yang digunakan untuk jenis klasifikasi ini adalah: big data yang terstruktur, big data yang tidak terstruktur dan big data yang semi-terstruktur.

  1. Terstruktur: Saat big data terstruktur, mereka bisa disimpan dan ditampilkan secara tersusun dan logis, sehingga datanya lebih mudah diakses dan dipahami. Contohnya adalah daftar alamat pelanggan yang dibuat oleh sebuah perusahaan. Dalam daftar ini, kemungkinan bisa ditemukan nama, alamat, dan bahkan informasi lain seperti nomor telepon pelanggan, yang terstruktur secara jelas dalam, contohnya, sebuah bagan atau tabel.
  2. Tidak terstruktur: Big data yang tidak terstruktur sama sekali tidak tersusun. Tampilan datanya tidak logis sehingga kurang bisa dipahami oleh rata-rata orang. Big data yang tidak terstruktur tidak punya, contohnya, struktur tabel yang menunjukkan adanya keterkaitan antara beragam elemen di dataset. Maka jenis data ini cukup sulit untuk ditelusuri dan dipahami. Banyak dataset yang berawal sebagai big data tidak terstruktur.
  3. Semi-terstruktur: Big data yang semi-terstruktur, seperti mungkin dugaan Anda, memiliki karakteristik dari big data terstruktur dan tidak terstruktur. Sifat dan tampilan jenis data ini tidak sepenuhnya berubah-ubah. Namun datanya tidak terlalu terstruktur dan tersusun untuk bisa digunakan dalam analisis yang berguna. Contohnya adalah halaman web yang berisi tag meta data spesifik (informasi tambahan yang tidak langsung terlihat dalam teks ini), mungkin karena berisi kata-kata kunci tertentu. Tag tersebut secara efektif menunjukkan cuplikan-cuplikan informasi, seperti penulis halaman atau waktu publikasinya di internet. Teksnya sendiri secara umum tidak terstruktur, namun kata kunci dan meta data lain di dalamnya cukup layak untuk membantu dasar pembuatan analisis.

Klasifikasi berdasarkan big data

Cara umum lain untuk membedakan antara beragam jenis big data adalah dengan melihat sumber datanya. Siapa atau apa yang menghasilkan informasi tersebut? Seperti pengelompokan sebelumnya, metode klasifikasi ini juga berisi 3 kategori yang berbeda.

  1. Orang-orang: Kategori ini berisi big data yang dihasilkan oleh orang-orang. Contohnya adalah buku, gambar, video serta informasi dan data (pribadi) di situs dan media sosial, seperti Facebook, Twitter, Instagram, dan hal lain.
  2. Registrasi proses: Kategori ini mencakup jenis big data yang lebih tradisional, yang dikumpulkan dan dianalisis oleh perusahaan (besar) untuk meningkatkan proses-proses tertentu dalam sebuah bisnis.
  3. Mesin: Jenis hasil data ini dihasilkan dari semakin banyaknya jumlah sensor yang ditempatkan dalam mesin. Contohnya adalah sensor panas yang sering kali dibuat dalam prosesor komputer. Data yang dihasilkan oleh mesin sering kali bisa sangat kompleks, tapi paling tidak jenis big data ini secara umum sangat terstruktur dan lengkap.

Big data bisa digunakan untuk apa?

Facebook logoSemua hal yang dibahas sejauh ini tetap terdengar abstrak. Mari memperjelas dan membahas beberapa contoh big data di dunia nyata. Bagaimanapun juga, ada banyak sekali cara perusahaan dan organisasi dalam menggunakan big data. Salah satu contoh paling umum adalah banyaknya jumlah data yang dikumpulkan perusahaan tentang kita. Facebook mengumpulkan data semua penggunanya dan menganalisis data tersebut untuk menentukan konten yang ditampilkan di timeline Anda. Tentunya, hal ini disesuaikan dengan keinginan dan kesukaan Anda. Facebook berharap bahwa hal tersebut akan membuat Anda betah berada di situs mereka untuk waktu yang panjang. Selain itu, Amazon mengumpulkan informasi tentang client mereka dan produk yang dibeli. Dengan begitu, Amazon bisa menyarankan produk yang menurut mereka akan Anda sukai dan meningkatkan pendapatan mereka.

Namun, big data juga digunakan untuk hal-hal yang sepenuhnya berbeda dari strategi komersil yang disebutkan di atas. Contohnya, perusahaan transportasi publik bisa mengumpulkan data tentang seberapa sibuk rute-rute tertentu. Setelah itu, mereka bisa menganalisis data ini untuk menentukan, contohnya, rute mana yang membutuhkan bis atau kereta tambahan. Kasus terkenal lain tentang penggunaan big data adalah jasa pengiriman internasional yang besar yaitu UPS. UPS menggunakan perangkat lunak khusus yang dikembangkan setelah analisis big data. Perangkat lunak ini membantu supir UPS untuk menghindari laju kiri, yang lebih mahal, boros dan berbahaya dibanding laju kanan. Menurut dugaan, sistem ini sudah menghemat jutaan galon bensin untuk UPS, berkat big data.

Contoh pengumpulan big data lain yang menarik adalah tes dan situs DNA seperti MyHeritage DNA. Situs ini mengklaim bahwa mereka bisa membantu Anda dalam “menemukan asal usul etnis Anda dan menemukan kerabat baru” dengan tes DNA yang sederhana. Proses ini mencakup adanya banyak pengumpulan data dan cross-referencing, sehingga menjadi faktor utama juga dalam pengumpulan dan penggunaan big data. Tes DNA fisik dan “tradisional” juga melibatkan jumlah big data yang banyak, karena perusahaan yang melaksanakan tesnya akan mendapat dataset yang sangat besar tentang banyak sekali orang. Tentunya, penting untuk berhati-hati dengan kemungkinan resiko proses pengumpulan big data tersebut. Resiko-resiko ini akan dijelaskan pada bagian selanjutnya dalam artikel ini.

Apakah big data berbahaya?

Seperti yang ditunjukkan di atas, big data bisa sangat berguna dalam banyak kasus. Datanya menyediakan banyak informasi yang apat kita gunakan untuk mempersingkat proses dan membuat perusahaan lebih efisien dan menguntungkan. Namun, ini bukan berarti pengumpulan dan penggunaan big data sepenuhnya bebas dari resiko. Ada lima resiko penting saat berurusan dengan big data. Kami akan membahas kelimanya di sini.

Peretas dan pencuri

Dengan semua hal yang kita lakukan saat online, ada bawaan resiko bahwa data dan informasi pribadi tentang aktivitas kita di internet bisa dicuri. Setiap pengguna internet harus sadar akan hal ini. Jumlah kasus kebocoran dan pencurian data semakin drastis meningkat beberapa tahun terakhir. Sering kali ada cerita di berita tentang pelaku kriminal yang menjual dataset berisi kata sandi dan informasi lain di tempat seperti dark web. Sering kali, dataset ini dicuri dari situs-situs resmi, perusahaan dan organisasi. Semakin besar datasetnya, semakin menarik bagi pencuri. Jika mereka mendapat dataset tersebut, mereka bisa membuat banyak masalah. Pada intinya, hal ini bisa sangat membahayakan privasi Anda.

Privasi

Praktek pengumpulan data pribadi semakin kerap dilakukan oleh banyak pihak. Namun, regulasi privasi sekarang tidak bisa menyeimbangi perkembangan cepat teknologi yang memungkinkan adanya praktek seperti ini. Hal ini menyisakan ruang abu-abu dan ketidakpastian yang tidak bisa diselesaikan dengan panduan hukum. Kekhawatiran privasi penting yang muncul termasuk: Jenis data apa yang boleh dikumpulkan? Data tentang siapa? Siapa yang seharusnya punya akses ke data ini?

Saat sedang mengumpulkan jumlah data yang besar, kemungkinannya tinggi bahwa informasi pribadi yang sensitif dicakup dalam dataset tersebut. Hal ini bermasalah, bahkan saat peretas dan pencuri tidak terlibat. Bagaimana pun juga, data pribadi yang sensitif bisa disalahgunakan oleh siapapun yang punya niat buruk. Ini termasuk perusahaan dan organisasi (berbahaya).

Analisis data yang buruk

Banyak perusahaan dan organisasi yang mengumpulkan big data, karena mereka bisa menggunakannya untuk tujuan analisis yang menarik. Hal ini mampu memberi mereka pengetahuan baru yang penting tentang apapun yang sedang mereka teliti (contohnya, kebiasaan konsumen). Lalu, pengetahuan dan kesimpulan ini bisa menghasilkan perubahan untuk mendapat margin yang lebih tinggi atau keuntungan lebih banyak. Namun, sama seperti data set pada umumnya, analisis big data yang tidak tepat bisa memiliki konsekuensi serius. Bagaimana pun juga, analisis yang buruk bisa dengan mudah menghasilkan kesimpulan yang salah. Ini bisa mengakibatkan inefektifitas atau bahkan berkurangnya tingkat produktifitas perusahaan.

Pengumpulan data yang “salah”

Big data semakin populer dan organisasi semakin banyak yang ingin mengumpulkan segala jenis data. Ini artinya jumlah data yang sangat besar dikumpulkan tanpa ada alasan yang jelas untuk menganalisis data tersebut. Dalam bahasa lain, prakteknya menghasilkan basis data informasi mentah yang besar untuk persiapan kebutuhan apapun. Perusahaan kemungkinan berpikir bahwa proses pengumpulan data cukup mudah, sehingga mereka sebaiknya langsung melakukannya. Pada dasarnya, hal ini tidak bagus untuk privasi siapa pun. Bahkan bisa berujung pada pengumpulan dan analisis data yang tidak relevan atau “salah”. Jika kesimpulan yang diambil dari analisis ini digunakan dalam proses manajemen, bisa berakibat pada pengambilan upaya yang tidak efektif seperti yang disebutkan di paragraf sebelumnya.

Pengumpulan dan penyimpanan big data atas dasar niat buruk

Pengumpulan big data semakin sering digunakan oleh perusahaan, organisasi dan pemerintah supaya mereka bisa membuat profil individu yang lebih akurat tentang orang-orang. Pengguna atau masyarakat hampir sama sekali tidak diberi tahu data pribadi mana yang tercatat, alasannya atau pun caranya. Pada dasarnya, hal ini punya implikasi yang serius terhadap privasi online mereka. Semua hal yang mereka lakukan saat online bisa disimpan dan dilihat nanti. Selain itu, pengumpul big data bisa dengan mudah mempengaruhi dan memanipulasi keputusan orang-orang dengan menganalisis dan menggunakan data yang sudah terkumpul.

Big data dan privasi

Smartphone with picture of earSeperti yang mungkin sekarang sudah Anda pahami, big data punya banyak kerugian dan resiko. Namun, banyak perusahaan dan organisasi yang tetap mengumpulkan data dalam skala besar, sebagian besar karena pengaruh data tersebut terhadap pertumbuhan dan peningkatan mereka. Pengumpulan big data lebih mudah sekarang dibanding sebelumnya. Hal ini punya konsekuensi yang besar bagi privasi kita. Kami telah membahas secara singkat kemungkinan ancaman privasi dari pihak-pihak berbahaya yang mengumpulkan data buruk. Mengingat privasi kita sangat berkaitan dengan pengumpulan massal data pribadi, kami ingin menggunakan bagian artikel ini untuk membahas beragam resiko privasi yang dimiliki big data.

Pengumpulan data berskala besar

Banyak perusahaan, termasuk Google, Facebook dan Twitter, yang sangat bergantung pada iklan untuk menyokong bisnis mereka dan mendapat keuntungan. Untuk membuat iklannya se-efektif mungkin, perusahaan tersebut membuat profil merinci tentang pengguna mereka, khususnya dengan mempertimbangkan kesukaan dan ketertarikan mereka. Ini adalah sebuah bentuk big data. Sama halnya dengan ini, pemerintah dan dinas rahasia juga bergantung pada big data. Mereka menggunakan jumlah informasi yang banyak untuk melacak dan menyelidiki orang-orang yang menurut mereka mencurigakan. Tentunya, hal ini juga berarti ada banyak big data yang bisa didapatkan oleh pelaku kriminal cyber dan bahkan bisa mereka manipulasi dan salah gunakan. Hal ini bisa mengakibatkan segala jenis masalah terkait privasi dan identitas. Salah satu contohnya adalah pencurian identitas.

Tetap saja, kemungkinan yang dihasilkan dari pengumpulan basis data tersebut jauh lebih luas dari ini. Jaman sekarang, teknologi sudah semakin canggih dan “cerdas” sehingga bisa menggabungkan dataset. Hal ini bisa dilakukan dengan cara yang cerdas dan licik, sehingga perusahaan dan organisasi besar kemungkinan tahu lebih banyak tentang Anda dibanding yang kita bayangkan! Identitas, tempat tinggal, hobi, teman Anda: semua informasi ini tidak akan lagi tersembunyi. Bukan hal yang nyaman untuk dipikirkan, pastinya. Untungnya, ada beberapa cara untuk melindungi diri sendiri dari pelanggaran privasi berskala besar yang bisa disebabkan oleh big data.

Peraturan tentang privasi

Cookies on screenPeraturan dan regulasi tentang privasi bisa melindungi kita dari pelanggaran privasi, tapi hanya sampai batasan tertentu. Hal yang lebih rumitnya lagi, peraturan tentang privasi sering kali sangat berbeda di setiap negara dan kawasan. Contohnya, di Eropa peraturan konsumen yang secara relatif ketat yaitu General Data Protection Regulation (GDPR) diterapkan. Peraturan ini berlaku untuk semua negara anggota Uni Eropa, meskipun rinciannya mungkin berbeda per negara. Banyak perusahaan internasional yang telah memutuskan untuk mematuhi GDPR. Ini alasan Google, contohnya, sekarang mengizinkan pengguna untuk meminta penghapusan informasi pribadi. Namun, peraturan tentang privasi di Amerika Serikat berbeda dari satu negara bagian ke negara bagian lain dan tidak melindungi konsumen sebaik Uni Eropa. Sayangnya, hal ini juga terjadi pada peraturan tentang privasi yang paling ketat di Amerika Serikat, yaitu California Consumer Privacy Act.

Singkat kata, tidak ada peraturan privasi “global” kuat yang berlaku untuk semua kolektor big data dan melindungi semua pengguna. Ini berarti privasi kita bukan saja disalahgunakan oleh kolektor big data dengan cara ilegal, tapi bahkan juga dengan cara legal. Untungnya, pelanggaran privasi berskala besar yang telah diekspos oleh whistleblower seperti Edward Snowden dan Chelsea Manning telah banyak meningkatkan kesadaran orang-orang tentang resiko big data. Tentu, ini hanya langkah awal dalam peningkatan peraturan tentang privasi.

Banyak pengguna internet yang tidak ingin menunggu lama untuk melihat peningkatan kualitas peraturan tentang privasi – hal ini masuk akal. Sebaliknya, mereka ingin mengambil langkah sendiri dengan melakukan cara apapun agar bisa melindungi privasi mereka. Ingin mencegah diri supaya tidak jadi bagian dari beragam dataset besar? Ada sejumlah tips dan trik yang bisa membantu Anda.

Cara menyimpan data Anda supaya tidak tersimpan di dataset besar

Dataset besar benar-benar mempengaruhi privasi dan keamanan Anda. Dataset ini bisa berisi segala jenis informasi (pribadi), yang bisa disalahgunakan oleh perusahaan besar atau bahkan pelaku kriminal cyber. Ini alasan mengapa Anda sebaiknya selalu memastikan bahwa Anda hanya meninggalkan jejak online sedikit mungkin. Tips berikut ini bisa membantu Anda dalam mencapainya:

  • Coba kurangi penggunaan informasi pribadi saat membuat kata sandi atau saat sedang di web. Contoh: hindari penggunaan nama, alamat, nomor telepon, tanggal lahir, dan hal lain.
  • Selalu ingat hal ini: semua yang Anda bagikan di internet, akan selamanya ada. Ini mungkin tidak selalu sepenuhnya benar, tapi tingkat kewaspadaan ini akan membantu mengamankan privasi Anda. Anda secara otomatis akan merawat data pribadi dengan lebih hati-hati setelah Anda tahu fakta ini.
  • Pastikan koneksi internet Anda aman dan anonim, contohnya dengan menggunakan browser Tor atau VPN.
  • Gunakan satu atau beberapa adblocker di browser Anda.
  • Gunakan satu atau beberapa browser plug-in yang memblokir pelacak dan cookies.
  • Secara reguler hapus cache dan sejarah browsing Anda serta cookies.
  • Log out dari situs saat Anda tidak sedang menggunakannya.

Langkah-langkah ini adalah permulaan yang bagus untuk memastikan privasi dan keamanan online Anda. Namun, mohon diingat, bahwa big data dikumpulkan dengan banyak cara – bukan hanya secara online. Singkat kata, di mana pun dan apapun yang Anda lakukan, sebaiknya selalu berhati-hati dan usahakan untuk melindungi data (pribadi) Anda dari kolektor big data.

International security coordinator
Marko has a Bachelor's degree in Computer and Information Sciences. He coordinates and manages VPNOverview.com's team of international VPN researchers and writers.
Kumpulkan sebuah komentar
Kumpulkan sebuah komentar