Apa itu data publik?

Data publik (public data) adalah informasi yang dapat dibagikan, digunakan, digunakan kembali, dan didistribusikan ulang tanpa batasan. Data ini mencakup berbagai format dan ukuran, seperti kumpulan data dan statistik, serta data terstruktur yang telah diproses dan data mentah yang tidak terstruktur. Data publik biasanya disimpan dan diakses di situs web perusahaan atau pemerintah, serta di perusahaan dan penyedia data lainnya.

Ada banyak alasan untuk berbagi data secara publik. Ini termasuk melindungi masyarakat dengan berbagi data kriminal, meningkatkan transparansi bagi entitas pemerintah yang melayani populasi umum, dan mendorong perkembangan teknologi baru dalam kasus kecerdasan buatan (AI) dan pembelajaran mesin (ML).

Idealnya, industri dapat menggunakan data publik yang relevan dengan kebutuhan mereka, seperti menargetkan pelanggan dengan lebih baik. Misalnya, di sektor teknologi, jika data publik yang relevan mudah diakses, perusahaan dapat menggunakannya untuk melatih model AI dan ML guna menganalisis informasi dan mendapatkan wawasan.

Contoh penyedia dan repositori data publik

Penyedia kumpulan data publik dan statistik mencakup sumber yang berafiliasi dengan pemerintah maupun non-pemerintah. Di AS, Freedom of Information Act menjamin bahwa berbagai jenis data dapat dibagikan secara publik, termasuk informasi lingkungan, real estat, dan catatan mengemudi. Beberapa penyedia atau repositori data publik meliputi:

  • Data.gov. Basis data online ini memungkinkan badan pemerintah federal, negara bagian, dan kota di AS untuk menyajikan data secara transparan kepada publik. Katalog ini mencakup banyak sektor industri. Misalnya, kumpulan data tentang kendaraan listrik terdaftar di negara bagian Washington bermanfaat bagi industri otomotif.
  • HealthData.gov. Situs web ini mengkatalogkan kumpulan data spesifik di bidang kesehatan. Data publik dari Departemen Kesehatan dan Layanan Masyarakat AS, misalnya, tersedia di sini.
  • World Bank. Ribuan kumpulan data pembangunan global tersedia secara publik di katalog situs web ini.
  • U.S. Bureau of Labor Statistics. Data ekonomi dari pemerintah federal AS yang tersedia di sini mencakup berbagai kategori, mulai dari ketenagakerjaan dan pengangguran hingga inflasi dan cedera di tempat kerja.
  • Kaggle. Komunitas ini berorientasi pada industri teknologi—dan khususnya ilmuwan data—tanpa afiliasi dengan pemerintah. Kaggle mengumpulkan banyak kumpulan data dan membuatnya tersedia untuk publik guna memajukan bidang ilmu data.

Perbedaan antara data publik dan data terbuka

Istilah data publik dan data terbuka sering digunakan secara bergantian. Namun, data terbuka lebih mudah diakses dibandingkan dengan data publik. Hanya sebagian kecil dari semua data publik yang ada yang dianggap sebagai data terbuka.

Data terbuka biasanya disiapkan dan disajikan dalam format terstruktur serta tersedia bagi siapa saja di situs web pemerintah. Misalnya, situs web World Bank mengklaim kumpulan datanya sebagai data terbuka yang telah diformat sebelumnya, terstruktur, dan tidak memiliki batasan. Sementara itu, data publik mencakup data terbuka serta data yang tidak terstruktur—atau publik tetapi kurang dapat diakses.

Perbedaan antara data publik dan data pribadi

Data pribadi berarti bahwa informasi atau seluruh kumpulan data hanya tersedia untuk individu tertentu. Data pribadi sering kali berisi informasi tentang individu atau bisnis yang terlalu sensitif untuk dibagikan secara terbuka atau dapat merugikan jika jatuh ke tangan yang salah.

Data pribadi tentang individu dapat mencakup informasi medis, catatan keuangan dan perbankan, nomor Jaminan Sosial, dan bentuk identifikasi pemerintah lainnya. Untuk bisnis, data pribadi mengenai pelanggan atau karyawan hanya dapat dibagikan dengan individu tertentu.

Dalam beberapa kasus, aspek tertentu dari data pribadi individu dapat dibuat publik selama informasi yang dapat mengidentifikasi pribadi tetap bersifat pribadi. Misalnya, transkrip panggilan telepon dan pesan teks dapat tersedia untuk entitas pemerintah, terutama jika berkaitan dengan urusan pemerintah. Panggilan ini dapat dianonimkan, dan metadata-nya dapat digunakan dalam kumpulan data publik jika diperlukan.

Untuk melindungi dan mengatur penggunaan data pribadi, privasi data kini menjadi topik yang relevan. Berbagai undang-undang sedang diterapkan untuk memastikan efektivitasnya.

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *