Penarikan Senat Georgia: Menggunakan analitik prediktif dan data besar dengan benar

Januari 5, 2021 by Tidak ada Komentar

[ad_1]

Mengingat semua keributan yang dihasilkan dari pemilihan terakhir, sangat mengejutkan mendengar sedikit berita jajak pendapat mengenai pemilihan Senat saat ini di Georgia. Keheningan ini sangat mengejutkan mengingat mayoritas Senat tergantung pada keseimbangan. Kami percaya keheningan ini mencerminkan kenyataan yang lebih besar – bahwa orang telah menyerah pada pemungutan suara dan bahwa yang kalah dalam pemilihan bagi banyak orang bukanlah Trump atau Biden, tetapi ilmu data – khususnya, bidang ilmu data sosial. keluar, selama berbulan-bulan menjelang pemilihan, Biden dan Partai Demokrat mempertahankan keunggulan yang kuat dan akhirnya berkembang; Prediksinya bukan hanya dia dan Demokrat akan menang, tapi juga dengan tangan kanan. Kita semua tahu sekarang bahwa kenyataan memohon untuk berbeda: Bahkan ketika semua suara pada akhirnya dihitung, di beberapa negara bagian, Biden hanya meraih selisih tipis dan Demokrat kehilangan kursi. Tidak hanya banyak pemungutan suara dan pelaporan terkait tidak akurat, tetapi itu terjadi sepenuhnya menyadari kecelakaan kereta pemungutan suara 2016: Trump vs. Clinton. Khususnya, tampaknya ada handwringing publik yang lebih sedikit dibandingkan tahun 2016. Untuk masyarakat umum, setidaknya, konsekuensi dari off secara substansial lebih tidak bermasalah daripada off oleh banyak pihak. Kami tidak setuju. Mengambil suhu bangsa secara akurat dari sampel kecil penting untuk kelancaran demokrasi. Kejutan mengganggu secara politik, sosial dan ekonomi. Praktis, mereka sering menyebabkan donasi yang salah alokasi dan upaya merayu kantong pemilih tertentu. Terlepas dari semua keajaiban yang kami dengar tentang apa yang dapat kami lakukan dengan menambang kumpulan data besar – memprediksi, misalnya, afiliasi politik seseorang melalui kebiasaan belanja mereka – pemungutan suara dalam apa yang disebut sebagai pemilihan paling penting dalam satu generasi tidak hanya salah, tapi bisa dibilang, sangat mengagumkan. Miliaran dihabiskan untuk pemungutan suara dan pemodelan, lebih banyak daripada banyak tantangan sains data lainnya, seperti menyembuhkan kanker. Namun, mereka masih jelas tidak memadai dan tidak akurat. Segera setelah pemilihan, kami melihat beberapa quarterbacking Rabu pagi melakukan banyak kemungkinan kesalahan yang mungkin telah dilakukan lembaga survei. Terlepas dari apakah mereka salah karena tidak diketahui yang tidak diketahui seperti kepastian bahwa orang berbohong kepada lembaga survei, atau pemungutan suara kehilangan kantong demografis (yaitu, pemilih yang pemalu atau pedesaan), atau alasan lainnya, setiap alasan seharusnya ada, dan kemungkinan besar adalah , diperhitungkan dalam model terakhir. Lebih dari itu, pada hari-hari menjelang pemilihan, kami berulang kali dijanjikan bahwa lembaga survei, yang masih menjilati luka mereka yang berusia empat tahun, telah memperhitungkan dengan baik masalah ini dan masalah lainnya. Namun yang jelas, mereka masih melewatkan sesuatu. Kesalahan dibuat pada tahun 2016, dan bahkan lebih mengerikan sekarang, mengingat 20/20 tinjauan kami tentang bencana itu.

Tetapi meskipun pemodelan pemilu seperti yang saat ini dipraktikkan rusak, kami tetap percaya teguh pada keseluruhan kekuatan big data dan analitik prediktif, jika dilakukan dengan benar. Masyarakat modern terlalu mengandalkannya untuk kelancaran operasi menjadi salah. Semua analitik memiliki bias yang melekat. Bahkan ada organisasi seperti perusahaan Israel CybeRighTech yang bertujuan untuk mengidentifikasi dan menghilangkan bias tersebut dalam semakin banyak algoritme prediktif yang sekarang kita temui setiap hari. Setidaknya ada dua sumber utama bias dalam model pemungutan suara: lembaga survei dan responden dengan bias implisit masing-masing dan yang tampaknya sulit diatasi. Dengan demikian, cara terbaik untuk meningkatkan keakuratan polling adalah dengan mengurangi ketergantungan kita pada keduanya. Untuk tujuan ini, industri polling harus melihat ke sains dan pasar terbuka.Dalam ilmu alam, kesalahan ditemukan dan dihapus dengan mereproduksi eksperimen di mana baik metode dan datanya transparan dan tersedia secara luas bagi orang lain untuk menguji dan menguji ulang hasilnya. Sebagai ilmuwan, kami berpendapat bahwa bias pollster dapat dikurangi dengan cepat merilis data yang mendasarinya dan model yang memprosesnya sehingga orang lain dapat mengutak-atik dan mencoba mereproduksi hasil – serupa dengan tinjauan terbuka data uji klinis yang diajukan sebelum persetujuan obat. Metodologi lain yang berguna akan dihasilkan dari peningkatan penggunaan mekanisme pasar dalam prakiraan pemilu arus utama. Untuk berbagai tingkat, ini sudah ada di luar negeri. Pada akhirnya, peluang dari taruhan pemilihan luar negeri (misalnya, di Bursa Taruhan Inggris), di mana penjudi mengutamakan keuntungan daripada kepentingan politik, tampaknya jauh lebih akurat daripada jajak pendapat lokal. Pasar yang benar-benar terbuka dan likuid yang memungkinkan para pemangku kepentingan untuk memonetisasi prediksi mereka tentang hasil pemilihan, dengan peringatan yang diperlukan untuk mencegah penyalahgunaan, mungkin akan memungkinkan prakiraan yang lebih akurat dan stabil untuk pemilihan presiden dan referendum penting seperti Brexit.Dov Greenbaum adalah profesor hukum di IDC Herzliya dan direktur Zvi Meitar Institute for Legal Implications of Emerging Technologies, afiliasi penelitian di Departemen Biofisika Molekuler dan Biokimia di Universitas Yale, dan peneliti di Pusat Universitas Manajemen Singapura untuk AI dan Tata Kelola Data. Mark Gerstein adalah Profesor Informatika Biomedis Albert L. Williams dan profesor biofisika molekuler dan biokimia, ilmu komputer, dan ilmu statistik & data di Universitas Yale. Dia juga salah satu direktur Pusat Yale untuk Ilmu Data Biomedis.


Dipersembahkan Oleh : Pengeluaran Sidney