SRI TV

Ikuti perkembangan terbaru Indonesia di lapangan dengan berita berbasis fakta Sri Wijaya TV, cuplikan video eksklusif, foto, dan peta terbaru.

Google, Alumni Uber Luncurkan Platform Deteksi Kesalahan ML • Daftar

Google, Alumni Uber Luncurkan Platform Deteksi Kesalahan ML • Daftar

Alumni pembelajaran mesin dari Google, Uber, dan Apple telah memulai perusahaan baru untuk mengatasi kesalahan dalam data tidak terstruktur.

CEO Vikram Chatterjee sebelumnya adalah Kepala Manajemen Produk di Google Cloud AI. CTO Atindriyo Sanyal adalah pemimpin teknik untuk platform AI Uber Michelangelo dan merupakan insinyur pendiri SiriKit di Apple. Wakil Presiden Teknik Yash Sheth memimpin tim pengenalan suara di Google.

Galileo, usaha baru mereka, didirikan pada November 2021, dan beroperasi secara rahasia hingga Pengumuman hari ini.

Chatterjee mengatakan aplikasi Galileo terinspirasi oleh percakapan mereka masing-masing dengan profesional pembelajaran mesin yang bekerja dengan data tidak terstruktur, yang menurut mereka menyumbang 80 persen dari data yang dihasilkan hari ini.

“Hambatan terbesar dan waktu yang terbuang untuk pembelajaran mesin berkualitas tinggi selalu memperbaiki data yang mereka kerjakan.

“Ini sangat penting, tetapi sangat manual, ad hoc dan lambat, yang mengarah pada prediksi model yang buruk dan bias model yang dapat dihindari yang menyusup ke dalam produksi bisnis,” kata Chatterjee.

“Kami membangun Galileo dengan tujuan menjadi platform data cerdas bagi para ilmuwan data untuk secara sistematis dan cepat memeriksa, memperbaiki, dan melacak data ML mereka di satu tempat.”

Menurut Galileo, ilmuwan data membuang lebih dari 50 persen waktu mereka untuk melacak kesalahan data, yang sebagian besar merupakan proses manual.

Galileo bertujuan untuk menghilangkan waktu yang terbuang ini dengan secara otomatis merekam semua data yang bergerak melalui model ML dan kemudian menunjukkan apa yang diyakini sebagai titik kegagalan bersama dengan rekomendasi untuk memperbaiki masalah.

Memperbaiki masalah dengan data pembelajaran mesin adalah bagian pelatihan yang paling memakan waktu, tetapi juga memiliki laba atas investasi tertinggi. Untuk itu, Galileo mengatakan dapat menghemat tim pembelajaran mesin lebih dari 100 jam sebulan dan mengklaim dapat memperbaiki masalah data ML 10 kali lebih cepat daripada melakukannya secara manual.

Untuk menjaga biaya tetap rendah, Galileo menggunakan model berbasis konsumsi, meskipun volume model dan biaya pelatihan meningkat, harga bisa menjadi curam, tergantung pada bagaimana Galileo meningkatkan biaya layanan yang belum dibagikan.

Galileo menggambarkan proses internalnya sebagai berdasarkan “beberapa algoritma statistik canggih yang dibuat oleh tim”.

Chatterjee berkata catatan Bahwa Galileo menggunakan pemahaman model ML sendiri tentang titik data untuk menentukan mana yang sulit untuk model, dan mana yang mudah. Galileo membuat saran untuk mengatasi kesulitan tersebut dengan apa yang dikatakan Chatterjee adalah akurasi 95 persen.

Galileo menyajikan semuanya di dasbor GUI yang menunjukkan perbedaan antara proses, memungkinkan pengguna untuk menambah atau menghapus item dari data untuk mempelajari cara menyesuaikan probabilitas kesalahan, dan sebaliknya mengubah pelatihan pembelajaran mesin tanpa bergantung pada “skrip Python dan lembar Excel”, seperti Chatterji dan Sanyal dan Sheth berkata dalam postingan mereka pengumuman perusahaan.

Ketika Chatterjee ditanya bagaimana menerapkan Galileo di lingkungan pelanggan catatan Bahwa semua penerapan Galileo terjadi dalam lingkungan cloud pelanggan (Galileo sendiri tidak mengetahui penyedia layanan), dan Galileo tidak mengirimkan data apa pun ke perusahaan.

“Kami bekerja dengan layanan keuangan dan lembaga kesehatan, antara lain. Privasi data ML sangat penting di sini,” kata Chatterjee. ®