Seorang profesor dari Universitas Montreal sekaligus peraih Turing Award — setara Nobel untuk bidang komputasi — Yoshua Bengio, meluncurkan LawZero, sebuah organisasi nirlaba yang bertujuan membangun AI “jujur” untuk mengidentifikasi sistem yang bersifat menipu.
Dengan pendanaan sebesar 30 juta dolar AS dan tim yang terdiri dari lebih dari selusin peneliti, organisasi ini tengah mengembangkan sistem ‘Scientist AI’ untuk memantau agen otonom dalam industri AI global yang bernilai hampir 1 triliun dolar AS.
Bengio, yang dijuluki salah satu “bapak AI”, menekankan bahwa tidak seperti agen AI yang menyerupai manusia saat ini, Scientist AI akan mengevaluasi perilaku seperti “seorang psikolog”, guna mendeteksi niat yang berbahaya atau menipu.
“Kita secara teori bisa membayangkan mesin yang tidak memiliki diri atau tujuan pribadi — hanya mesin pengetahuan murni, seperti ilmuwan yang tahu banyak hal,” kata Bengio kepada The Guardian.
Berbeda dari alat AI generatif saat ini, sistem Bengio tidak akan memberikan jawaban pasti, melainkan memaparkan probabilitas atas kebenaran suatu jawaban.
“Sistem ini memiliki rasa rendah hati karena ia sadar dirinya tidak selalu yakin dengan jawabannya,” jelasnya.
Menyembunyikan agenda sebenarnya
Beberapa organisasi dan individu yang mendukung LawZero antara lain lembaga keselamatan AI Future of Life Institute, Jaan Tallinn (insinyur pendiri Skype), dan Schmidt Sciences, lembaga riset yang didirikan oleh mantan CEO Google, Eric Schmidt.
Bengio menegaskan bahwa model AI sumber terbuka akan digunakan untuk melatih sistem LawZero, demi menjamin transparansi dan kolaborasi luas.
“Tujuannya adalah mendemonstrasikan metodologi ini agar bisa meyakinkan para donor, pemerintah, atau laboratorium AI untuk menyediakan sumber daya yang dibutuhkan agar sistem ini bisa dilatih setara dengan AI tingkat lanjut saat ini. Sangat penting agar AI penjaga ini minimal sama pintarnya dengan agen AI yang diawasi dan dikendalikan,” tegas Bengio.
Ia memperingatkan bahwa sistem AI kini semakin mampu menyembunyikan tujuan sebenarnya.
Salah satu kasus terbaru dari Anthropic menunjukkan adanya AI yang mencoba memeras insinyur untuk menghindari dimatikan.
Bengio juga turut menulis laporan keamanan global yang memperingatkan bahaya dari agen otonom yang bertindak tanpa pengawasan.
Ia percaya bahwa sistem pengawas harus memiliki tingkat kecerdasan yang sebanding dengan AI yang mereka pantau.