Bagaimana Google melatih AI-nya menggunakan konten penerbit tanpa lisensi
BISNIS DAN TEKNOLOGI
5 menit membaca
Bagaimana Google melatih AI-nya menggunakan konten penerbit tanpa lisensiBerkas bocoran perusahaan tunjukkan Google mengambil “garis merah tegas” tanpa beri pilihan kepada penerbit soal pelatihan AI, dan pilih “memperbarui kebijakan secara diam-diam”.
Google memperbarui data penerbit secara diam-diam tanpa pengumuman publik, menurut dokumen. / AP
4 Juni 2025

Google ditemukan menggunakan konten daring untuk melatih alat AI berbasis pencariannya tanpa sepengetahuan atau izin dari penerbit yang membuat konten tersebut, menurut kesaksian pengadilan yang bocor.

Dokumen-dokumen tersebut, yang dirilis dalam sidang antitrust AS terkait dominasi pencarian online Google, juga mengungkap bahwa eksekutif perusahaan menolak pendekatan alternatif yang memungkinkan penerbit mengatur penggunaan konten mereka oleh raksasa teknologi tersebut.

Pengungkapan ini muncul di tengah pengawasan ketat secara global terhadap praktik anti-persaingan serupa yang memicu banyak kasus pengadilan dan tindakan pemerintah terhadap perusahaan teknologi besar.

Sidang Google ini berlandaskan gugatan atas keluhan bahwa mesin pencari milik perusahaan tersebut memegang monopoli ilegal dalam pencarian online, mengungguli pesaing seperti Perplexity dan OpenAI.

Chetna Bindra, eksekutif manajemen produk Google Search, secara eksplisit menyatakan bahwa perusahaan telah menetapkan “garis merah tegas”, yang mengharuskan semua penerbit yang ingin kontennya muncul di hasil pencarian untuk mengizinkan konten mereka dipakai dalam fitur AI Google.

Dokumen tersebut menunjukkan Google menilai proposal pendekatan alternatif sebagai “kemungkinan tidak stabil” dan memilih untuk tidak memberlakukan kontrol tambahan. Penerbit yang “tidak puas” dapat memilih untuk sepenuhnya menghapus diri dari pengindeksan pencarian.

Alih-alih memberikan opsi lain, raksasa teknologi ini secara sengaja memilih jalur restriktif dan berencana menerapkan perubahan melalui “pembaruan diam-diam” tanpa “pengumuman publik” mengenai penggunaan data penerbit.

“Lakukan apa yang kami katakan, katakan apa yang kami lakukan, tapi dengan hati-hati,” kata Bindra dalam dokumen tersebut.

160 miliar potongan konten

Pembahasan internal Google yang dipamerkan di pengadilan federal selama kesaksian Mei menunjukkan perusahaan mempertimbangkan berbagai pendekatan untuk menangani konten penerbit dalam pelatihan AI.

Di antara opsi yang dibahas adalah “SGE (search generative experience) hanya untuk pilihan keluar”, yang memungkinkan penerbit tetap berada dalam mesin pencari namun tidak termasuk dalam ringkasan yang dihasilkan AI.

Google harus menghapus sekitar setengah dari konten yang digunakan—80 miliar potongan dari 160 miliar—dari bahan pelatihan AI untuk memenuhi permintaan opsi keluar.

Menurut pendekatan Google, penerbit yang menggunakan opsi bernama Google-Extended untuk memblokir pelatihan AI berdasarkan konten mereka namun tetap memilih bertahan di mesin pencari, tetap melihat kontennya digunakan dalam produk AI paling terlihat milik perusahaan.

Dokumen internal tersebut menguatkan dugaan lama para penerbit.

Sikap Google yang diklaim menghormati pembuat konten ternyata hanya kedok legalitas sementara perusahaan secara sistematis memanen karya mereka.

Paul Bannister, chief strategy officer di Raptive yang mewakili para pembuat konten daring, menyebut pengungkapan ini “cukup mengejutkan”.

Ia mencatat dokumen itu “jelas menunjukkan bahwa mereka tahu ada banyak opsi, dan mereka memilih yang paling konservatif dan protektif—yang tidak memberi kontrol apa pun kepada penerbit”.

Monopoli pencarian online

Pada Agustus lalu, ketika seorang hakim federal AS memutuskan bahwa Google melanggar undang-undang antitrust dengan mempertahankan monopoli ilegal di pasar mesin pencari online, pengadilan menemukan bahwa raksasa pencarian tersebut menguasai sekitar 90 persen pasar mesin pencari AS dan menggunakan perjanjian eksklusif dengan produsen perangkat serta pengembang browser untuk menekan kompetisi.

Presentasi internal perusahaan mengakui hal ini sambil merekomendasikan cara menyampaikan perubahan kebijakan dan hal-hal yang sebaiknya tidak diungkapkan secara eksplisit.

“Jika sudah sejalan, langkah selanjutnya kami akan mengerjakan bahasa resmi dan segera merilisnya,” tulis dokumen Bindra yang dibuat pada April 2024.

Sebulan kemudian, pada konferensi pengembang tahunan Google, perusahaan meluncurkan pengalaman pencarian yang “sepenuhnya diperbarui” dengan integrasi AI.

Kini, ketika seseorang mencari informasi di Google, alih-alih mengklik situs berita atau blog, mereka sering mendapat jawaban langsung dari ringkasan AI Google di bagian atas hasil pencarian.

Hal ini menyebabkan penerbit kehilangan kunjungan situs yang mereka andalkan untuk menampilkan iklan dan menjual produk kepada pembaca, yang berdampak langsung pada pendapatan mereka.

Pendapatan yang hilang

Para eksekutif industri melaporkan bahwa trafik ke situs mereka turun drastis sejak Google meluncurkan kotak jawaban bertenaga AI ini, memutus aliran pendapatan penting yang dibutuhkan banyak penerbit untuk bertahan.

“Penerbit dan beberapa pemerintah di seluruh dunia sedang mencari cara agar mendapatkan pembayaran yang adil untuk konten asli dari jurnalis, penulis, dan pembuat konten lain,” kata Schiffrin.

“Otoritas persaingan Prancis telah mendenda Google. The New York Times menggugat OpenAI. Media lain merasa tidak sepadan untuk menggugat, sehingga mereka memilih membuat kesepakatan sendiri,” tambahnya.

Gugatan The New York Times menuduh OpenAI dan Microsoft menggunakan jutaan artikelnya tanpa izin untuk melatih sistem AI, yang melanggar undang-undang hak cipta.

Sementara otoritas persaingan Prancis mendenda Google €250 juta karena melanggar komitmen lisensi dengan penerbit Prancis, ditemukan juga bahwa perusahaan melatih chatbot AI-nya, Bard (sekarang Gemini), menggunakan konten berita tanpa memberi tahu mereka, sehingga melanggar aturan kekayaan intelektual Uni Eropa.

Penjelasan Google menolak kontrol yang lebih rinci tampak bertujuan mempertahankan fleksibilitas sambil membatasi kekuatan penerbit.

Liz Reid, kepala pencarian Google, bersaksi bahwa membuat banyak opsi keluar akan “menantang” karena akan memerlukan model terpisah untuk fitur yang berbeda, sehingga menambah “kompleksitas besar” dan biaya perangkat keras signifikan.

“Ini berarti jika pencarian memiliki banyak fitur GenAI di halaman, yang mudah dilakukan, setiap fitur harus memiliki model terpisah yang mendukungnya. Tapi kami tidak membangun model terpisah untuk itu,” kata Reid.

Namun, pembela hak penerbit berpendapat penjelasan ini tidak jujur.

“Ini strategi untuk memastikan Google memiliki kekuatan pasar penuh, dan penerbit kehilangan salah satu kartu tawar terpenting mereka,” kata Brooke Hartley Moy, CEO start-up AI Infactory yang bekerja sama dengan penerbit.

Tapi konsekuensinya tidak hanya soal neraca keuangan. Fondasi informasi yang kredibel mulai terkikis.

Jika pendekatan Google berhasil melemahkan jurnalisme dan penciptaan konten profesional, dampaknya akan melampaui angka-angka di neraca perusahaan.

SUMBER:TRT Global
Lihat sekilas tentang TRT Global. Bagikan umpan balik Anda!
Contact us