APPLE dilaporkan telah menggunakan puluhan ribu konten dan video YouTube dengan subtitle untuk melatih model kecerdasan buatan (AI), Apple Intelligence. Ini merupakan pelanggaran terhadap kebijakan konten platform YouTube, dan banyak perusahaan lain seperti Nvidia, OpenAI, dan Anthropic melakukan hal yang sama.
Laporan tersebut berasal dari investigasi yang diterbitkan oleh Proof News bersama Wired.
Menurut penelitian, Apple dan perusahaan lain menggunakan kumpulan data yang disebut Subtitle YouTube yang mencakup transkrip 173.536 video YouTube dari lebih dari 48.000 saluran. Video-video dalam kumpulan data tersebut berkisar dari saluran pendidikan seperti Khan Academy dan MIT, hingga situs berita seperti Wall Street Journal, hingga beberapa pembuat konten top YouTube seperti MrBeast dan Marcus Brownlee, Gizmochina melaporkan.
Marcus Brownlee, peninjau teknis YouTube, mengatakan Apple secara teknis menghindari “bug” karena mengambil sumber AI dari perusahaan yang menggunakan transkrip video YouTube, dibandingkan langsung menggunakan data dari konten YouTube. Namun data/transaksi tetap berkontribusi pada model AI, di mana pengembang menginvestasikan waktu dan uang. Brownlee menyimpulkan bahwa hal ini akan menjadi masalah yang berkembang dalam jangka waktu yang lama.
ProofNews juga mengembangkan alat bagi pembuat konten untuk mencari kumpulan data untuk konten mereka. Kumpulan data subtitel YouTube tidak menyertakan gambar video, namun mencakup beberapa subtitel yang diterjemahkan ke berbagai bahasa. Kumpulan data tersebut dibuat oleh laboratorium penelitian nirlaba bernama Eleuther AI, yang berfokus pada promosi standar sains terbuka.
Tak satu pun dari perusahaan yang disebutkan di atas dapat segera dihubungi untuk dimintai komentar. CEO YouTube Neil Mohan menjelaskan dalam sebuah wawancara bahwa perusahaan yang menggunakan video YouTube untuk melatih model AI mereka merupakan “pelanggaran nyata” terhadap kebijakan platform.
(dk)