Pemilik Facebook, Meta, telah mengumumkan beberapa model kecerdasan buatan baru dari kelompok penelitiannya, termasuk “evaluator pembelajar mandiri” yang dapat memberikan cara untuk mengurangi keterlibatan manusia dalam pengembangan kecerdasan buatan.
Sebelumnya, Meta memperkenalkan alat ini dalam makalah bulan Agustus yang menjelaskan bagaimana alat ini mengandalkan pendekatan “pemikiran pilihan” yang sama yang digunakan oleh sampel model OpenAI o1 untuk membuat penilaian yang andal tentang respons sampel.
Metode ini melibatkan pemecahan masalah kompleks menjadi langkah-langkah kecil yang logis dan tampaknya meningkatkan keakuratan jawaban atas pertanyaan-pertanyaan sulit dalam mata pelajaran seperti sains, pengkodean, dan matematika.
Meta-Crawler menggunakan semua data kecerdasan buatan untuk melatih model pencarian, sehingga menghilangkan kebutuhan manusia pada tahap ini.
Dua peneliti Meta di balik proyek ini mengatakan kepada Reuters bahwa kemampuan menggunakan kecerdasan buatan untuk mengandalkan analisis AI membuka kemungkinan menciptakan agen AI otonom yang dapat belajar dari kesalahan mereka sendiri.
Banyak orang di bidang kecerdasan buatan memandang agen seperti asisten digital yang cukup cerdas untuk melakukan banyak tugas berbeda tanpa campur tangan manusia.
Model pengembangan diri dapat menghilangkan banyak metode yang memakan waktu dan tidak efisien yang digunakan saat ini, yang disebut “pembelajaran penguatan umpan balik manusia,” yang memerlukan umpan balik dari informan manusia yang harus memiliki keterampilan khusus untuk memberi nama data dengan benar dan memastikan bahwa informasi yang kompleks dan tertulis adalah benar. . Menjawab.
Menurut Gadgets360, salah satu peneliti, Jason Weston, mengatakan: “Kami berharap ketika kecerdasan buatan menjadi semakin manusiawi, ia akan dapat memeriksa pekerjaannya lebih baik daripada masyarakat umum. Lakukan lebih baik.
“Gagasan belajar mandiri dan mampu mengevaluasi diri sangat penting untuk gagasan mencapai standar tinggi dalam kecerdasan buatan,” ujarnya.
Perusahaan lain, termasuk Google dan Anthropic, juga telah menerbitkan penelitian tentang konsep RLAIF, atau Reinforcement Learning with Feedback for AI. Berbeda dengan Meta, perusahaan-perusahaan ini umumnya tidak mengizinkan modelnya digunakan oleh publik.
Alat AI lain yang dirilis Meta pada hari Jumat mencakup pembaruan pada model pengenalan gambar Segmen Apapun milik perusahaan, alat untuk mempercepat waktu pengembangan LLM, dan kumpulan data yang dapat digunakan untuk membantu menemukan hal-hal baru.
(dka)