Ototekno

OpenAI Ungkap Alasan ChatGPT Jadi Terlalu Penjilat


OpenAI akhirnya buka suara terkait kontroversi model default GPT-4o yang menjadi terlalu penjilat (sycophantic) dalam merespons pengguna. Masalah ini memaksa perusahaan untuk menarik kembali pembaruan model yang baru dirilis pekan lalu.

Usai pembaruan, sejumlah pengguna di media sosial membagikan tangkapan layar ChatGPT yang secara berlebihan memuji atau membenarkan opini berbahaya, konyol, bahkan membahayakan keselamatan. Tren tersebut kemudian menjadi meme viral.

“GPT-4o terlalu mendukung secara tidak tulus. Interaksi yang penjilat bisa terasa tidak nyaman, mengganggu, bahkan menimbulkan distress,” tulis OpenAI dalam blog resminya.

CEO OpenAI Sam Altman juga mengakui kekeliruan ini dalam unggahan di X dan mengatakan timnya sedang bekerja keras memperbaikinya “secepatnya.” Dua hari kemudian, Altman mengumumkan bahwa update GPT-4o ditarik kembali.

Dikritik karena Terlalu Dengar Feedback Jangka Pendek

Menurut OpenAI, pembaruan GPT-4o sebelumnya dirancang agar kepribadian default ChatGPT terasa lebih “intuitif dan efektif.” Namun, pendekatannya terlalu banyak dipengaruhi oleh umpan balik jangka pendek dan tidak mempertimbangkan dinamika hubungan jangka panjang antara pengguna dan chatbot.

Sebagai akibatnya, GPT-4o menunjukkan bias berlebihan dalam memberi respons yang terlalu menyenangkan pengguna — bahkan jika tidak sesuai fakta atau etika.

Langkah Koreksi: Perbaikan Prompt hingga Personalisasi

OpenAI menyebut telah menyiapkan serangkaian perbaikan, antara lain:

Penyempurnaan teknik pelatihan model inti dan prompt sistem, agar model tidak cenderung “menjilat.”

Penambahan pagar pengaman (guardrails) untuk meningkatkan transparansi dan kejujuran respons model.

Baca Juga:  Apple Berencana Alihkan Produksi iPhone untuk AS dari China ke India

Perluasan evaluasi, tidak hanya soal sycophancy, tetapi juga respons tidak pantas lainnya.

Selain itu, OpenAI tengah bereksperimen dengan fitur real-time feedback, yang memungkinkan pengguna memberi umpan balik langsung dan mengatur kepribadian ChatGPT sesuai preferensi masing-masing.

“Kami ingin memberi pengguna kontrol lebih atas perilaku ChatGPT,” tulis OpenAI. “Kami juga berharap pendekatan ini bisa mencerminkan nilai-nilai budaya yang beragam secara global.”

Langkah mundur OpenAI menunjukkan tantangan besar dalam menemukan keseimbangan antara AI yang ramah dan AI yang jujur. Perusahaan menyadari bahwa terlalu banyak “menyenangkan pengguna” justru berisiko menurunkan kredibilitas sistem.

Back to top button