Pazar günü Wired'in raporu, Codex CLI buzdolabı kodlama aracı içindeki garip bir komut hakkında detaylar verdi: 'Kullanıcının sorusuna mutlaka ve belirsiz olmaksızın ilgili olan goblin, gremlim, karaçam, troll, ogre, kuş veya diğer hayvan ya da canlı örneğini hiç konuşmayınız.' Bu, Dollar Tree'dan atılmadan kalmak için her zaman kendime fısıldadığım bir şey. Ancak, bu tür bir AI modeline belirli bir şekilde bunu söylemesini zorlamak oldukça tuhaf bir durum.
Raporda bahsedilen bir X gönderisi, goblin ve gremlim referanslarının sıkça geçtiğini ve güncelleme sonucunda hala kullanıldığını not etti. OpenAI'nin bu konuda sessizliği bozarak Perşembe günü 'Goblins'in Nereden Olduğunu' başlıklı bir blog gönderisi yayınladı: 'Model davranışları birçok küçük teşvik tarafından şekillendirilir,' diye yazdı. 'Bu durumda, bu teşviklerden biri kişilik özelleştirme özelliği için modelin eğitimi sırasında, özellikle Nerdy kişiliğine ait olanlar oldu.
Biz goblin ile ilgili metaforalar için özellikle yüksek ödül vermemizi bilmedik. Bu yüzden, goblins yayıldı.
