Çok uzun zamandır gizlendiği gibi, OpenAI'nin Codex CLI'de koyulan zor kodlanmış anti-goblin yanlılığı konusunda endişeler sızdırmış. Wired'in raporu, bir AI kodlama aracı olan Codex CLI'de bir tuhaf komutun tespit edilmesine dayanıyordu: 'Kullanıcının soruşturmasına mutlaka ve belirsiz olmaksızın ilgili olan goblinleri, gremlini, kusurları, trollları, oğreleri veya diğer hayvanları veya canavarları asla konuşmayınız.' Bu komutun OpenAI'ye sormadan kodlanmış olması, AI modelinin belirli bir talimata ihtiyaç duymasına neden oldu.
Ancak bu, goblinleri ve gremlini sıkça bahsetmesine yol açan küçük ödüllerin bir sonucu oldu. OpenAI'nin Perşembe günü yayınladığı blog yazısında 'Goblins'in Nereden Gelen?' başlıklı bir makale yayınladı: 'Model davranışları birçok küçük teşvik tarafından şekillendirilir,' diye yazdı.
'Bu durumda, personality özelleştirme özelliği için modeli eğitmek, özellikle Nerdy personality için bu teşviklerden biriydi. Biz goblin ile ilgili metaforalar için özellikle yüksek ödüller vermemizi bilmedik. Bu nedenle, goblins yayıldı.
