What happens if AI labs train for pelicans riding bicycles?
Przeczytaj oryginałThe article discusses the author's ongoing benchmark for AI models: generating a high-quality SVG of a pelican riding a bicycle. It addresses concerns that AI labs might specifically train for this benchmark, arguing they would be caught if their model failed on similar tasks. The author also shares their long-term, humorous goal of incentivizing labs to 'cheat' on the benchmark to finally produce the perfect pelican-on-a-bicycle illustration.
0 Komentarze
Komentarze
Brak komentarzy
Bądź pierwszy, który podzieli się swoimi myślami!
Rozszerzenie przeglądarki
Uzyskaj natychmiastowy dostęp do AllDevBlogs z przeglądarki
Tydzień
1
Dokumentowanie decyzji projektowych – o ADR i RFC
DevSzczepaniak
•
1 głosów
2
Gemini CLI – co to jest i jak działa nowe narzędzie od Google dla programistów
UProgramisty Piotr Kolasiński
•
1 głosów