Byte will berühmt werden, maximiert jede Bestenliste und geht über Nacht viral – Millionen Follower. Dann schickt die Hand die erste richtig harte Frage herunter. Glitch ahnt, wie das endet.
Die hochformatige Fassung für TikTok, Reels & Shorts.
In einem der dichtesten Modell-Monate überhaupt behauptet praktisch jedes neue KI-Modell, „State of the Art" – also Nummer 1 – zu sein. Das Problem: Klassische Tests wie MMLU sind oberhalb von rund 88 % praktisch ausgereizt, der Abstand zwischen Platz 1 und Platz 4 ist statistisches Rauschen geworden.
Der Witz mit Substanz: Wenn alle bei 99 % kleben, misst die Bestenliste nichts mehr – „Nummer 1" wird inflationär. Als Antwort wendet sich das Feld härteren Prüfungen zu (etwa „Humanity's Last Exam" mit rund 2.500 Experten-Fragen), bei denen die besten Modelle nur ~35 % schaffen, während menschliche Fachleute ~90 % erreichen. Reichweite ist eben nicht Substanz.
Alle Firmen und Personen im Comic sind fiktive Parodien.