On: Exclusive: How GPT-5 Actually Works

In dieser Bonusfolge von "Better Offline" analysiert Ed Zitron exklusiv, warum OpenAIs neuer "Router-basierter" ChatGPT-5-Ansatz die Token-Kosten pro Anfrage verdoppeln könnte, während die Leistung nur marginal besser wird. Er deckt auf, dass das neue System durch die Entscheidungsfindung eines separaten LLM-Routers vor jeder Anfrage die Caching-Optimierung verhindert und stattdessen redundanten Rechenaufwand erzeugt. Die Episode enthüllt auch, wie Influencer:innen wie Theo Brown möglicherweise mit einer optimierten Demo-Version des Modells beeinflusst wurden, die sich erheblich von der öffentlich verfügbaren Version unterscheidet.

GPT-5 könnte doppelt so viele Token pro Anfrage verbrennen

"Chat GPT5 is in fact potentially more expensive to run than previous models [...] can at times burn upwards of double the tokens per query."

Der Router verhindert effizientes Caching

"Every single thing you say or do can cause it to do something different [...] Each time requiring a completely fresh static prompt."

Influencer:innen wurden möglicherweise mit optimierten Demo-Versionen getäuscht

"I believe Open AI showed Theo Brown and others in their offices some sort of heavily modified version of the model that burned significantly more compute to provide its outputs."

Die Architektur erzeuge massive Infrastruktur-Overhead

"Open AI has created a product with latency issues and an overwhelmingly convoluted routing system that's already straining capacity."

Die wirtschaftlichen Verluste seien nicht nachvollziehbar

"Samman intends to lose more than $44 billion by the end of 2028 on Open AI [...] Can anyone actually articulate a reason why we need to burn billions of dollars to do this?"

GPT-5 sei eine "Engineering-Nightmare"

"Chat GPT5 is an engineering nightmare, a phenomenally silly and desperate attempt to choose what remains of the dying innovation and excitement within the walls of Open AI."

Einordnung

Ed Zitron liefert hier eine scharfsinnige technische Analyse, die sich durch klare Argumentationsstrukturen und konkrete Belege auszeichnet. Die Episode demonstriert beeindruckend, wie komplexe technische Konzepte für ein breites Publikum verständlich gemacht werden können - allerdings ohne alternative Perspektiven einzubeziehen. Die Kritik an OpenAI bleibt zwar fundiert, verliert aber gelegentlich an sachlicher Distanz und neigt zu polemischer Überzeichnung. Besonders bemerkenswert ist die gründliche Recherche und die Fähigkeit, technische Details mit wirtschaftlichen Implikationen zu verbinden. Die gesellschaftliche Relevanz liegt in der demystifizierenden Funktion gegenüber einer oft unkritisch gefeierten Branche.

Hörempfehlung: Diese Folge lohnt sich für alle, die eine kritische, technisch fundierte Auseinandersetzung mit der aktuellen KI-Entwicklung suchen - auch wenn die Darstellung gelegentlich einseitig wirkt.