Raphael Suchomel: Der wertvollste Chip der Welt

Ohne ihn gäbe es kein ChatGPT, kein Claude, kein Mistral. Eine einzige Grafikkarte des Herstellers Nvidia, ein Stück Silizium kleiner als ein Bierdeckel, kostet heute zwischen fünfundzwanzig- und siebzigtausend Dollar. Die wirklich spannende Frage ist nicht, warum sie so teuer ist. Sondern warum die ganze KI-Welt ausgerechnet von diesem Chip abhängt.

Redaktion / meinung•25. Juni 2026, 18:11 Uhr

exxpress auf Google als bevorzugte Nachrichtenquelle festlegen

Um zu verstehen, was eine KI im Innersten tut, müssen wir kurz unter die Motorhaube schauen. Eine moderne Künstliche Intelligenz wie ChatGPT ist im Kern ein sogenanntes neuronales Netzwerk. Das klingt geheimnisvoll, ist aber nüchtern betrachtet schlicht ein riesiger mathematischer Apparat. Stellen Sie sich Schichten von Knotenpunkten vor, die wie Nervenzellen in einem Gehirn verbunden sind. Jeder Knotenpunkt, in der Fachsprache Neuron genannt, bekommt von der vorherigen Schicht eine Reihe von Zahlen, multipliziert jede mit einer eigenen kleinen Zahl, dem sogenannten Gewicht, addiert das Ergebnis und gibt es an die nächste Schicht weiter. Banal an sich. Aber wenn Sie das mit Milliarden, in den größten Modellen sogar Billionen solcher Verbindungen tun, entsteht etwas, das Texte schreiben, Bilder malen und Krankheiten erkennen kann.

Diese Gewichte sind übrigens das, was eine KI im sogenannten Training lernt. Sie bekommt riesige Datenmengen vorgesetzt, das halbe Internet sozusagen, und justiert die Milliarden Gewichte so lange nach, bis sie ihre Aufgabe möglichst gut beherrscht. Bei einem Sprachmodell wie ChatGPT ist diese Aufgabe das Vorhersagen des jeweils wahrscheinlichsten nächsten Wortes. Damit haben Sie schon den Schlüssel zur ganzen Geschichte in der Hand. Eine KI ist im Innersten keine geheimnisvolle Magie. Sie ist eine gigantische Multiplikationsaufgabe.

Warum der Computerchip in Ihrem Laptop dabei kapituliert

Der klassische Computerchip in dem Gerät, auf dem Sie diesen Artikel lesen, heißt im Fachjargon Central Processing Unit, kurz CPU, auf Deutsch Hauptprozessor. Stellen Sie sich diesen Hauptprozessor wie einen genialen Universitätsprofessor vor. Er kann jede noch so komplizierte Aufgabe lösen, durchdenkt sie sorgfältig, geht Schritt für Schritt vor. Sein Schwachpunkt ist nur, dass er immer nur eine Sache auf einmal tun kann. Wenn Sie ihm hundert kleine Rechnungen geben, rechnet er sie eine nach der anderen. Ein typischer Laptop-Prozessor hat heute acht oder sechzehn solcher Profi-Rechenkerne.

Wenn Sie aber Milliarden voneinander unabhängige Multiplikationen brauchen, ist der Professor das falsche Werkzeug. Sie wollen keine Eleganz, Sie wollen Masse. Genau hier kommt die Grafikkarte ins Spiel. Im Fachjargon heißt sie Graphics Processing Unit oder GPU. Stellen Sie sich statt des einen Professors eine ganze Schulklasse mit tausend Schülern vor. Keiner dieser Schüler ist so klug wie der Professor. Aber alle tausend rechnen gleichzeitig. Wenn Sie der Klasse die hundert kleinen Rechnungen geben, bekommen Sie sie quasi sofort zurück. Die aktuelle Spitzenkarte H100 von Nvidia hat fast siebzehntausend solcher Rechenkerne auf einer einzigen Karte. Tausend Schüler gegen einen Professor.

Diese Architektur hatte ursprünglich einen ganz anderen Zweck. Sie wurde entwickelt, um Computerspiele schöner zu machen. Ein Bildschirm besteht aus Millionen einzelner Bildpunkte, sogenannten Pixeln. Bei einem Computerspiel muss jeder dieser Pixel sechzig Mal pro Sekunde neu berechnet werden. Die Farbe des einzelnen Pixels lässt sich aber unabhängig von der seines Nachbarn berechnen. Es sind also Millionen kleiner, voneinander unabhängiger Rechnungen, alle gleichzeitig. Genau dafür wurden Grafikkarten erfunden. Niemand dachte damals an Künstliche Intelligenz.

Der Moment, in dem die Welt sich drehte

Im Jahr 2012 passierte dann etwas, das die moderne KI aus der Taufe hob. Drei Forscher der Universität Toronto, der Doktorand Alex Krizhevsky, sein Kollege Ilya Sutskever und ihr Professor Geoffrey Hinton, nahmen zwei ganz gewöhnliche Gaming-Grafikkarten des Modells GeForce GTX 580, also Hardware, mit der Teenager weltweit Computerspiele spielten. Auf diesen zwei Karten trainierten sie in Krizhevskys Schlafzimmer im Haus seiner Eltern ein neuronales Netz mit dem schlichten Namen AlexNet. Mit diesem System gingen sie zum jährlichen Bilderkennungs-Wettbewerb ImageNet, bei dem Programme um die Wette Hunde, Katzen und tausende andere Bildkategorien erkennen sollten. Bis dahin lag der Stand der Technik bei rund sechsundzwanzig Prozent Fehlerquote. AlexNet kam auf fünfzehn Komma drei. Ein historischer Erdrutsch. Sutskever wurde später Mitgründer von OpenAI. Hinton bekam 2024 den Nobelpreis für Physik.

Der Grund, warum es funktionierte, ist nüchtern und schön zugleich. Die Mathematik eines neuronalen Netzes hat exakt dieselbe Form wie die Mathematik der Pixelberechnung. Beides ist im Innersten eine sogenannte Matrixmultiplikation, also das Multiplizieren großer Zahlenfelder miteinander. Voneinander unabhängige Rechnungen in riesiger Menge. Genau das, wofür Grafikkarten gebaut worden waren. Eine vielzitierte Schätzung besagt, dass das Training eines Modells wie ChatGPT auf einem einzigen klassischen Hauptprozessor rund hundertfünfundsechzig Jahre dauern würde. Auf tausenden parallel arbeitenden Grafikkarten dauert es Wochen. Niemand hatte das geplant. Es war einer der größten glücklichen Zufälle der Technikgeschichte. Eine Maschine, gebaut für Computerspiele, war zufällig das ideale Werkzeug für die wichtigste Technologie unseres Jahrhunderts.

Trainieren und Anwenden, zwei sehr verschiedene Phasen

Eine KI lebt in zwei sehr unterschiedlichen Phasen. Die erste Phase heißt Training und ist das, worüber wir gerade gesprochen haben. Hier lernt das Modell aus riesigen Datenmengen, indem es seine Milliarden Gewichte immer wieder fein nachjustiert. Das passiert einmal pro Modellversion, oft über Wochen oder Monate, auf zehntausenden Grafikkarten parallel. Das Training des Modells Llama 3 von Meta mit vierhundertfünf Milliarden Gewichten lief offiziell auf sechzehntausend H100-Karten. Das KI-Unternehmen xAI von Elon Musk hat in Memphis ein Rechenzentrum mit zweihunderttausend solcher Karten errichtet und will langfristig auf eine Million skalieren.

Die zweite Phase heißt Inferenz, manchmal auch einfach Anwendung. Das ist das, was passiert, wenn Sie ChatGPT eine Frage stellen. Das Modell ist fertig trainiert, seine Gewichte stehen fest, und es muss nur noch Wort für Wort eine Antwort generieren. Pro einzelner Frage ist das deutlich weniger Rechenaufwand als das Training. Wenn allerdings hunderte Millionen Menschen weltweit gleichzeitig fragen, läppert sich das. Schätzungen zufolge laufen allein für die laufende Nutzung von ChatGPT mehrere hunderttausend Grafikkarten gleichzeitig. Auch das ist Grund, warum die Nachfrage nach diesen Chips kein Ende nimmt.

Warum es immer nur ein Hersteller ist

An dieser Stelle muss man eine zweite, ebenso entscheidende Komponente in die Geschichte einführen. Die Software. Nvidia veröffentlichte bereits 2007, also fünf Jahre vor AlexNet, eine Programmierumgebung mit dem Namen CUDA. Vereinfacht gesagt ist CUDA eine Sammlung von Werkzeugen, mit denen Programmierer die tausenden Rechenkerne einer Grafikkarte für beliebige mathematische Aufgaben nutzen können. Damals war das eine technische Spielerei für Spezialisten. Heute ist es der vielleicht stärkste Burggraben, den ein Tech-Konzern weltweit besitzt. Beinahe die gesamte KI-Forschung der Welt arbeitet auf CUDA. Junge Forscher lernen es im Studium, ich selbst arbeite täglich damit. Selbst wenn ein Konkurrent eine technisch ebenbürtige Karte baute, müsste die gesamte Welt erst ihre Software umschreiben. Genau deshalb hat Nvidia heute über achtzig Prozent Marktanteil bei den sogenannten KI-Beschleunigern, also den spezialisierten Chips für künstliche Intelligenz, und über neunzig Prozent beim Training neuer Modelle.

Hinzu kommt eine zweite Eigenheit moderner KI-Chips, die man kennen sollte. Ab der Generation Volta, die Nvidia 2017 eingeführt hat, enthalten die Karten zusätzlich zu den allgemeinen Rechenkernen sogenannte Tensorkerne. Das sind hochspezialisierte Schaltungen, die exakt einen Job machen, nämlich Matrixmultiplikationen besonders schnell. Eine moderne H100 hat fünfhundertachtundzwanzig solcher Tensorkerne neben den siebzehntausend allgemeinen Rechenkernen. Sie sind das, was eine KI-Grafikkarte heute noch zusätzlich von einer reinen Gaming-Grafikkarte unterscheidet. Aus dem glücklichen Zufall von 2012 ist ein durchdesigntes Werkzeug geworden.

Was Sie als Verbraucher davon merken

Sie werden sich vielleicht fragen, was das alles mit Ihrem Alltag zu tun hat. Sehr viel. Wenn Sie in den letzten Monaten einen neuen Computer oder Laptop kaufen wollten, ist Ihnen vielleicht aufgefallen, dass die Preise spürbar gestiegen sind. Das hat einen direkten Grund. Eine moderne KI-Grafikkarte braucht nicht nur Rechenkerne, sondern auch riesige Mengen besonders schnellen Spezialspeichers, den sogenannten HBM. HBM steht für High Bandwidth Memory, also Hochgeschwindigkeitsspeicher, und sitzt direkt neben dem Chip. Die drei großen Hersteller dieser Speicher, die südkoreanischen Konzerne Samsung und SK Hynix sowie der amerikanische Konzern Micron, haben angesichts der KI-Nachfrage über neunzig Prozent ihrer Produktionskapazität auf diesen Spezialspeicher umgestellt. Für den gewöhnlichen Arbeitsspeicher, der in Ihrem Laptop steckt, bleibt entsprechend wenig übrig. Die Preise für normalen Arbeitsspeicher sind im Jahr 2025 um rund hundertsiebzig Prozent gestiegen. Wer einen Laptop ersetzt, bezahlt mit für den KI-Boom.

Auch die Strompreise spüren es. Eine einzelne Spitzenkarte verbraucht heute zwischen siebenhundert und zweitausendsiebenhundert Watt, das ist mehr als jeder Heizlüfter in Ihrem Keller. Hunderttausend solcher Karten nebeneinander, wofür sich derzeit alle großen Tech-Konzerne der Welt einen Wettlauf liefern, verbrauchen so viel Strom wie eine Großstadt. Microsoft hat im September 2024 mit dem amerikanischen Energieversorger Constellation einen aufsehenerregenden Vertrag abgeschlossen. Das stillgelegte Atomkraftwerk Three Mile Island in Pennsylvania, jenes Kraftwerk, in dem 1979 der schwerste Unfall der US-Atomgeschichte stattfand, wird wieder hochgefahren. Sein einziger Kunde ab 2028 wird Microsoft sein, sein einziger Zweck der Betrieb von KI-Rechenzentren. Die Internationale Energieagentur schätzt, dass Rechenzentren bis 2030 weltweit knapp dreimal so viel Strom verbrauchen werden wie heute. Drei Prozent des gesamten globalen Stromverbrauchs werden dann in Servern für künstliche Intelligenz verbrennen.

Wo Österreich in dieser Geschichte vorkommt

Es wäre ein Fehler zu glauben, all das spiele sich nur in Kalifornien, Texas und Taiwan ab. Im steirischen Leoben hat das Unternehmen AT&S im Juni 2025 das erste und bislang einzige Werk Europas für sogenannte IC-Substrate eröffnet, jene millimeterdünnen Trägerplatten, auf denen die Hochleistungschips von Nvidia und seinen Wettbewerbern montiert werden. Ohne diese Substrate, sagt AT&S-Chef Michael Mertin, gäbe es keine KI, keinen Quantencomputer, keine moderne Halbleiterindustrie. Auch der Konzern Infineon betreibt in Villach in Kärnten eine seiner modernsten Chip-Fabriken. Und in Linz arbeitet der österreichische KI-Pionier Sepp Hochreiter mit seinem Unternehmen NXAI an einer alternativen KI-Architektur namens xLSTM, die deutlich weniger Strom verbrauchen soll als die heutigen großen Sprachmodelle. Das wäre die elegante Antwort auf das Problem. Eine KI, die nicht jedes Jahr zehnmal so viele Grafikkarten verlangt wie im Vorjahr.

Was bleibt

Wenn Sie das nächste Mal ChatGPT eine Frage stellen, dann läuft hinter dem freundlichen Eingabefeld nichts Magisches ab. Es läuft eine Matrixmultiplikation, die tausende dieser Chips in einem klimatisierten Rechenzentrum in Texas oder Virginia synchron erledigen. Eine Schulklasse von Schülern, gespeist mit Strom aus einem wieder hochgefahrenen Atomkraftwerk, koordiniert von einer Software namens CUDA, montiert auf einer Trägerplatte aus Leoben, gefüttert mit Spezialspeicher aus Südkorea, der zugleich der Grund ist, warum Ihr nächster Laptop teurer wird.

Der schöne Zufall dieser Geschichte ist, dass die ganze Maschinerie auf einer Idee aufbaut, die ein zweiundzwanzigjähriger Doktorand 2012 in seinem Schlafzimmer in Toronto bewiesen hat. Tausend kleine Rechnungen gleichzeitig schlagen einen genialen Professor, der eine nach der anderen löst. Manchmal ist die Welt einfacher, als sie aussieht. Wer das einmal verstanden hat, kann den Schlagzeilen über Billionen Dollar Marktwert, Atomkraftverträge und Chipexport-Verboten mit größerer Ruhe begegnen. Hinter all dem Lärm steht eine sehr alte und sehr menschliche Wahrheit. Wer das richtige Werkzeug für die richtige Aufgabe hat, gewinnt.

Raphael Suchomel: Der wertvollste Chip der Welt

Raphael Suchomel: Der wertvollste Chip der Welt

Warum der Computerchip in Ihrem Laptop dabei kapituliert

Der Moment, in dem die Welt sich drehte

Trainieren und Anwenden, zwei sehr verschiedene Phasen

Warum es immer nur ein Hersteller ist

Was Sie als Verbraucher davon merken

Wo Österreich in dieser Geschichte vorkommt

Was bleibt

Nochmals zusammengefasst:

Die wichtigsten Fakten:

Meistgelesen

Kommentare

Bleib auf dem Laufenden!

Unterstütze unabhängigen Journalismus

Weitere Artikel

Raphael Suchomel: Der wertvollste Chip der Welt

Warum der Computerchip in Ihrem Laptop dabei kapituliert

Der Moment, in dem die Welt sich drehte

Trainieren und Anwenden, zwei sehr verschiedene Phasen

Warum es immer nur ein Hersteller ist

Was Sie als Verbraucher davon merken

Wo Österreich in dieser Geschichte vorkommt

Was bleibt

Nochmals zusammengefasst:

Die wichtigsten Fakten:

Meistgelesen

Kommentare

Bleib auf dem Laufenden!

Unterstütze unabhängigen Journalismus

Weitere Artikel