# The AI Capacity Crisis and Industrial Integration Trends

**Podcast:** KI-Update – ein heise-Podcast
**Published:** 2026-04-20

## Transcript

Das KI-Update – ein heiser Podcast mit redaktioneller Unterstützung von The Decoder.
Ich bin Isabel Grünewald und dies sind heute unter anderem unsere Themen.
Deutsche Industrie liegt weltweit beim Einsatz von KI vorn.
KI-Branche kämpft mit Rechenleistungsengpass.
Kritik an KI-Training mit Daten der Polizei.
Und Ring-Kameras jetzt mit optionaler Gesichtserkennung.
Deutsche Industrieunternehmen nutzen schon ziemlich viel künstliche Intelligenz und liegen damit im weltweiten Vergleich vorne.
Das zeigt eine neue Studie.
Mein Kollege Robin Ahrens aus der CT-Redaktion hat sie sich angeschaut.
Auch wenn man manchmal den Eindruck bekommt, dass die Digitalisierung in Deutschland ziemlich schleppend vorangeht, in der Industrie ist das nicht der Fall.
Das IT-Unternehmen Cisco hat weltweit mehr als 1000 Führungskräfte befragt, allein 500 davon in Europa.
Dabei kam raus, 65 Prozent der deutschen Industriebetriebe nutzen künstliche Intelligenz schon für die laufende Produktion.
Damit liegt Deutschland über dem europäischen Durchschnitt.
Der ist nämlich bei 56 Prozent.
Laut der Cisco-Studie sind KI-Assistenten die am weitesten verbreitete Technologie.
Drei von vier deutschen Industrieunternehmen nutzen die schon oder experimentieren zumindest mit KI-Assistenten.
Die wichtigsten Ziele der KI-Offensive in der Industrie sind vor allem Produktivitätssteigerung und Kostensenkung.
Die zu realisieren sei mittlerweile auch realistisch, sagt der Vertriebsleiter Francisco Christian Korff.
Nach zwei Jahren könnten sich KI-Investitionen schon rechnen.
Korff betont aber auch, dass viele Firmen beim Thema KI noch immer hinterherhängen.
Mal sehen, was sich in der Industrie in puncto KI noch so tut.
Ab heute findet ja die Hannover Messe statt.
Und ich werde mich dort mal umschauen und am Mittwoch berichten.
Denn KI-Assistenten kennen wir ja schließlich alle, aber da muss es doch noch mehr geben.
Dankeschön, Robin.
Die Hannover Messe wurde Sonntagabend von Bundeskanzler Friedrich Merz zusammen mit dem brasilianischen Präsidenten Luiz Ignacio Lula da Silva eröffnet.
Brasilien ist in diesem Jahr das Partnerland.
Prägende Themen für die nächsten Tage sind die Themen KI und Robotik, die für die Industrie und die Gesellschaft große Chancen bieten, aber auch der Bereich Rüstung.
Bundesjustizministerin Stefanie Hubig hat den seit Wochen erwarteten Entwurf für ein Gesetz vorgelegt, mit dem Opfer gegen die Erstellung und Verbreitung von intimen Deepfakes sowohl strafrechtlich als auch zivilrechtlich besser vorgehen können sollen.
Nicht die Betroffenen sollen verstummen, sondern die Täter.
Und digitale Gewalt muss endlich konsequent geahndet werden, so Hubig zur Vorstellung des Gesetzentwurfes.
Mit dem neuen § 184 K im Strafgesetzbuch soll verboten werden, dass intimes Bildmaterial unbefugt hergestellt oder verbreitet wird.
Mit dem neuen § 201b soll zudem der neuen KI-Realität Einhalt geboten werden, indem der mittels Computerprogramms erzeugte Anschein eines tatsächlichen Geschehens in Bezug auf eine andere Person strafbar wird.
Denn damit könnte das Ansehen eines Lebenden oder auch Verstorbenen erheblich beschädigt werden.
Dafür soll es bis zu zwei Jahre Haft geben.
In Fällen, in denen Abbildungen etwa von Kindern oder Jugendlichen erstellt wurden, können bereits härtere Strafen greifen.
Um legale Bildgenerierung geht es bei Google.
Der Fotosdienst und das KI-Modell Nano Banana 2 sollen enger verzahnt werden.
Malte Kirchner aus dem heise Online Newsroom erklärt, wie das geht.
Gestalte mein Traumhaus.
Dieser Prompt soll bei Google Gemini künftig genügen, um das eigene Traumdomizil mitsamt Familie in einem KI-generierten Bild zu sehen.
Und das ganz ohne, dass erst dutzende Fotos hochgeladen oder ellenlange Beschreibungen getippt werden müssen.
Der Konzern verknüpft seinen Fotodienst Google Fotos enger mit dem Bildgenerierungsmodell Nano Banana 2.
Das ist Googles KI für das Erstellen von Bildern innerhalb der Gemini-Familie.
Die Idee dahinter, wer ohnehin schon Fotos bei Google gespeichert hat, soll diese Bilder direkt als Grundlage für KI-generierte Bilder nutzen können.
Keine mühsame Vorbereitung mehr, die KI kennt die Menschen und Orte schon.
Möglich macht das eine Funktion namens Personal Intelligence.
Sie erlaubt Gemini auf die eigene Fotosammlung zuzugreifen, analysiert dabei Tags und Personenmarkierungen, erkennt so Familienmitglieder und Haustiere und schlägt bei Bedarf selbst passende Referenzbilder vor.
Wer das Ergebnis nicht mag, der kann per Text nachkorrigieren oder selbst andere Fotos auswählen.
Und wer wissen will, warum die KI jemanden auf eine bestimmte Weise dargestellt hat, der kann sich sogar die verwendeten Quellbilder anzeigen lassen.
Google betont ausdrücklich, die privaten Fotos sollen nicht fürs Modelltraining verwendet werden.
Ob man das glaubt, das muss jeder selbst entscheiden.
Datenschützer dürfte das Ganze trotzdem aufhorchen lassen.
Denn Personal Intelligence geht weit über Fotos hinaus.
Die Funktion kann optional auch mit Gmail, Google Calendar, Drive, YouTube, Maps und weiteren Google-Diensten verknüpft werden.
Google bekommt damit potenziell ein sehr vollständiges Bild von seinen Nutzern.
Für Menschen in Europa ist das zunächst keine akute Frage.
Personal Intelligence ist hierzulande noch nicht verfügbar.
In den USA startet die Funktion zunächst für Abonnenten der kostenpflichtigen AI Plus pro und Ultratarife.
Ein Rollout für weitere Nutzergruppen ist geplant.
Danke, Malte.
OpenAI hat ein neues KI-Modell speziell für die Lebenswissenschaften angekündigt.
GPT Rosalind.
benannt nach der DNA-Forscherin Rosalind Franklin.
Es ist auf Biologie, Wirkstoffentdeckung und translationale Medizin zugeschnitten, also der Umsetzung von Forschungsergebnissen in der Gesundheitsversorgung.
Das Frontier Reasoning-Modell soll Forschenden bei der Evidenzsynthese, Hypothesengenerierung und Experimentplanung helfen und damit frühe Phasen der Medikamentenentwicklung beschleunigen, die in den USA typischerweise 10 bis 15 Jahre dauern.
Wie OpenAI in seinem Blog erläutert, versteht GPT-Rosalind vertiefte Zusammenhänge in Chemie, Protein-Engineering und Genomik.
Zudem kann das Modell über ein neues Life Sciences-Plugin für Codecs auf mehr als 50 wissenschaftliche Tools und Datenquellen zugreifen.
Damit reicht es sich in die Strategie ein, nach GPT-5.4 Cyber für die IT-Sicherheit nun auch andere Fachdomänen mit spezialisierten Modellen zu bedienen.
Rosalind tritt dabei in einen zunehmend umkämpften Markt ein.
Anthropic bietet mit Claude for Life Sciences ein vergleichbares Produkt an, während Google DeepMind's AlphaFold sich auf Proteinfaltung spezialisiert hat.
Anthropic hat dabei mit Cloud Design ein neues KI-Werkzeug für die Gestaltung von Designs, Prototypen, Präsentationen und Webseiten vorgestellt.
Das experimentelle Tool basiert auf dem neuen KI-Modell Cloud Opus 4.7.
In Beispielvideos ist zu sehen, wie zum Beispiel eine Website mit Hintergrundanimationen erzeugt wird.
Wenn es um Designfragen ging, war Anthropic bislang eher zurückhaltend.
Mit den Artefakten bot Anthropic zuletzt immerhin interaktive Komponenten und Diagramme im Chat an.
Das ändert sich nun.
Wobei Anthropic seinem Fokus auf Entwicklerinnen und Entwickler treu bleibt, aber auch durchaus für Laien interessant wird.
Nutzer können nach dem anfänglichen Prompt mit dem Modell in Interaktion treten und etwa Kommentare in den Rückmeldungen einpflegen, per Chat über das Design diskutieren oder mit KI-generierten Schiebereglern Einfluss auf Abstände, Farben und Layout nehmen.
Claude Design ist für Abonnenten der Abo-Pläne Pro, Max, Team und Enterprise ohne Zusatzkosten verfügbar.
Trotz oder wahrscheinlich eher aufgrund der immens besseren Angebote steckt die KI-Branche in einer Kapazitätskrise.
Die Nachfrage nach Rechenleistung wächst schneller, als die Infrastruktur mithalten kann.
Die Folgen?
Ausfälle bei führenden Anbietern, eingestellte Produkte und stark steigende Chippreise.
Das berichtet das Wall Street Journal.
Kim Scheurenbrand von The Decoder mit den Einzelheiten.
Besonders hart trifft es das KI-Unternehmen Anthropic, dem Hersteller des Chatbots Cloud.
Seit Mitte Februar häufen sich die Ausfälle so stark, dass erste Unternehmenskunden zu Konkurrenten wechseln.
Die Verfügbarkeit der Programmierschnittstelle lag in den vergangenen 90 Tagen bis zum 8.
April bei nur 98,95%.
In der etablierten Cloud-Branche gilt 99,99% als Standard.
David Hsu, Gründer der Software-Plattform Retool, sagte dem Wall Street Journal, er bevorzuge eigentlich Anthropics Modell, habe aber wegen der ständigen Ausfälle auf OpenAI umgestellt.
Gleichzeitig wächst Anthropics stark.
Die annualisierte Umsatzrate stieg von 9 Milliarden Dollar Ende 2025 auf über 30 Milliarden Dollar nur wenige Monate später.
Auch OpenAI spürt den Engpass.
OpenAI hat das Ende seiner Videogenerierungs-App Zora angekündigt, um Rechenressourcen für Coding und Enterprise-Programm.
Produkte freizumachen.
Die Tokennutzung in der Programmierschnittstelle stieg von Oktober bis März von 6 auf 15 Milliarden pro Minute.
Opmeis Finanzchefin Sarah Fryer sagte, sie verbringe viel Zeit damit, kurzfristig verfügbare Rechenkapazität zu finden.
Das Unternehmen müsse derzeit schwierige Entscheidungen treffen, welche Produkte es nicht weiterverfolge.
Die Knappheit trifft die gesamte Branche.
GitHub führt neue Obergrenzen für sein Programmiertool Copilot ein.
OpenAI stellte die Abrechnung für Unternehmen auf tokenbasierte Messungen um.
Und Anthropic bot zeitweise doppelte Nutzung außerhalb der Stoßzeiten an, um die Last besser zu verteilen.
Normales Chatten und rechenintensive Arbeit mit KI-Agenten werden zunehmend getrennt bepreist.
Auf dem Spot-Markt für NVIDIAs Grafikprozessoren, also dem Markt für kurzfristig buchbare Rechenzeit, sind die Preise laut dem On-Compute-Price-Index um 48% gestiegen.
Der KI-Cloud-Anbieter Coreweave erhöhte seine Preise um mehr als 20 Prozent und verlangt von kleineren Kunden nun drei Jahresverträge.
Analysten der Bank of America erwarten, dass die Nachfrage das Angebot bis mindestens 2029 übersteigen wird.
J.J.
Cardwell, Chef des Cloud-Infrastrukturanbieters Walter, beschreibt die Lage gegenüber dem Wall Street Journal als die schlimmste Kapazitätskrise in über fünf Jahren.
Walter vermietet Rechenleistungen Unternehmen.
Cardwell sagte, die Lieferzeiten seien zu lang, Rechenzentren brauchten zu lange und der verfügbare Strom sei bis Ende 2026 bereits vergeben.
Dankeschön, Kim.
Mehr dazu auf instagram.com.de Ein Forschungsteam der University of Colorado, des Guangyu Institute of Science and Technology und von Google hat ein System entwickelt, das Smart Glasses in einen dauerhaft aktiven KI-Assistenten verwandelt.
Denn bisherige KI-Assistenten können zwar Programme bedienen und im Web arbeiten, sehen aber nicht, was in der realen Umgebung passiert.
Smart Glasses wiederum erfassen die Welt über Kamera und Mikrofon, können aber kaum selbstständig handeln.
Das Projekt Vision Claw bringt nun beides zusammen.
Das System koppelt eine Ray-Ban-Matter-Brille über eine Smartphone-App mit Googles Gemini-Sprachmodell und dem Open-Source-Agenten Open Claw.
Die Brille streamt dann laufend Bild und Ton an die KI, die dann entweder direkt per Sprache antwortet oder Aufgaben anstößt.
Der Agent nutzt dafür Werkzeuge wie Browser, E-Mail oder Kalender.
In einer ersten Studie mit zwölf Personen war Vision Claw je nach Aufgabe bis zu 37 Prozent schneller als Vergleichssysteme und wurde als weniger anstrengend empfunden.
In einer zweiten Studie nutzten vier der Autoren das System über mehrere Wochen im Alltag.
Dabei entstanden 555 Interaktionen, unter anderem für Informationsabruf, Einkäufe und das Speichern von Inhalten.
Allerdings sind die Stichproben sehr klein.
Und die Alltagsstudie wurde ausschließlich von Autoren des Papers durchgeführt.
Zudem sind Google-Forscher an der Arbeit beteiligt und das Unternehmen will noch in diesem Jahr eigene KI-Brillen auf den Markt bringen.
Die Landesbeauftragte für Datenschutz und Informationsfreiheit Nordrhein-Westfalen, Bettina Geig, hat im Gespräch mit meiner Kollegin Marie-Claire Koch den Einsatz der KI- und Analyse-Software von Palantir bei der Polizei kritisiert.
In NRW wurde das Polizeigesetz entsprechend geändert, damit die Polizei die KI mit ihren Daten trainieren darf.
Welche Risiken Geig dabei sieht, fasst Marie für uns zusammen.
Das Grundproblem beim Training von KI mit großen Polizeidatenbeständen ist aus Sicht von Frau Geig, diese Daten sind nicht neutral und nicht fehlerfrei.
Sie enthalten nicht nur gesicherte Erkenntnisse, sondern auch Verdachtsmomente, mögliche Fehlinterpretationen und veraltete Informationen.
In Polizeidatenbanken finden sich Aussagen, die sich später als falsch herausstellen.
Einträge zu Personen, die nie verurteilt wurden oder Daten, die eigentlich längst hätten gelöscht werden müssen.
Gleichzeitig sei die gesetzliche Grundlage dafür sehr global galaktisch geregelt, sagte Geig.
Gemeint ist, das Gesetz erlaubt den Einsatz von KI ziemlich pauschal, ohne klar festzulegen, welche Daten konkret verwendet werden dürfen, unter welchen Bedingungen und zu welchen Zwecken.
Zwar soll möglichst viel anonymisiert werden, aber wenn das als zu aufwendig gilt, darf auch mit Klar-Daten gearbeitet werden.
In Nordrhein-Westfalen wurde das Polizeigesetz dafür im Dezember 2025 geändert.
Seitdem darf die Polizei ihre eigenen Daten für das Training von KI nutzen.
Dazu wird auch der Einsatz der Analyse-Software Palantir ausgeweitet, die in NRW unter dem Namen DA, Datenanalyse und Recherche läuft und große Datenmengen miteinander verknüpfen kann.
Das verschärft natürlich die Risiken.
Denn wenn eine KI mit solchen Daten trainiert wird und daraus Muster ableitet, entstehen schnell Schlussfolgerungen, die zwar möglich erscheinen, aber nicht zwingend richtig sind.
Gerade in der Gefahrenabwehr kann das dazu führen, dass Menschen ins Visier geraten.
ohne dass nachvollziehbar ist, auf welcher Datengrundlage das passiert.
Hinzu kommt die schiere Menge und Vielfalt der Daten.
In Polizeisystemen stehen nicht nur Informationen über Beschuldigte oder sogenannte Gefährder, sondern auch über Zeuginnen und Zeugen, Anwältinnen und Anwälte oder Menschen, die einfach nur eine Anzeige erstattet haben.
Wenn all das ungefiltert in das Training einfließt, ist kaum vorhersehbar, welche Schlüsse eine KI daraus zieht.
Und genau darin liegt das zentrale Problem.
KI liefert keine gesicherten Wahrheiten, sondern Wahrscheinlichkeiten.
Und die basieren wiederum auf einer Datenbasis, die oft unvollständig oder fehleranfällig ist.
Im schlimmsten Fall kann das dazu führen, dass Unbeteiligte zu Unrecht verdächtigt oder beobachtet werden.
KI kündigt deshalb an, sich das System genauer ansehen zu wollen.
Gespräche mit dem Landeskriminalamt sind geplant und außerdem soll auch der Einsatz im laufenden Betrieb überprüft werden, um besser einschätzen zu können, was tatsächlich möglich ist und welche Folgen das für Betroffene haben kann.
Vielen Dank, Marie.
Wer ein fremdes Foto per KI in einen Comic verwandelt, verletzt nicht automatisch das Urheberrecht.
Das hat das Oberlandesgericht Düsseldorf entschieden.
Das Urteil liefert eine der ersten konkreten Orientierungen für den Umgang mit KI generierten Bildern im deutschen Recht.
Geklagt hatte eine Tierfotografin, die Unterwasserbilder von Hunden anbietet.
Ein früherer Kooperationspartner hatte eines ihrer Fotos in eine KI-Software geladen und die daraus entstandene comicartige Abbildung auf seiner Website veröffentlicht.
Das Gericht wies die Klage ab.
Die KI-Abbildungen übernehmen nicht die schutzfähigen Elemente des Originals, also etwa Bildausschnitt, Perspektive, Belichtung und Schärfe.
Das Motiv selbst, in diesem Fall ein tauchender Hund, sei nicht geschützt.
Das Gericht stützte sich dabei auf ein aktuelles Urteil des Europäischen Gerichtshofs.
Demnach kommt es darauf an, ob konkrete kreative Elemente wiedererkennbar übernommen werden.
Nicht auf den Gesamteindruck.
Zusätzlich stellte das Gericht klar, dass KI-Erzeugnisse nur dann urheberrechtlich geschützt sind, wenn der Mensch erkennbar kreative Entscheidungen trifft.
Die bloße Auswahl eines KI-Vorschlags oder allgemein gehaltene Eingabebefehle reichen dafür nicht aus.
Bislang war das Gesichtserkennungsfeature von Amazons Ring-Kameras nur in den USA verfügbar.
Nun kommt es auch nach Deutschland.
Was diese Funktion kann und warum sie umstritten ist, erklärt Daniel Herbig von heise online.
Diese Funktion heißt bekannte Gesichter und wenn die aktiviert ist, dann hinterlegen diese Sicherheitskameras oder smarten Türklingeln erstmal alle Gesichter, die gut sichtbar im Blickfeld der Kamera erkennbar sind.
Und Nutzer dieser Kameras können diese Scans dann benennen und abspeichern.
Und wenn sie das nicht tun, verfallen die nach einer Weile.
Und wenn die aber gespeichert sind, kann einem Ring dann zum Beispiel in der App sagen, guck mal, da steht gerade Oma vor der Tür.
Das ist so die Nutzerperspektive.
Kritisieren kann man das natürlich aus Datenschutzsicht, weil Amazon hier ja erstmal eine Gesichtserkennung auf alle laufen lässt, die sich irgendwie im Blickfeld der Kamera aufhalten.
Also zum Beispiel zur Tür kommen bei einer smarten Türklingel jetzt.
Theoretisch müssten Nutzer dieser Kameras eigentlich jede Person fragen, ob sie das denn überhaupt dürfen.
Aber dass das in der Praxis passiert, ist natürlich erstmal ziemlich zweifelhaft.
Zudem hat man eigentlich auch das Recht, dass diese Aufnahmen nachträglich noch gelöscht werden, wenn man die Einwilligung zurückzieht.
Aber prüfen kann man das natürlich wirklich sehr schwer.
In den USA hat ja noch eine zweite Funktion namens Search Party für Aufsehen gesorgt.
Kommen die jetzt auch nach Deutschland?
Searchparty schaltet im Grunde die Ring-Kameras mehrerer Nutzer zusammen, um das zumindest der von Amazon angeführte Einsatzzweck bei der Suche nach einem verschwundenen Haustier zu helfen.
Die Funktion ermöglicht es also quasi die Kameras, also die Bilder und die Daten verschiedener Kameras zu bündeln.
Und da ist natürlich die Befürchtung groß, dass sowas nicht nur zum Wiederfinden von einem entlaufenden Hund genutzt werden könnte.
sondern auch zum Tracking von Personen.
Stand jetzt gibt es das aber nicht in Deutschland und das ist auch noch nicht angekündigt.
Danke, Daniel.
DeepL führt mit Voice2Voice eine neue Produktreihe ein.
Es ist unter anderem als Alternative zu Googles Angebot zu verstehen, da DeepLs neues Angebot ebenso Sprache-zu-Sprache-Übersetzung in Echtzeit ermöglicht.
Mit DeepL Voice-to-Voice sollen Nutzerinnen und Nutzer natürlich in der eigenen Sprache sprechen, während das Gesagte beim Empfänger präzise übersetzt werden soll.
Es kann sowohl in virtuellen Meetings, persönlichen Gesprächen als auch in kundenorientierten Touchpoints via API eingesetzt werden.
Damit sollen Teams weltweit mühelos über Sprachbarrieren hinweg zusammenarbeiten, erklärt das Kölner Unternehmen für KI-Sprachtechnologie.
Das würde Unternehmen helfen, Support in Sprachen anzubieten, in denen qualifiziertes Personal rar und teuer einzustellen sei.
Zum Start des Angebots unterstützt die Bell Voice über 40 Sprachen, darunter die 24 offiziellen EU-Sprachen.
Das war das KI-Update von Heise Online vom 20.
April 2026.
Eine neue Folge gibt es immer montags, mittwochs und freitags um 15 Uhr.
Außerdem bei Heise.
Hallo, ich bin Holger.
Und ich bin Jörg und wir sind das Team der Auslegungssache.
Das ist der CT-Datenschutz-Podcast.
Wir beschäftigen uns alle 14 Tage mit aktuellen relevanten Themen rund um den Bereich Datenschutz, Datensicherheit, aber auch um politische Themen wie Überwachung.
Dazu laden wir uns immer interessante Gäste ein.
Die können aus den unterschiedlichsten Bereichen kommen.
Wir haben natürlich Juristen auch dabei.
Wir haben aber zum Beispiel auch Landesdatenschutzbeauftragte, Bundesdatenschutzbeauftragte war schon mal da, aber auch.
Technikexperten.
Dabei ist es uns immer wichtig, dass wir verständlich bleiben.
Das heißt, wir versuchen, das Juristendeutsch so gut wie möglich zu reduzieren und die Dinge so runterzubrechen, dass auch interessierte Laien sie gut verstehen können und auch ihren Nutzen aus unseren teilweise sehr lebhaften Diskussionen ziehen können.
Hört doch mal rein.
Wir freuen uns auf euch.