News AI 27/26: Seedance 2.5 // GPT 5.6 // GLM 5.2 // Cursor iOS App // US vs. China // Gemini Computer Use Artwork

programmier.bar – der Podcast für App- und Webentwicklung

Die programmier.bar lädt regelmäßig spannende Gäste aus der Welt der App- und Webentwicklung zum Gespräch ein. Es geht um neue Technologien, unsere liebsten Tools und unsere Erfahrungen aus dem Entwickler-Alltag mit all seinen Problemen und Lösungswegen.

Euer Input ist uns wichtig! Schreibt uns eure Themenwünsche und Feedback per Mail an podcast@programmier.bar oder auf Discord (https://discord.gg/SvkGpjxSMe), LinkedIn (@programmier.bar), Bluesky (@programmier.bar), Instagram (@programmier.bar) oder Mastodon (@podcast@programmier.bar).

Wir sind Full-Stack-Spieleentwickler bekannter Apps wie 4 Bilder 1 Wort, Quiz Planet und Word Blitz. https://www.programmier.bar/impressum

All Episodes

programmier.bar – der Podcast für App- und Webentwicklung

News AI 27/26: Seedance 2.5 // GPT 5.6 // GLM 5.2 // Cursor iOS App // US vs. China // Gemini Computer Use

July 02, 2026 • programmier.bar • Season 7 • Episode 53

0:00 | 42:33

Wie hat dir die Folge gefallen?
Gut 👍
Schlecht 👎
(Keine Anmeldung erforderlich)

Philipp meldet sich in dieser Folge direkt von der AI Engineering World Fair in San Francisco und bringt spannende Einblicke in die neueste Entwicklung von Cursor mit. Die beliebte IDE ist nun als iOS-App verfügbar und erlaubt es euch, mithilfe von Remote Agents und virtuellen Maschinen auch von unterwegs an euren Projekten zu arbeiten. Dabei setzt das Team auf eine nahtlose Integration von Cloud-Umgebungen, die sich trotz mobiler Plattform fast wie lokales Coding anfühlt.

Im Bereich der Videogenerierung sorgt ByteDance mit Seedance 2.5 für Aufsehen. Das Modell generiert nun bis zu 30 Sekunden lange Clips in 4K-Auflösung und 10 Bit Farbtiefe. Besonders beeindruckend ist die Möglichkeit, bis zu 50 Referenzbilder einzuspeisen, um die Konsistenz einer Storyline präzise zu steuern. Während die Technik rasant fortschreitet, formiert sich in Hollywood Widerstand in Form von Klagen großer Studios wie Disney und Universal, während andere bereits strategische Partnerschaften mit KI-Unternehmen eingehen.

Die GPT 5.6-Reihe mit den Modellvarianten Sol, Terra und Luna wurde offiziell vorgestellt. Doch wer gehofft hat, die volle Power des Sol-Modells sofort nutzen zu können, wird enttäuscht. Aufgrund strenger Sicherheitsauflagen der US-Regierung bleibt der Zugang vorerst auf einen kleinen Kreis ausgewählter US-Unternehmen beschränkt. Diese Entwicklung markiert einen Wendepunkt, da staatliche Behörden nun aktiv in die Release-Zyklen der großen KI-Labore eingreifen und internationale Veröffentlichungen vorerst blockieren.

Gleichzeitig verschärft sich der Ton zwischen den USA und China. Anthropic wirft Alibaba vor, sogenannte Distillation Attacks in massivem Ausmaß durchgeführt zu haben. Dabei wurden Millionen von Anfragen genutzt, um die Fähigkeiten der neuesten Modelle „abzuzapfen” und für das Training eigener, chinesischer Modelle zu verwenden. Dies führt zu einer hitzigen Debatte darüber, wie sich KI-Anbieter vor dem Diebstahl ihres geistigen Eigentums schützen können und welche Rolle die Politik bei der Verteidigung technologischer Vorsprünge spielen muss.

Dass aus China extrem leistungsfähige Modelle kommen, beweist auch Z.ai mit GLM 5.2. Dieses Open-Weights-Modell unter MIT-Lizenz überzeugt in ersten Benchmarks besonders im Coding-Bereich und spielt qualitativ in einer Liga mit den großen kommerziellen Modellen von Anthropic und OpenAI. Da es über Provider wie OpenRouter extrem kostengünstig verfügbar ist, stellt es eine spannende und preiswerte Alternative für eure automatisierten Entwicklungs-Workflows dar.

Google schläft ebenfalls nicht und spendiert Gemini das Computer Use Tool in einer neuen Version. Damit ist die KI in der Lage, Browser, Desktop-Umgebungen oder sogar mobile Betriebssysteme wie Android und iOS eigenständig zu steuern.

Zuletzt gibt es Neuigkeiten aus der Hardware-Ecke: OpenAI arbeitet gemeinsam mit Broadcom an „Jalapeno”, einem spezialisierten Chip für effizientere Inference, um die steigenden Rechenanforderungen und Token-Kosten langfristig in den Griff zu bekommen.

Schreibt uns!
Schickt uns eure Themenwünsche und euer Feedback: podcast@programmier.bar

Folgt uns!
Bleibt auf dem Laufenden über zukünftige Folgen und virtuelle Meetups und beteiligt euch an Community-Diskussionen.

Bluesky
Instagram
LinkedIn
Meetup
YouTube

SPEAKER_02 0:08

Hallo und herzlich willkommen zu einer neuen AI News in der Kalenderwoche 27. Jahr 2026. Wir sprechen heute über eine neue Cursor App, die es für mobile Plattformen gibt. Modellupdates aus der Open AI Welt mit der 5.6 Reihe Sedance 2.5 und GLM 5.2. Außerdem haben wir noch was über Gemini Computer Use dabei. Und wie sich Anthropic wehrt gegen Angriffe, da nennen wir sie erstmal in der Zusammenfassung, aus China. Ich bin Dennis und freue mich heute zugeschaltet zu haben. Einmal den Fabi Fink. Hallo und den. Philipp, hallo. Schön, dass ihr da seid. Alles fit bei euch.

SPEAKER_01 0:55

Philipp hat eine lange Leitung, weil er in San Francisco ist und ich muss mich anstrengen, nicht zu husten. Also mal gucken, wie viel ich es schaffe zu reden, ohne zu husten. Du musst jetzt ein kühles Eis gegessen, von daher, bei dir soll es jetzt laufen, oder?

SPEAKER_02 1:07

Bei mir sollte es laufen. Ja, es tut mir ein bisschen leid, dass die Aufnahme zwei Minuten später starten musste, weil ich noch ein Eis im Mund hatte. Ich glaube, die Hörer merken es nicht. Ich hatte sie direkt gestartet an der Genervenstimme von Philipp vielleicht.

SPEAKER_00 1:24

Willst du, wo bist du gerade, Philipp? In San Francisco. Und zwar auf der AI Engineering World's Fair.

SPEAKER_02 1:32

Später. AI Engineering Worldsfair. Fair hat direkt so ein bisschen was Abtürnenes bei mir. Worldsfair? Ja, weil Fair hört sich so nach Messe an. Das ist so ein bisschen, ich erwarte dann irgendwie bei, weiß ich nicht, wie bei der Buchmeister.

SPEAKER_00 1:45

Der Gedanke von Swix am Anfang war mit dem großen, also über Siafferteil gibt es ja mehrere AI-Engineering-Konferenzen. Da war auch jetzt eine in London und in Singapur, hoffentlich bald woanders auch noch. Und der Gedanke mit der World's Fair ist so ein bisschen aus der Expo kommend aus den frühen 1900ern, wenn ich es richtig verstanden habe. Also mit dem Ziel, wirklich alle, die halt irgendwie in der KI-Bubble unterwegs sind, an einer Konferenz zusammenzubekommen und dann halt also die verschiedenen kleinen.

SPEAKER_01 2:17

Aber gibt es da wirklich so Tracks mit Speakern und so? Also schon ein Konferenztrack gibt es schon.

SPEAKER_00 2:22

Ja, es gibt, glaube ich, sechs Tracks oder sowas, über 6000 Leute, ist also die größte. Und du hast halt wirklich, also es ist sehr familiär, würde ich immer noch sagen, wenn man sich halt doch irgendwie dann wieder kennt, aber du hast wirklich, wir hatten gestern Abend Speaker-Dinner mit halt Anthropic, OpenAI, Google-Leuten, dann von den ganzen Startups aus San Francisco von halt Langchain über alles Mögliche. Es ist sehr cool. Also wenn man irgendwann mal die Möglichkeit hat, definitiv mal auf eine der Konferenzen gehen.

SPEAKER_02 2:51

Glaubst du, dass sie sich in San Francisco nochmal stark unterscheidet, weil die es nicht so weit haben?

SPEAKER_00 2:55

Ja, also der Gedanke dahinter ist immer San Francisco so alles irgendwie, wenn es geht. Und dann hast du halt mehr fokussiert, zum Beispiel im April, die in London, da war halt sehr viel europäische Präsenz oder mehr europäische Präsenz für die Besucher bzw. auch die Speaker. Und jetzt hast du doch sehr viel Silicon Valley, sag ich mal.

SPEAKER_02 3:16

Okay. Sehr gut. Cursor kommt, woher? Das weiß ich gar nicht. Was ist Cursor? Aus San Francisco und so.

SPEAKER_00 3:26

Okay, was haben die denn Neues gemacht? Die haben, ich glaube, die hatten ja, wir haben ja über die Composer, Cursor Composer geredet, das war eine derenjährliche Konferenz. Und da haben sie schon angekündigt, es gibt eine neue iOS-App und es gibt jetzt die iOS-App auch zum Downloaden. Das heißt, man kann sie runterladen. Ich habe es getestet auf meinem Weg vom Uber, im Uber vom Flughafen zu meinem Hotel. Ich habe es runtergeladen, habe mich eingeloggt, meinen ersten Coding-Agent gestartet, hat sehr gut funktioniert. Basiert auf demselben Backend, sag ich mal, wie deren Cloud Agents. Das heißt, wenn man schon irgendwie die Cloud Agents benutzt hat, man kann sein Repository da auswählen von GitHub, eine Session starten, bekommt dann halt so ein Remote Agent, der Dinge tut. Genau, das ist einfach beschrieben, sag ich mal.

SPEAKER_02 4:14

Vielleicht, was ich gestern hier in der Diskussion war, könnt ihr da kurz einsteigen, bei diesen Remote-Environments, die ja letztendlich alle die Cloud Agents brauchen, um da irgendwie Projekte laufen zu lassen. Gibt es da irgendwelche Dienste, die mehr Konfiguration erlauben? Oder beziehungsweise wie viel kann man da im Moment konfigurieren? Ist das immer ein festes Setup, was da hochgefahren wird? Oder gibt es irgendwie auch die Möglichkeit halt zu sagen, keine Ahnung, ich brauche Node irgendwas? Oder Node ist ja vielleicht auch nicht für jeden, irgendwie das war jemand, den man entwickelt. Wie viele Einflussmöglichkeiten hat man da aktuell?

SPEAKER_00 4:45

Ich glaube, du hast halt auf der rechten Seite konfigurierbar als fahr, als du möchtest irgendwie. Und links halt Magic Black Box. Und es ist ja ein kompletter Markt an sich eigentlich mittlerweile die Sandbox. Also du hast Startups wie E2B, Modal, Daytona, die halt Raw Sandbox-Compute anbieten. Das heißt, du hast vordefinierte, sag ich mal, Container, kannst deinen eigenen Container mitbringen oder Packages installieren und kannst dann in diesen halt irgendwie Cloud-Code ausführen oder auch die neue Cursor-SDK oder halt welchen Coding-Agent, sag ich mal, auch immer du magst. Das heißt, du hast eine Voll die Controlle. Da kannst du auch dann das nutzen für deine eigenen Agents, wenn die halt irgendwelches ausführen sollen. Und auf der anderen Seite hast du halt, sag ich mal, solche Remote-Agents wie Cursor direkt. Und bei Cursor ist es so, zumindest bei dem, was ich getestet habe, dass es immer das hat, was es möchte, beziehungsweise der Agent das dann installiert. Also die machen irgendein, ich schaue ins Repository, ob da ein Package.json ist und dann bereite ich Node oder Python. Also die haben auf jeden Fall sehr viel Default installiert. Vor allem der große Unterschied zu Cursor oder zu vielen anderen ist, dass du eine komplette VM bekommst mit Display. Das heißt, du hast nicht irgendwie so nur so ein Coding-Ding, sage ich mal, sondern ein ganz großes Feature von denen ist ja immer, wenn du irgendwelche Sachen auf dem Remote-Agent machst, dass du sagen kannst, hey, bitte teste das. Und dann bekommst du als Antwort nicht nur irgendwie, ich habe es gemacht, sondern du kriegst auch ein Video, wo du siehst, wie das aussieht und wie der Agent das getestet hat. Devin macht das, glaube ich, auch mittlerweile. Genau, also das ist schon mehr. Und das ist auch das, was Cursor selber gesagt hat, was den größten Unterschied ausmacht, du musst dieses Remote Environment so hinbekommen, dass es sich nach dem Lokalen anfühlt, weil der größte Unterschied ist ja, du weißt, was du lokal hast. Das heißt, du promptest anders, als was du irgendwie remote hast. Und wenn du Remote dann irgendwie genau so prompten möchtest, weil du halt hin und her switchtst mittlerweile, dann ist es halt extrem schwierig, wenn der Agent erstmal struggelt, weil kein Node installiert ist und dann erstmal vier Runden verschwenden muss, dass du ein Node installiert.

SPEAKER_02 6:52

Und der Vorteil von diesen anderen Startups, die du genannt hast, ist, dass es so ein bisschen One-Click-mäßig kommt, weil sonst könnte man sich wahrscheinlich auch irgendwo selbst einfach. Also läuft die Inference dann praktisch in dem gleichen Container oder ist es einfach nur erstmal nur die Cloud-UG, die wahrscheinlich nicht, ne? Das ist ja, nee, kann ja gar nichts.

SPEAKER_00 7:08

Es gibt ja wieder zwei Modelle. Du hast einmal Agent in Sandbox und einmal Agent, der die Sandbox called. Also du kannst zum Beispiel, wenn du, keine Ahnung, brauchst du ganz einfach gesagt, einen MCP-Server, der hat ein Tool, das nennt sich Bash, dann kannst du ja dein Agent-Loop außerhalb irgendwo laufen lassen. Und wenn der dann dieses Bash-Tool ausführt, dann machst du diesen Call in die Sandbox rein. Oder du startest dein Agent in der Sandbox und führst alles lokal aus, wie du auch auf deinem PC machst. Und es ist nicht einfach. Also es gibt einen Grund, warum diese Startup existieren, vor allem, wenn man in den Bereich von Scaling geht. Weil bei Agents im Verhältnis zu, wo man früher Kubernetes benutzt hat, ist halt alles jetzt IO-Bound-Driven. Also für Disk-Rides und sonst was. Und, keine Ahnung, NPX, Create, React-Dap hat irgendwie 10.000 File-Reads und Writes. Und halt ein normaler Container, den du auf Kubernetes laufen lässt, der deine Webseite hostet, der hat halt nicht dieses File-Bound-I.O. Und es ist auch wichtig, wie du halt startest und wie du den State wiederherstellst und sonst was. Deswegen gibt es schon einen Grund, warum da so viele Startups existieren, beziehungsweise warum alle jetzt da irgendwie einen Service anbieten. Amazon hat es auch letzte Woche für Firecracker, beziehungsweise für Amazon ABS Lambda so ein Micro-VM Firecracker-Zeug vorgestellt, dass du das halt auch selber machen kannst.

SPEAKER_02 8:25

Okay. Ja, das muss ich mir mal ein bisschen angucken, habe ich das Gefühl. Um dann noch ein bisschen flexibler zu sein. Okay. Dann lasst uns doch mal ein bisschen Abwechslung reinbringen und erstmal wieder in die Videogenerierung gehen, wenn ich C-Dance 2.5 richtig verorte im Videospace.

SPEAKER_01 8:48

Das hast du richtig verortet. C-Dance 2.5, das neue Modell von Byteance, vorwärmen wir bei C-Dance 2.0. Und ich glaube, die drei Dinge, die super krass herausstechen, warum es jetzt hier so eine Welle gemacht hat, ist, dass das Modell ist, was jetzt 30 Sekunden Video mit einem Prompt generieren kann. Also einfach erstmal Output-Länge ist, hat sich direkt von dem davor standen, also dem maximalen sozusagen verdreifacht. Oder ich glaube, C-Dance war 2.0 war vorher auch schon das Modell, das am längsten Videos generieren konnte mit 12 Sekunden. Jetzt sind sie bei 30 Sekunden. Dazu ist das Ganze auch in 4K mit 10-Bit-Farbtiefe, also wirklich Top-Qualität, direkt als Output und auch noch super beeindruckend, dass 50 Referenzeingaben, also 50 Bilder, die du mit reingeben kannst neben dem Text als Referenz für das Video geben kannst, was natürlich super, super beeindruckend ist. Also wenn man sich mal die Videos anguckt, die mit dem Modell generiert wurden, ist schon so, dass man jetzt sagen kann, es geht jetzt wirklich so in, also ich meine, was kannst du in 30 Sekunden schon an Storyline machen, ne? Und wie krass du eine konsistente Story erzählen kannst mit 50 Referenzbildern, du kannst es super gut guiden und stealen und es ist natürlich jetzt super interessant, dass es hier wieder ein Modell ist, was jetzt aus China kommt, vielleicht auch später wieder etwas, wo wir uns nochmal unterhalten werden, China versus USA. Aber Byte Dance, also sozusagen der Mutterkonzern ja hinter TikTok, hat da auf jeden Fall wieder das Next-Level-Videomodell rausgebracht und glaube ich schon, dass es jetzt nochmal sehr viel mehr Einfluss haben wird, dann auch in Videogenerierung, möglicherweise auch in Filmproduktion so. Ich meine, parallel sieht man auch, dass jetzt Hollywood mit mehr Klagen losweg. Also Disney Universal und Warner Brothers haben jetzt chinesische Minimax verklagt. Und beispielsweise jetzt auch Google hat vor kurzem Announced eine Zusammenarbeit mit A24, dem Studio unter anderem hinter so Filmen wie Ex Machina, die jetzt zusammenarbeiten wollen, also 75 Millionen Dollar Partnership, um sozusagen KI-Filmwerkzeuge zu entwickeln. Also ich glaube, da wird sich jetzt schon mal eine ganze Ecke irgendwie mehr drehen. Ich glaube auch, wenn wir jetzt echt sowas haben wie 30 Sekunden mit einem Prompt und 50 Bildern, wird es jetzt auch noch weiter in, glaube ich, auch in dem Alltag außerhalb unserer Techbubble irgendwie Einzug erhalten. Also ich glaube, es ist schon jetzt mittlerweile, war es jetzt schon die ganze Zeit. Ich glaube, es hat ja schon mit CD in 2.0 und auch schon davor mit Weo irgendwie einen Sprung gemacht, wo es, glaube ich, jetzt schon wirklich in die Workflows von Video-Menschen Einzug erhalten hat. Und ich glaube, jetzt mit den 30 Sekunden auf der Qualität und 50 Referenzbildern werden es einfach nur nochmal mehr sehen und ist auf jeden Fall super, super beeindruckend, was da jetzt mittlerweile rauskommt. Also mal gespannt, bei welcher Länge wir irgendwie mit Sedance 3, 4, 5, also wann sind wir wohl bei, keine Ahnung, tausende von Bildern rein und Filmlänge raus sind.

SPEAKER_02 11:34

Abgefahren. Ja, ist interessant. Ich habe gestern zufällig auf TikTok auch ein, also AI-generät das Video, was bei mir in meinem Feed noch relativ überschaubar ist, muss ich sagen, von dem, was ich so sehe, aber das war so Deutschland gegen Paraguay in so einem bisschen dystopischen Setting, also so als Krieger angezogen und sowas, völlig wild, aber wo du sagtest, also halt, ne, auch mit den Spielern und so, oder, was eine Qualität so, ne? Du erkennst jeden, wer das sein soll und es hat eine Storyline, es gibt verschiedene Kameras, es gibt Effekte und sowas. Also abgefahren überhaupt auch, also ne, die Energie muss ja trotzdem jemand reinstecken, das dann nochmal so zu prompen und zu schneiden und keine Ahnung was, ähm, ja. Ja, ich meine, da gibt es ja auch so zwei. Sekunden, Sekunden hintereinander.

SPEAKER_01 12:18

Ja, ich meine, das war ja vorher auch, also genau, sowas zu prompten war ja schon auch durchaus schwierig, obwohl ja teilweise die Flows waren ja eher, dass man irgendwelche irgendwelche Image-Modelle dann genutzt hat, ja, irgendwie von Nano Banana Pro oder sowas wird häufig genutzt, wo eher so eine Art Story-Scene sozusagen als Bildern gebaut wurde, diese Bilder dann aufgeteilt wurden, sodass die Bilder in sich konsistent waren, daraus dann mehrere Clips erzeugt wurden. Und ich meine, dieser Workflow muss auch jetzt immer noch irgendwie gemacht werden, damit halt die Konsistenz über mehrere drei Sekunden-Clips hinweg passiert. Aber wenn du jetzt einfach schon in einem Prompt irgendwie in drei Sekunden, wie gesagt, was du da ein Storyline irgendwie haben kannst und gerade auch mit den Soundeffekten, ich glaube, als einen, das war glaube ich ein CDU 2.0-Video-Beispiel, aber so auch ASMR-mäßig, da gab es, glaube ich, ein Video, wo es hieß, alter Mann, der Sand ist. Und wenn man da mal irgendwie Kopfhörer aufsitzt, ist einfach ein alter Mann vor so einem Teller von Sand und dann knirscht es so zwischen den 10 in 4K-Auflösungen und so. Das ist schon auch soundmäßig auf jeden Fall alles next level. Und ich glaube so, wir werden halt immer weniger von diesen, ich sag mal, zusammengebastelten Kreativflows brauchen, so, sondern es wird einfach viel näher daran kommen, so was in deinem Kopf ist, kannst du mal schnell als Output generieren. Also schon sehr interessant, wann es auch in Hollywood möglicherweise dann jetzt umschlägt von wir verklagen hinzu, es wird jetzt einfach das ernstzunehmende Tool. Und es wird viel mehr in Filmen auch irgendwie Einzugehalten. Also drei Sekunden ist auf jeden Fall eine Ansage.

SPEAKER_00 13:43

Ob dir das wird dann eher besser oder schlechter mit Filmen?

SPEAKER_01 13:51

Gute Frage. Mehr werden es werden. Und keine Ahnung, am Ende zählt ja trotzdem so die Kreativität. Ich meine, warum, die Frage ist, warum sollte es schlechter werden? Also ich meine, am Ende ist es so, die guten Filme werden sich durchsetzen. Es wird halt mehr sein, du wirst krasser geflottet werden, du weißt es halt nicht mehr, aber warum sollte nicht trotzdem Qualität siegen? Am Ende gucken sich das die Leute an, was. Also die Frage ist ja auch, was ist besser, ne? Es werden sich, entweder werden sich viel mehr Nischen ergeben und es gibt nicht mehr so den Mainstream und dann kommt der eine Film raus und alle gucken sich den an, sondern es wird sich viel mehr aufzweigen, abzweigen so, die einen gucken das, die anderen das und es gibt viel mehr Subgenres so, spitzt splitzt sich einfach viel weiter auf und es gibt nicht mehr so die einen Filme, die jeder kennt und die großen Stars, die großen Filme. Aber ob das jetzt schlechter oder besser ist, ich würde trotzdem sagen, ich meine, die Leute müssen trotzdem dann ihre Freizeit da reinschicken, sich diese Filme anzugucken, also irgendeine Qualität muss zu liefern.

SPEAKER_00 14:42

Aber also ich meine, bei Netflix existiert ja aktuell schon das, ich weiß nicht, das wird es nicht Problem nennen, aber halt die Strategie, dass Netflix ja sehr stark darauf schaut, was die Leute anschauen. Und das hat ja schon den Content verändert in eine gewisse Richtung. Und bei Netflix seht ihr jetzt mehr, auch wenn, sag ich mal, kreativ, gestalterisch, qualitativ, die eine Staffel sehr gut funktioniert, aber die Menschen das halt einfach nicht schauen, weil es, keine Ahnung, kein Brainrod ist oder kein Love Island oder sowas, dann produzieren die das ja einfach nicht mehr.

SPEAKER_01 15:20

Wie zumindest sagen, Love Island ist schlecht. Also, das ist jetzt eine Definition von schlecht oder was? Dann haben wir da so unterschiedliche Meinungen.

SPEAKER_00 15:27

Ja, und ich glaube halt, dass das zu viel mehr ähnlichen Dingen führt. Also im Szene von, du hast so eine Art, das siehst, was funktioniert, und dann wird das eher nur mehr abgeändert. Also die gleiche, dann gibt es halt nicht, ich meine, es gibt ja schon sehr viele solche solche Formate, aber ich weiß noch nicht, ob das positiv ist für Filme und Serien auf lange Sicht, was den Content angeht, den wir uns anschauen werden.

SPEAKER_02 15:56

Wobei ich den Aspekt denke, dass der wahrscheinlich auch schon passiert ist. Ich meine, Hollywood hat ja sich auch nicht hingesetzt und hat gesagt, so, was finden wir denn jetzt gerade mal schön und was denken wir, wo wir Spaß dran hätten, sondern natürlich auch, was kann erfolgreich sein und was sind die Plots und Dinge, die wir brauchen, um einen monetär erfolgreichen Film zu machen.

SPEAKER_01 16:15

Aber natürlich ist aber auch ein Tool, was halt dann wiederum die Kreativität in mehr Hände verteilt. Ich meine, auf jeden Fall ist es ein gutes Beispiel. Netflix wäre dann eher ein Indiz dafür, dass es möglicherweise gleichgeschaltet wird und viel mehr KPI getrieben wird. Klar, wenn du es als Plattform und so monetär denkst, würde ich das auch sagen, aber andererseits ist es so, dass du halt jetzt den Leuten dazu die Tools in die Hand gibst, viel kreativer zu sein und irgendwie einfach mehr zu erzeugen, die vielleicht in erster Linie auch erstmal nur was Cool Kreatives erzeugen wollen. Ich meine, vergleich es ein bisschen mit irgendwie Musikindustrie, wo du vorher die großen Labels hattest so und irgendwie, dass du mal überhaupt eine Platte aufnehmen konntest, war ja super gegatet durch die paar Großen, die halt entschieden haben, was funktioniert und was funktioniert nicht so. Und heutzutage kann halt jeder in seinem Home Studio irgendwie selbst aufnehmen und irgendwie eigenen Kram rausbringen, was auf jeden Fall dem auch nicht geschadet hat. Und deswegen, ich glaube, es sind so ein bisschen vielleicht zwei gegensätzliche Bestrebungen. Ist die Frage, es kann sein, dass das, was von den großen Studios kommt und sowas gleichgeschalteter wird und dafür die Masse mehr wird. Und dann aber wiederum die Frage ist, wird es das Medium Kino dann überhaupt noch geben? Weil ich meine, wenn du so schnell und irgendwie testen willst und so, dann ist halt auch Kino nicht mehr die richtige Stage dafür so. Aber klar, wenn irgendwie alle Streaming-Anbieter werden und auch noch schneller generieren können, kann es schon sein, dass es auch gleichgeschalteter wird. Aber ich glaube, es gibt auch schon genug Raum für Kreativität. Also ich mache mir darum eigentlich nicht so viel Sorgen.

SPEAKER_02 17:37

Okay. Machen wir weiter mit OpenAI und der nächsten Generation an Modellen, die da sind. Und da können wir ein bisschen anknüpfen an die letzten AI-News. Denn nachdem Anthropic ja mit Fable und Mythis zwei neue Modelle rausgebracht haben, die der US-Regierung dann auf einmal doch zu stark waren und sie dachten, nee, da möchten wir nur, dass das US-BürgerInnen konsumieren und nutzen können, haben sie ja verboten, oder also ich glaube, sie haben ja gar nicht gesagt, dass es überall geblockt werden muss, aber Anthropic hat gesagt, wir sind nicht in der Lage, diese rechtlichen Bedingungen zu erfüllen, deswegen nehmen wir es komplett offline. Und da das Anthropic schon durchgespielt hat, konnte OpenAI praktisch vorher mit der US-Regierung reden und sich schon verbieten lassen, die neuen Modelle auszurollen. Und trotzdem haben sie sie in einem Blogartikel vorgestellt. Also es gibt die GPT 5.6-Reihe und dort gibt es drei Modellvarianten, die sich Zoll Terra und Luna nennen. Und 100%, muss ich ehrlich sagen, habe ich das Naming immer noch nicht verstanden, weil sie sagen so, ab jetzt ist es so, dass die Modellnummer irgendwie die, also die Modellgeneration beschreibt und dann diese drei unterschiedlichen Tiers von Solterra und Luna sind praktisch so die Capabilities, die dann da drin sind und sagen dann, dass sich aber jede für sich weiterentwickeln kann. Und dieses, jede für sich weiterentwickeln, das ist irgendwie was, was ich nicht verstanden habe. Also wenn das jetzt irgendwie einfach die Abstufung ist zwischen, okay, es gibt, weiß ich nicht, vielleicht, wohl Opus und Sonne waren wahrscheinlich zwei unterschiedlich trainierte Modelle und jetzt hast du irgendwie ein Modell und davon kommen diese Abspaltungen. Kann einer von euch was anfangen mit? Ich irgendwann nicht mit Soltera und Duna, wie sie es genau aufteilen. Okay, also zumindest, ja. Anyway, es gibt drei unterschiedliche Modelle und Sol ist das Größe vor allem dem Ganzen und ich meine, mehr außer auf Benchmarks hören kann man immer noch nicht, weil sie eben nicht öffentlich sind. Wobei auf Terminal Bench GBT 5.6 Soll im Ultramodus 91,9% erreicht, wo ein Claude Mythes 5 beispielsweise auf 88 und ein Claude Fable 5 auf 84% sind. Also nochmal ein Sprung in dem Genetic Engineering-Bereich, den wir dort haben. Genau, und sie sind grundsätzlich, äußern sie sehr harsche oder sehr direkte Kritik und sagen, das darf nicht der Standardweg zukünftig sein, dass die US-Regierung bestimmt, wann solche Modelle irgendwie die Öffentlichkeit erreichen. Aber am Ende bleibt unter Strich, dass es aktuell erstmal nur für, ich glaube, roundabout 100 US-Unternehmen freigeschaltet wurde, die ein Preview praktisch jetzt darauf haben und dass die breite Öffentlichkeit und vor allen Dingen der internationale Markt aktuell noch warten muss, um dieses sehr mächtige Modell zu bekommen.

SPEAKER_01 21:00

Das ist auf jeden Fall eine Entwicklung, die man jetzt schon bei Entropic gesehen hat. Und da bin ich mal gespannt, wie es da irgendwie weitergeht. In dem Zuge finde ich auch noch interessant, wenn ihr das Thema irgendwie dranhängen willst, weil ich finde, das gehört auch so ein bisschen zu Diskussionen mit Enthropic und China und dem vermeintlichen Cloud da. Vielleicht kannst du da nochmal kurz dazu erzählen, weil irgendwie gehört mich auch in dieses Podpourri von globaler AI-Entwicklung und irgendwie den Entwicklungen, die es da mit auch so solchen Dingen passieren.

SPEAKER_02 21:26

Und Regierungen haben irgendwas mit dazu beschrieben. Das stimmt, weil denn Anthropic hat nämlich offiziell Alibaba beschuldigt und dort sich an US-Behörden gewandt und gesagt, hey, das darf nicht so sein. Und zwar haben sie festgestellt, dass Alibaba in sehr, sehr großem Stil mit Accounts, die nicht auf ordnungsgemäßen Weg erstellt wurden. Viele, viele Millionen, insgesamt, glaube ich, fast knapp 30 Millionen Anfragen. auf die neuesten Modelle von Anthropic gemacht hat, um, und das nennt sich eben irgendwie Distillation Attack, um praktisch aus einem großen Modell die Fähigkeiten rauszuziehen, um ein kleineres Modell zu trainieren. Mir war das vorher gar nicht so ein Begriff, dass es so ein Ding ist. Ich denke mal irgendwie, Philipp, du hast es irgendwie vorher auch schon mal gehört, weil es glaube ich nicht das erste Mal war, dass man sich untereinander beschuldigt hat, dass da Daten abgezogen wurden.

SPEAKER_01 22:34

War doch bei Deep Seek war das doch schon genau das gleiche Thema, oder? Weißt du, die Frage, ob es über die Slayer hat.

SPEAKER_00 22:39

Ich hätte das sogar in den News. Da war vor ein paar Monaten, der, wo Anthropic diesen Blogpost gemacht hat, doch ein Unternehmen direkt gecalled out hat, sag ich mal, mit Minimax und allen anderen auch.

SPEAKER_02 22:51

Also Moonshot, Deep Seek und Minimax war damals, ja.

SPEAKER_01 22:56

Ja, genau. Also auch noch, also im Endeffekt ist es ja, ne, sie nehmen halt Input und Output sozusagen als neues Trainingsset, ne? Ihr speichern ihre Anfrage, speichert den Output und bauen sich dadurch irgendwie ein Training-Set zusammen. So kompliziert ist ja die Distillation-Attack-Schema ja gar nicht so ganz zusammen. Da hat 30 Millionen Datensätze. Ja, das ist richtig.

SPEAKER_02 23:17

Aber interessant auch irgendwie, dass es funktioniert, oder? Also, so in meinem.

SPEAKER_00 23:22

Also, es ist kein neues Konzept, das gab es schon vor LLMs, sag ich mal, hat sich ein bisschen angepasst. Man sagt aber auch, dass andere, sag ich mal, sich jetzt von chinesischen Modellen inspirieren lassen. Und man macht das ja auch ganz oft mit seinen eigenen Modellen. Also ich gehe stark davon aus, dass, ich weiß nicht, die nächste Generation von Sonette und Haiku und vielleicht den kleineren GPT-Modellen von den größeren GPT-Modellen profitieren. Also dass du dieses Destillation halt intern machst.

SPEAKER_01 23:52

Und ich weiß, könnte man ja auch drüber diskutieren, ist das sogar wirklich überhaupt etwas, was schlecht ist, so, ne? Also warum sollte man das nicht dürfen? Ich meine, im Grunde genommen trainieren sie ihre Modelle auf offen verfügbaren Daten da draußen, die auch irgendwie jemand erzeugt hat. Im Grunde genommen sind es jetzt auch nur ein anderes Datenset. Sie sind halt mit ihrem L ⁇ M genauso eine Datenquelle wie alle anderen Daten im Netz auch. Also es ist nicht die rechtliche Brille draufgelegt sozusagen, aber eigentlich, wenn ich jetzt erstmal nur meine Brille der Interpretation draufsetzen würde, würde ich mich fragen, ja, ich kann verstehen, dass sie es kacke finden, weil natürlich super viel Geld da im Spiel ist, aber andererseits ist ja das auch genau der Weg, wie Sie Ihre Modelle führt dann. Also, warum soll ich nicht ein besseres LLM auch als Quelle nehmen können und das als Trainingsdaten für meinen LLM benutzen können?

SPEAKER_00 24:36

Ich glaube, da ist schon nochmal ein Unterschied zwischen, ich nehme Code von, keine Ahnung, vom Internet und mache Pre-Training darauf oder ich habe schon ein Modell, was Instruction Following hat, extrem guten Mathe ist und lasse das irgendwelche Reasoning Traces und Zeug generieren und trainiere dann darauf. Aber ja, ist ein schwieriges Thema.

SPEAKER_02 24:56

Aber ja. Ja, da muss jetzt, ne, da muss er dann unterscheiden, wie die initialen Quellen irgendwie entstanden sind. Also ob das praktisch kommerzielle Arbeit war, die da reingesteckt wurde und dann veröffentlicht wurde. Das ist ja vielleicht so ein bisschen der Unterschied. Dass es kommerzielle Arbeit war, das Modell zu erzeugen, oder was meinst du? Ja. Im Gegensatz zu halt, wenn es irgendwie Public Repositories draußen sind und Open Source-Modelle.

SPEAKER_00 25:25

Ja, aber ich glaube, ich meine, da gibt es ja auch wieder Streit Themen, was dann aus dem Web wirklich dann, also ich meine.

SPEAKER_01 25:32

Genau, also haben sie sich wirklich beim Trainieren auch genau daran gehalten, darüber gab es ja viel Diskussion auch darüber. Ja, absolut. Aber ich glaube, im Endeffekt ist es ja so, ich meine, rechtlich ist wiederum, kann man sie eh. Also, das eine ist moralische, das andere ist rechtlich. Und ich meine, es ist oder so die Frage, was hat Entropic von der Hand habe, dass chinesische Modellhersteller das Ganze tun, so außer dass sie es technisch unterbinden, probieren sie unterbinden? Rechtlich werden sie wahrscheinlich nicht so weit kommen. Das ist richtig. Das heißt, sie müssen sich eben nicht mehr.

SPEAKER_02 26:00

Das ist ja irgendwie ein bisschen ironisch, dass sie auf der einen Seite die Peitsche der US-Regierung spüren und dann aber jetzt auf der anderen Seite betteln, um Unterstützung, dass die Regierung da mal mithelfen soll, dass die Chinesen das nicht abgrasen.

SPEAKER_00 26:15

Glaubt ihr, dass das, also ist ja ein sehr populäres Thema? Glaubt ihr, dass das zusammenhängt mit, dass Dario ganz viel immer gesagt hat, hey, das Modell ist zu gefährlich, hey, wir können das nicht releasen. Und dann irgendeiner wirklich mal gesagt hat bei der Regierung, ey, wenn er das die ganze Zeit sagt, vielleicht sollten wir da wirklich mal hinschauen oder uns mal wirklich Gedanken machen. Und dann halt unabsichtlich sozusagen das jetzt erzeugt hat.

SPEAKER_01 26:43

Also sagen wir es mal so, hätte er das Ganze, also hätte er es nicht so gemacht, würde ich auch tippen, wäre es wahrscheinlich nicht so gelaufen, so ja. Das können wir schon auch vorher.

SPEAKER_02 26:53

Ja, also es ist furchtbar, wenn es so wäre, ne? Ich gehe da irgendwie auch mit, aber es ist ja trotzdem irgendwo traurig. Wenn eine US-Regierung, die ja irgendwo auch eine Abwägung hat, was hat das für einen Einfluss, was sind die Capabilities und sowas, die müssen ja irgendwie sich da Gedanken drüber machen.

SPEAKER_01 27:11

Achso, meinst du es, die sich dann auch so, dass sie nicht selbst aufgefallen wäre.

SPEAKER_02 27:14

Ja, ja, genau, das ist halt nicht irgendwo, wenn das Model Release wird, die dann denken, oh, guck mal, das sollten wir uns angucken, sondern dass einer vorher sagen muss, oh, das ist Achtung, das ist jetzt gefährlich. Oder dann auch überreagieren, wenn es nur die Ansage war. Also ja.

SPEAKER_01 27:28

Sagen wir mal so, mich würde es wundern, wenn es ab jetzt nicht so oder so dann immer gemacht wird bei jedem Modell-Release, dass sich das genauer angeschaut wird und abgebogen wird. Ich glaube, jetzt ist einmal der Damm gebrochen, von daher wird es jetzt in Zukunft mehr Thema werden, kannst du aktive Diskussionen sein.

SPEAKER_00 27:40

Ich glaube, das kannst du nicht machen. Also das wird logistisch nicht funktionieren und ich glaube, das möchte die US-Regierung auch nicht, weil ich weiß nicht, Fable war vor zwei Wochen jetzt dann bald, ne? Das heißt, wenn du zwischen jedem Model-Release vier bis sechs Wochen hast, um irgendwelche Genehmigungen zu holen und aktuell gibt es da zwei Modelle, die da irgendwie in Frage kommen. Was ist, wenn die nächsten Gemini-Modelle, die nächsten Modelle von XAI, die nächsten Modelle von Cursor da halt mit dazukommen, dann hast du halt irgendwie, also dann verlangsamst du das ganze Thema halt extrem. Und ich glaube auch nicht, dass die US-Regierung möchte, dass chinesische Open Source-Modelle dann nicht verlangsamt werden und weitermachen. Also irgendwo hast du auch dann einen gewissen Marktdruck, weil der, ich weiß nicht, wenn jetzt Fable oder Mythos irgendwie, keine Ahnung, drei Milliarden zum Trainieren gekostet hat und die das nicht nutzen können, um neue Daten zu sammeln, um ihre Modelle zu verbessern, um seinen Kunden zu verkaufen, das wirst du nicht, das kannst du nicht halten.

SPEAKER_01 28:44

Ja, also aus der Brille verstehe ich auf jeden Fall deine Argumentation komplett, aber andererseits, wenn du die andere Brille aufsetzt, so wenn jetzt erstmal einmal die Regierung irgendwie so na dran ist, dass sie schon angefangen haben, so einen Modell-Release zu verbieten, kann ich mir auch nicht vorstellen, dass sie jetzt dann wieder so stark zurückkommt, dass sie sagen, macht wieder einfach, was ihr wollt, wir halten es wieder komplett zurück. Also ich glaube, dass am Ende jetzt, es gibt einen neuen Akteur in diesem Spiel. Und jetzt ist nur die Frage, wie limitierend ist er oder wie genau bindet er sich ein. Aber ich denke schon, dass in diesem Release-Prozess jetzt Regierung als ein Stake, als ein stärkerer Stakeholder, als er eh schon war, irgendwie mit drin ist und irgendwie da mitreden wird. Aber ich geb dir recht, wenn wir am Ende daran landen, dass irgendwie ein sechswöchiger Prozess braucht, erstmal überhaupt die Genehmigung der Regierung zu bekommen, dann wird das einen sehr negativen Einfluss haben und das kann auch nicht im Interesse der Regierung sein. Andererseits, wenn die Gefahren, die da im Raum stehen und Entropic selbst promotet, dann wirklich so groß sind, dann kann es aber möglicherweise, halte ich es nicht für ein komplett unrealistisches Szenario, dass das Ganze dann auch so passiert. Aber kann natürlich sein, wenn am Ende dann China irgendwie vorneweg rennt, dass es auch nochmal ein weiterer Impuls dafür ist, dass es sich dann wieder dreht. Aber also was ich eigentlich feststellen will, es ist ein weiterer Player im Markt und ich bin sehr gespannt, wie es sich irgendwie oder in dem Spiel, ich bin sehr gespannt, wie es sich ausgeht. Aber dass er sich komplett wieder zurückzieht, das kann ich mir nicht vorstellen.

SPEAKER_02 30:02

Trump war jetzt aber nicht so wahnsinnig involviert, oder? Das war jetzt nicht so eine One-Man-Aktion, dass er gesagt hat, hey, lass das mal. Also ich habe zumindest in dem Kontext irgendwie nicht viel gelesen. Weil dann wäre die Wahrscheinlichkeit, dass er auch wieder egal ist zu Wochen, nicht so gering. Ich glaube, das war es jetzt nicht. Also zumindest hat es nicht so öffentlich als sein Thema. Er ist jetzt nicht, hat sich nicht hingestellt und gesagt, so ich verbiete.

SPEAKER_01 30:24

Also was ich ja gelesen habe, gerade bei dem Fableding war es sogar irgendwie, dass der Amazon-CEO irgendwie ja bei der US-Regierung, der so ein bisschen mit dafür, also irgendwie sich sehr negativ darüber geäußert hat, dass man die US-Regierung dazu gebracht hat, diese strengeren Regeln zu erlassen. Also deswegen, das klingt jetzt nicht, als hätte er da, als wäre das jetzt ein Gedanke von Trump gewesen. Kannst ehrlich, passt ja auch nicht wirklich zu Trump, oder?

SPEAKER_02 30:50

Also, naja, also die Aussage, das darf keiner außer ein US-Bürger, der einen US-amerikanischen Ausweis hat. Das passt grundsätzlich schon sehr deutsch. Passt erstmal sehr. Okay, GLM 5.2 oder GLM, weiß ich nicht genau. Was ist das?

SPEAKER_00 31:14

Das ist ein neues Open Weights Modell mit einer MIT-License, was letzte Woche in den Social Channels sehr gehypt wurde als Modell, was so gut ist ungefähr wie Opus 4.8 im Coding-Bereich, was sich jetzt auch ein bisschen bestätigt hat, sage ich mal, von den Vibes und von dem Sentiment. Und wer GLM noch nie gehört hat, ist es eine Modellfamily von ZAI. Wer ZAI noch nie gehört hat, ZAI ist ein chinesisches Startup oder eine AI Company aus China, welche 2019 aus der Beijin Qinghua University, ich hoffe, das war irgendwie ansatzweise richtig, gegründet wurde. Und genau, die trainieren Open Weights Modelle und sind auch am 8. Januar Public gegangen in China mit einer Evaluierung über 6,6 Milliarden US-Dollar. Und GLM ist das zweitbeste Coding-Modell auf verschiedenen Arena Benchmarks. Es ist MIT-Licensed, hat 753 Milliarden Parameter, es ist ein MOI, 1 Million Token Kontext-Window, hat einen sehr coolen Report oder Research Report mit veröffentlicht, wie sie es trainiert haben und worum es geht. Es ist in mittlerweile allen möglich gängigen Coding-Agents verfügbar. Also man hat es auf Open Router, es ist auf hier, sag ich mal, Inference-Plattformen von Fireworks zu Knallung Together AI. Sie haben auch eigene Coding-Agent-Pläne, die mit verschiedenen Coding-Agents funktionieren. Das heißt, du brauchst bei ZEI so einen Coding Agent-Plan. Und dann kannst du das nutzen in VNUR-Provider in existierende Coding Agents. Und da gibt es da sehr, viele positive Vibes darüber, weil so gut wie Opus 4.8 anscheinend, aber nur 4,40 Euro pro Million Output-Tokens. Das heißt, das ist fünfmal günstiger, wenn ich jetzt nicht alles toll ist. Also angenommen, Opus kostet 25 Dollar die Tokens ohne Subscriptions. Ich glaube, das war so. Auf jeden Fall sehr günstig und sehr beliebt. Und wenn ihr irgendwie Open Code nutzt, Cursor, Pi, wie auch immer, das kann man das alles sehr easy integrieren und nutzen. Spannend.

SPEAKER_02 33:45

Weißt du, wie groß es ist im Sinne von wie viel Entfernen? Also ist es irgendwie möglich? Gibt es irgendwelche Destillate, die auch lokal laufen oder ist es schon so, dass du Cloud Power brauchst, um das Ganze laufen zu lassen?

SPEAKER_01 33:58

Also ich hatte mir gestern nur kurz der Last Ponzt der Firma sich einen Mac Mini aufgesetzt, um für so einen lokalen Agent und da hat er auch kurz geschaut, ob er das drauf laufen lassen kann. Zumindest für den McMini reicht es nicht aus, die außerhalb ist einzige, ich kenne.

SPEAKER_00 34:09

Okay. Ja, also du brauchst schon, es gibt sehr viel schon von der Community Efforts, die halt versuchen, das Modell zu verbessern. Du hast jetzt auch irgendwie Databricks, die es mit fast viel Tokens die Sekunde hostet, was extrem viel ist, aber alles halt auf Nvidia GPUs. Und es gibt auch König City-Varianten, aber du brauchst halt mindestens, sag ich mal, Stack H200 GPUs, sage ich mal, dass das irgendwie Sinn macht. Aber es ist sehr cool, sehr günstig. Das heißt, wenn ihr irgendwie, ich weiß nicht, wenn ihr Codex-Nutzer seid, könnt ihr über Open Code, äh Open Router das mal Inside Codex testen oder ja, ich habe es noch nicht gemacht, aber ich habe sehr viel Positives gesehen.

SPEAKER_02 34:58

Okay, spannend. Vielleicht noch nur, damit man es gehört hat, ohne jetzt groß drauf einzugehen, weil wir gerade über Chips an Nvidia und H200 redeten, gab es letzte Woche auch noch die News, dass OpenAI dort auch ins Hardware-Business praktisch einsteigt und zwar mit Broadcom zusammen Jalapeno veröffentlicht hat, was OpenAIs erster Hardware-Chip ist für Inference. Und ja, einen, ich weiß nicht, ob es Bruchteil oder auf jeden Fall deutlich besser Performance pro Watt rausbringen soll, als vergleichbare State-of-the-art-Chips und ich glaube, irgendwann Ende des Jahres oder so soll das ready sein. Das nur in Kürze dazu.

SPEAKER_00 35:49

Aber es ist eigentlich bekannt, ob man das irgendwie sieht, du wirst vielleicht im Hintergrund die Chips nutzen, wenn du mehr Modelle nutzt, oder?

SPEAKER_02 35:57

Ja, genau. Aber wir hatten jetzt schon häufiger oder letztens auch hier in Slack ein Thread, wo es so um die Kosten ging und die Zukunft und ich ja immer eher argumentiere, ich kann mir nicht vorstellen, dass so für den Use Case, wie wir jetzt aktuell entwickeln, und klar, wenn wir jetzt irgendwie zehnmal so viel entwickeln am Tag, dann wird das vielleicht auch zehnmal so viel kosten, aber dass die Kosten so viel stärker explodieren. Ja, die Abo-Modelle sind im Moment subventioniert im Vergleich zu den Token-Preisen natürlich. Aber gerade solche Sachen, wo man dann sieht, die Chips werden deutlich effizienter und lassen das deutlich schneller laufen. Die lokalen, die Open-Modelle sind da, das wird alles schneller. Also ich sehe halt nicht so den Weg, dass es so ex obe dann teuer wird, dass man darüber nachdenken muss, ob es jetzt sinnvoll ist, einzusetzen oder nicht.

SPEAKER_01 36:46

Und das ist ja auch gab es ja auch übrigens dieses Announcement von DeepSeek, dieses De-Spark, die irgendwie die Inference 85% schneller machen sollte, so, was wahrscheinlich auch dann wiederum Kosteninput ist, weil sie irgendwie nach Wahrscheinlichkeit irgendwie vorberechen, welcher Pfad der Next Token Chain irgendwie der wahrscheinlichste ist. Also genau, habe ich mir jetzt den Algorithmus nicht angeschaut. Ich weiß nicht, Philippe, ob du es dir angeschaut hast, dieses De-Spark-Ding, aber das ist ja, ja, es gibt ja einige Entwicklungen in die Richtung, dass es uns das Gleiche irgendwie in Zukunft kostengünstiger machen. Und auch große Modelle versus irgendwelche Hardware und Optimierung im Algorithmus, das günstiger wird.

SPEAKER_02 37:24

Hatten wir ja auch irgendwann in den News danach nichts mehr von gehört, aber die, die praktisch diese LLMs auf die Chip gebrannt haben und da ja auch so wahnsinnige Geschwindigkeiten erreicht haben.

unknown 37:34

Yes.

SPEAKER_01 37:35

Ja gut, das ist gefallen, wie schnell die werden, ne? Von daher braucht er immer eine Weile lang, wenn das neue Modell draußen ist, immer spezifisch für das Modell, die Architektur. Ja, ja, klar. Aber ich denke auch, das wird auch irgendwo in Zukunft eine Daseinsberechtigung haben und irgendwie stärker sein, dass vielleicht die neuesten Modelle die ersten drei Wochen teurer sind, bis die Hardware dafür gescaled ist. Aber die Frage ist, wie schnell geht sowas.

SPEAKER_02 37:56

Ja, aber für mich sind wir da halt überall nicht so weit weg. Also wenn du jetzt halt einen Opus V8 für super günstig haben könntest, so, na damit kannst du ja schon wahnsinnig viel abdecken.

SPEAKER_01 38:12

Ja, auf jeden Fall. Es ist so die Frage bei den Use Case, die wir eben gerade was Coding angeht, werden wir irgendwann an der Schwelle sein, wo man sagen kann, 95% der Arbeit können wir einfach auch mit ein Jahr alten Modellen möglicherweise machen und müssen nicht cutting-edge sein, um den besten Benefit davon zu haben. Ich denke, irgendwann wird es wahrscheinlich da, so dass es halt ein paar Modelle gibt, die einfach klar sind, dass sie erstmal fürs nächste Jahr supported sind, weil der Use Case einfach da ist.

SPEAKER_00 38:36

Wollt ihr nicht 2 Euro ausgeben, um den Button von grün auf blau zu machen? Doch, im Moment möchte ich das machen.

SPEAKER_02 38:42

Ich habe gerne auch kein Problem mit. Gemini Computer Use. Das verbraucht auch bestimmt ein paar Token.

SPEAKER_00 38:52

Ja. Aber es ist sehr cool. Also Computer Use ist ein nichts Neues und auch ein Gemini ist Computer Use nichts Neues. Aber wir haben letzte Woche das Computer-Use-Tool für Gemini 3.5 vorgestellt und Computer Use beinhaltet ja mehr als nur irgendwie den Computer. Und was jetzt ganz neu ist, ist, man kann ein Environment definieren. Das heißt, ich kann sagen, hey, Gemini kontrolliert ein Browser oder Gemini kontrolliert ein Computer oder Gemini kontrolliert ein Telefon. Und der große Unterschied zwischen den verschiedenen Environments ist dann, dass du verschiedene Tools bereit hast. Das heißt, du aktivierst das Computer-Use-Tool und je nachdem, was für ein Environment du hast, hat dann Gemini verschiedene Tools, dass es aufrufen kann, also irgendwie Klick oder Track und diese Dinge. Und zwischen einem Computer bedienen und einem Smartphone bedienen, existieren ja Unterschiede, weil einem Smartphone ja alles mehr oder weniger Touch and Track ist, mehr oder weniger. Das heißt, da gibt es nicht viel. Und ich habe vielleicht klar noch einen Input und einen Type und sonst was. Und genau, das heißt, man kann jetzt super easy mit Gemini und einem Computer Use-Tool eine Art Android-Controller mehr oder weniger bauen. Ich habe da auch relativ zwei Stunden alles für mich gedauert, so ein Emulator mit, also Android-Emulator und ein kleines Python-Skript, wo Gemini dann diesen Emulator kontrollieren kann und wirklich einen Prompt einen so einen Weg, hey, geh mal bitte auf D ⁇ D-Seite oder öffne die und die App und teste dann den und der Flow und dann macht Gemini das alles automatisiert und dann kann man wieder das Ergebnis halt anschauen. Und was besonders cool daran ist, ist im Verhalten zu, sag ich mal, Android und iOS, ist, dass man hier einfach bei Android eine Ubuntu-Maschine starten kann und dann den Android-Emulator ausführen und man hat dann diesen Display, das heißt, es ist relativ easy aufzusetzen und zum Testen. Und es funktioniert aber auch für iOS. Also es ist nicht nur ein Android-Computer-Use-Tool, sag ich mal, sondern funktioniert auch mit iOS-Apps. Und wenn ihr irgendwas, sag ich mal, im mobilen Bereich macht, gerne mal reinschauen und testen. Weil es, ich glaube, Codex hat sowas mit iOS-Development ein bisschen. Aber definitiv sehr cool zum Anschauen. Und auf der Mega.

SPEAKER_02 41:06

Gut. Wenn ich auf die Themenliste gucke, haben wir, glaube ich, alles. Fällt euch noch irgendwas spontan ein, was ihr nachschießen wollt. Ich glaube, heute haben wir schon viele Themen gemacht, oder? Sehr gut.

SPEAKER_00 41:18

Ja, Dennis hat immer wieder viele Fragen.

SPEAKER_01 41:21

Kommt immer mit Überraschungsthemen. Es ist eine Seite AI News und andererseits auch Dennis Fragestunde. Also ist die Frage für mich.

SPEAKER_02 41:27

Ich versetze mich einfach in die Lage unserer HörerInnen und versuche möglichst viel für sie rauszuholen.

SPEAKER_00 41:31

Ich glaube, das ist so, okay, Dennis muss Kosten sparen bei AI-Subscription. Er kann keinen externen Berater mehr beauftragen. Ich frage einfach Philipp. Ja.

SPEAKER_02 41:43

Wenn ihr Fragen habt, schreibt uns gerne an podcast.programmierpunkt war. Ich leite die gerne an Philipp weiter. Oder wir besprechen sie hier in der nächsten Folge. Und sonst habt ihr die Hitzewelle überstanden. Was ist San Francisco? Geht wahrscheinlich, oder? Wie ist das Wetter?

SPEAKER_00 41:56

Kalt. Kalt, ja. Kalt! 19 Grad, gestern Nacht waren es 14 Grad. Das ist ja unangenehm. Ich kenne nur noch 33 Grad im Schlafzimmer bei Übernacht.

SPEAKER_02 42:09

Sehr gut. Macht's gut, vielen Dank und bis zum nächsten Mal.

SPEAKER_01 42:18

Ciao, macht's gut.