[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"blog-content-weekly-ai-news-kw23":3},"\u003Cp>KW23 ist die Woche, in der das Coding-Agent-Rennen einen neuen Höhenmesser bekommt. Anthropic hat am 28. Mai \u003Cstrong>Claude Opus 4.8\u003C\u002Fstrong> veröffentlicht — keine Revolution, aber laut Anbieter ein handfester Schritt bei Coding-Benchmarks und Halluzinationsverhalten. Parallel reift die Open-Source-Seite weiter: \u003Cstrong>Ollama 0.24\u003C\u002Fstrong> vereinfacht lokale Runtime-Setups, \u003Cstrong>vLLM v0.20.2\u003C\u002Fstrong> liefert wichtige Stabilitätsfixes für DeepSeek V4 und gpt-oss, und LangChain diskutiert öffentlich, dass offene Modelle bei praktischen Agent-Tasks deutlich näher an die Closed-Frontier heranrücken.\u003C\u002Fp>\n\n\u003Cp>Dazwischen läuft in Wien der \u003Cstrong>Public-AI-Hackathon im Bundeskanzleramt\u003C\u002Fstrong> mit GovGPT, KAPA und KI-SUN als Eckpfeiler — und in Brüssel sieht der \u003Cstrong>Digital Omnibus\u003C\u002Fstrong> eine spätere Anwendung zentraler Annex-III-HRAIS-Pflichten vor. Acht News, sieben Tage, eine Einordnung.\u003C\u002Fp>\n\n\u003Ch2>Top-Story: Claude Opus 4.8 — weniger Halluzinationen und Dynamic Workflows\u003C\u002Fh2>\n\u003Cp>Anthropic hat am 28. Mai \u003Ca href=\"https:\u002F\u002Fwww.anthropic.com\u002Fnews\u002Fclaude-opus-4-8\" target=\"_blank\" rel=\"noopener noreferrer\">Claude Opus 4.8 vorgestellt\u003C\u002Fa> — nur 41 Tage nach Opus 4.7. Die Tagline der Release: weniger halluzinieren, ehrlicher antworten, Coding-Agents nochmal verbessern. Die Zahlen, die \u003Ca href=\"https:\u002F\u002Fwww.anthropic.com\u002Fclaude\u002Fopus\" target=\"_blank\" rel=\"noopener noreferrer\">Anthropic selbst nennt\u003C\u002Fa>: \u003Cstrong>88,6 % SWE-bench Verified, 69,2 % SWE-bench Pro, 74,6 % Terminal-Bench 2.1, 1890 Elo auf GDPval-AA\u003C\u002Fstrong> — laut Anthropic 121 Elo-Punkte vor GPT-5.5.\u003C\u002Fp>\n\u003Cp>Das spannende Detail steckt aber im Verhalten, nicht im Score. Opus 4.8 ist laut Anthropic \u003Cstrong>rund viermal seltener bereit, Bugs in selbst geschriebenem Code unkommentiert durchzulassen\u003C\u002Fstrong> — das Modell flaggt aktiv, was schiefläuft, statt es zu vertuschen. \u003Ca href=\"https:\u002F\u002Fsimonwillison.net\u002F2026\u002Fmay\u002F28\u002Fclaude-opus-4-8\u002F\" target=\"_blank\" rel=\"noopener noreferrer\">Simon Willison hat das in seinen Notes vom 28. Mai\u003C\u002Fa> als \"modest but tangible improvement\" eingeordnet, mit dem konkreten Hinweis auf \u003Cstrong>mid-conversation System-Messages\u003C\u002Fstrong> als neue Steuerungs-Primitive und ein reduziertes \u003Cstrong>Prompt-Cache-Minimum von 1.024 Tokens\u003C\u002Fstrong>. Preis bleibt bei 5 US-Dollar Input und 25 US-Dollar Output pro Million Tokens, Fast Mode wird allerdings dreimal billiger als bei Opus 4.7.\u003C\u002Fp>\n\u003Cp>Architektonisch interessant ist das \u003Cstrong>Dynamic-Workflows-Feature in Claude Code\u003C\u002Fstrong>: Opus 4.8 plant einen größeren Task, fächert parallele Subagents aus, lässt sie laufen und verifiziert die Ergebnisse gegen Test-Suiten. \u003Ca href=\"https:\u002F\u002Fwww.vellum.ai\u002Fblog\u002Fclaude-opus-4-8-benchmarks-explained\" target=\"_blank\" rel=\"noopener noreferrer\">Vellum hat das im Benchmark-Vergleich\u003C\u002Fa> als besonders praxisrelevantes Feature beschrieben — gedacht für größere Refactorings, bei denen Single-Agent-Setups schnell zum Engpass werden. Für DACH-Teams, die Claude über LiteLLM oder die Anthropic-API einbinden, dürfte Opus 4.8 vor allem ein überschaubarer Modellwechsel sein: Context-Window und Output-Limits bleiben laut Anbieter in derselben Größenordnung.\u003C\u002Fp>\n\u003Cp>\u003Cstrong>Quelle:\u003C\u002Fstrong> \u003Ca href=\"https:\u002F\u002Fwww.anthropic.com\u002Fnews\u002Fclaude-opus-4-8\" target=\"_blank\" rel=\"noopener noreferrer\">Anthropic — Introducing Claude Opus 4.8\u003C\u002Fa> · \u003Ca href=\"https:\u002F\u002Fsimonwillison.net\u002F2026\u002Fmay\u002F28\u002Fclaude-opus-4-8\u002F\" target=\"_blank\" rel=\"noopener noreferrer\">Simon Willison — Notes on Opus 4.8\u003C\u002Fa> · \u003Ca href=\"https:\u002F\u002Fwww.vellum.ai\u002Fblog\u002Fclaude-opus-4-8-benchmarks-explained\" target=\"_blank\" rel=\"noopener noreferrer\">Vellum — Opus 4.8 Benchmarks Explained\u003C\u002Fa>\u003C\u002Fp>\n\n\u003Ch2>Ollama 0.24.0 — Codex App per Einzeiler und MLX-Sampler-Rework\u003C\u002Fh2>\n\u003Cp>Ollama hat am 14. Mai die \u003Ca href=\"https:\u002F\u002Fgithub.com\u002Follama\u002Follama\u002Freleases\" target=\"_blank\" rel=\"noopener noreferrer\">v0.24.0 final freigegeben\u003C\u002Fa> — und der prominenteste neue Befehl ist \u003Ccode>ollama launch codex-app\u003C\u002Fcode>. Damit soll sich OpenAIs Codex-Desktop-Client deutlich einfacher gegen lokale Ollama-Modelle konfigurieren lassen. Wer bisher Environment-Variablen, Custom-Endpoints und Config-Files manuell gepflegt hat, bekommt damit einen klareren Einstiegspfad für lokale Coding-Workflows.\u003C\u002Fp>\n\u003Cp>Im Ökosystem werden dafür größere Cloud-Modelle und kleinere lokale Modelle parallel diskutiert. Die \u003Ca href=\"https:\u002F\u002Follama.com\u002Flibrary\u002Fgemma4\" target=\"_blank\" rel=\"noopener noreferrer\">Gemma-4-MTP-Unterstützung kam schon in 0.23.1\u003C\u002Fa> — Multi-Token-Prediction als Speculative-Decoding-Variante, die den Decode-Durchsatz verbessern kann, solange der Verifikations-Schritt sauber greift. Auf Apple Silicon hat Ollama dazu den MLX-Sampler überarbeitet, was vor allem bei längeren Generations relevant wird.\u003C\u002Fp>\n\u003Cp>Im Hintergrund läuft schon der nächste Architekturwechsel: \u003Cstrong>v0.30.0-rc21\u003C\u002Fstrong> wechselt vom eigenen GGML-Backend auf einen \u003Cstrong>direkten llama.cpp-Unterbau\u003C\u002Fstrong> (GGUF bleibt kompatibel). Wer Ollama in einer eigenen Plattform-Pipeline benutzt, sollte die RC im Auge behalten — die Backend-Migration ist ein offenes Risiko, gleichzeitig aber auch der Grund, warum neue Modelle in Zukunft schneller verfügbar sein werden.\u003C\u002Fp>\n\u003Cp>\u003Cstrong>Quelle:\u003C\u002Fstrong> \u003Ca href=\"https:\u002F\u002Fgithub.com\u002Follama\u002Follama\u002Freleases\" target=\"_blank\" rel=\"noopener noreferrer\">Ollama Releases\u003C\u002Fa> · \u003Ca href=\"https:\u002F\u002Fcodersera.com\u002Fblog\u002Flocal-ai-runtimes-may-2026-update\u002F\" target=\"_blank\" rel=\"noopener noreferrer\">Codersera — Local AI Runtimes May 2026\u003C\u002Fa>\u003C\u002Fp>\n\n\u003Ch2>vLLM v0.20.2 — DeepSeek V4 und gpt-oss MXFP4 Bugfixes\u003C\u002Fh2>\n\u003Cp>vLLM hat am 10. Mai die \u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fvllm-project\u002Fvllm\u002Freleases\" target=\"_blank\" rel=\"noopener noreferrer\">v0.20.2 als Patch-Release\u003C\u002Fa> hinterhergeschoben. Inhalt: Re-enable des persistent topk path für DeepSeek-V4 Sparse Attention auf Hopper (PR #41665, Fix für einen MTP=1-Hang), KV-Cache-Allokationsfehler im V1-Engine-Pfad behoben (#41282), gpt-oss MXFP4 plus \u003Ccode>torch.compile\u003C\u002Fcode> läuft endlich sauber (#42002), und ein Boundary-Bug im Qwen3-VL Deepstack ist gefixt (#40932).\u003C\u002Fp>\n\u003Cp>Klingt nach Detail-Arbeit, ist aber für Teams mit DeepSeek V4 oder gpt-oss im produktionsnahen Betrieb relevant: Genau solche Patch-Releases entscheiden oft darüber, ob sporadische Hänger reproduzierbar verschwinden. Die direkte Vorgänger-Version v0.20.1 vom 4. Mai brachte schon die BF16\u002FMXFP8-All-to-All-Performance-Verbesserungen für FlashInfer und den neuen PTX-cvt-Pfad FP32 → FP4. Wer noch auf 0.20.0 sitzt, sollte v0.20.2 zumindest zeitnah in Staging testen.\u003C\u002Fp>\n\u003Cp>Wichtig im Kontext: Die Major-Linie 0.21 läuft parallel schon und ist seit Mitte Mai GA. Für konservativere Teams ist 0.20.2 trotzdem die richtige Wahl, weil die Bugfixes hier zurückportiert wurden, ohne neue Breaking Changes wie den C++20-Compiler-Zwang oder das Transformers-v4-Deprecation aus 0.21.\u003C\u002Fp>\n\u003Cp>\u003Cstrong>Quelle:\u003C\u002Fstrong> \u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fvllm-project\u002Fvllm\u002Freleases\" target=\"_blank\" rel=\"noopener noreferrer\">vLLM v0.20.2 Release Notes\u003C\u002Fa>\u003C\u002Fp>\n\n\u003Ch2>LiteLLM v1.86.2 — MCP OAuth für Cursor, Vertex-Gemini-3.5-Fix\u003C\u002Fh2>\n\u003Cp>Auf der Proxy-Schicht hat BerriAI am 27. Mai \u003Ca href=\"https:\u002F\u002Fgithub.com\u002FBerriAI\u002Flitellm\u002Freleases\" target=\"_blank\" rel=\"noopener noreferrer\">LiteLLM v1.86.2\u003C\u002Fa> stable rausgeschoben, nach v1.86.0 (24. Mai) und v1.85.0 (17. Mai). Die wichtigsten Änderungen aus dem Mai-Block: \u003Cstrong>Migration auf die Google Interactions API\u003C\u002Fstrong> (sauberere Streaming-Semantik gegenüber dem alten Generative-AI-Endpoint), \u003Cstrong>native MCP-OAuth-Unterstützung für Cursor\u003C\u002Fstrong> (für viele Devs der Hauptgrund, LiteLLM aufzurüsten), und ein wichtiger \u003Cstrong>Vertex-AI-Function-Calls-Fix für Gemini 3.5+\u003C\u002Fstrong>, der das Tool-Calling-Format wieder mit dem Anthropic\u002FOpenAI-Schema kompatibel macht.\u003C\u002Fp>\n\u003Cp>Operativ relevant sind außerdem die klarere Release-Versionierung, MCP-Toolsets als organisatorische Klammer um mehrere MCP-Server und die neue \u003Cstrong>LiteLLM Agent Platform\u003C\u002Fstrong> als eigenständiges Produkt-Surface neben dem Proxy. Wer LiteLLM nur als reinen Router betreibt, kann vieles davon zunächst ignorieren — wer aber Agents oberhalb von LiteLLM baut, sollte die Plattform im Auge behalten, weil sie konsequent auf MCP und OpenTelemetry einzahlt.\u003C\u002Fp>\n\u003Cp>\u003Cstrong>Quelle:\u003C\u002Fstrong> \u003Ca href=\"https:\u002F\u002Fgithub.com\u002FBerriAI\u002Flitellm\u002Freleases\" target=\"_blank\" rel=\"noopener noreferrer\">LiteLLM Releases\u003C\u002Fa> · \u003Ca href=\"https:\u002F\u002Fdocs.litellm.ai\u002F\" target=\"_blank\" rel=\"noopener noreferrer\">LiteLLM Docs\u003C\u002Fa>\u003C\u002Fp>\n\n\u003Ch2>NVIDIA Cosmos Predict 2.5 — Fine-Tuning für Robot-Video-Generation\u003C\u002Fh2>\n\u003Cp>NVIDIA hat am 26. Mai zusammen mit Hugging Face einen \u003Ca href=\"https:\u002F\u002Fhuggingface.co\u002Fblog\" target=\"_blank\" rel=\"noopener noreferrer\">praktischen Guide für Fine-Tuning von Cosmos Predict 2.5 mit LoRA und DoRA\u003C\u002Fa> veröffentlicht. Cosmos Predict 2.5 ist NVIDIAs World-Foundation-Model für Robot-Video-Generation — es bekommt einen Kontext (z.B. eine Roboter-Hand in einer Küche) und generiert plausible Folge-Frames, die ein Roboter-Steuerungsmodell als Training-Targets oder Imagination-Buffer nutzen kann.\u003C\u002Fp>\n\u003Cp>Der spannende Punkt: Mit LoRA\u002FDoRA lassen sich kleine, sehr spezifische Robot-Domains (etwa eine bestimmte Greifer-Geometrie oder ein definierter Arbeitsplatz) effizient nachtrainieren, ohne das Foundation-Model komplett neu zu fitten. Für DACH-Robotik-Unternehmen, die bisher entweder mit synthetischen Datasets oder mit teuren Realwelt-Recordings arbeiten mussten, ist das ein realistischer dritter Weg. Im selben Blogpost-Zyklus erschien außerdem \u003Cstrong>LeRobot Humanoid\u003C\u002Fstrong> — eine offene, 3D-druckbare Humanoid-Plattform für Robot-Learning. Beides zusammen ergibt eine ziemlich klare Botschaft: Open-Source-Robotik ist 2026 keine Akademie-Spielwiese mehr.\u003C\u002Fp>\n\u003Cp>\u003Cstrong>Quelle:\u003C\u002Fstrong> \u003Ca href=\"https:\u002F\u002Fhuggingface.co\u002Fblog\" target=\"_blank\" rel=\"noopener noreferrer\">Hugging Face Blog — Fine-Tuning Cosmos Predict 2.5\u003C\u002Fa> · \u003Ca href=\"https:\u002F\u002Fhuggingface.co\u002Fblog\" target=\"_blank\" rel=\"noopener noreferrer\">LeRobot Humanoid\u003C\u002Fa>\u003C\u002Fp>\n\n\u003Ch2>LangChain — \"Open Models have crossed a threshold\"\u003C\u002Fh2>\n\u003Cp>LangChain hat im \u003Ca href=\"https:\u002F\u002Fblog.langchain.com\" target=\"_blank\" rel=\"noopener noreferrer\">Mai-Blog ein Essay mit dem Titel \"Open Models have crossed a threshold\"\u003C\u002Fa> veröffentlicht. Kernthese: Offene Modelle wie \u003Cstrong>GLM-5\u003C\u002Fstrong> und \u003Cstrong>MiniMax M2.7\u003C\u002Fstrong> rücken bei Core-Agent-Tasks näher an die Closed-Frontier heran — Tool-Calling, Mehrschritt-Reasoning, Code-Generation — nicht nur in synthetischen Benchmarks, sondern auch in praktischen Framework-Workflows.\u003C\u002Fp>\n\u003Cp>Das ist ein bemerkenswertes Signal von einem Framework, das historisch sehr eng an OpenAI angedockt war. Die Konsequenz, die LangChain selbst zieht: \u003Cstrong>Default-Recipes werden Provider-agnostischer\u003C\u002Fstrong>, und der Provider-Switch (Closed → Open) wird 2026 für manche Use-Cases eher zur Architektur- und Wirtschaftlichkeitsfrage als zur reinen Qualitätsfrage. Parallel hat LangChain \u003Cstrong>Deep Agents v0.5\u003C\u002Fstrong> mit non-blocking async Subagents und einem expanded Multi-Modal Filesystem ausgerollt — das passt zur Dynamic-Workflows-Story aus Anthropic und zeigt, wie sich Multi-Agent-Patterns über Vendors hinweg synchronisieren.\u003C\u002Fp>\n\u003Cp>Für jeden, der eine souveräne oder selbst betriebene KI-Strategie plant, ist die Headline klar: Die Lücke zwischen Closed- und Open-Model-Setups wird kleiner, aber sie verschwindet nicht. Die Entscheidung \"Closed oder Open\" verschiebt sich damit stärker Richtung Datenhoheit, Latenz, Integrationsaufwand und Total Cost of Ownership.\u003C\u002Fp>\n\u003Cp>\u003Cstrong>Quelle:\u003C\u002Fstrong> \u003Ca href=\"https:\u002F\u002Fblog.langchain.com\" target=\"_blank\" rel=\"noopener noreferrer\">LangChain Blog\u003C\u002Fa>\u003C\u002Fp>\n\n\u003Ch2>Public AI Österreich — GovGPT, KAPA und Bundeskanzleramt-Hackathon\u003C\u002Fh2>\n\u003Cp>In Wien hat Staatssekretär Pröll am \u003Ca href=\"https:\u002F\u002Fwww.bundeskanzleramt.gv.at\u002Fbundeskanzleramt\u002Fnachrichten-der-bundesregierung\u002F2026\u002F05\u002Fproell-public-ai-hackathon-im-bundeskanzleramt.html\" target=\"_blank\" rel=\"noopener noreferrer\">22. Mai den Public-AI-Hackathon im Bundeskanzleramt\u003C\u002Fa> eröffnet. Der Hackathon ist Teil der breiteren Public-AI-Initiative, die die Bundesregierung im \u003Ca href=\"https:\u002F\u002Fwww.bundeskanzleramt.gv.at\u002Fbundeskanzleramt\u002Fnachrichten-der-bundesregierung\u002F2026\u002F03\u002F5-konkrete-ki-anwendungen-fuer-oesterreichs-bundesverwaltung.html\" target=\"_blank\" rel=\"noopener noreferrer\">März 2026 als gemeinsamen KI-Fahrplan beschlossen hat\u003C\u002Fa>. Fünf Anwendungen stehen im Zentrum, und sie sind erstaunlich konkret beschrieben.\u003C\u002Fp>\n\u003Cp>\u003Cstrong>GovGPT\u003C\u002Fstrong> ist das generative AI-Werkzeug für alle Bundesbediensteten — souverän gehostet, DSGVO-konform, ausgelegt auf 180.000 Nutzer bis Ende des ersten Halbjahres 2026. \u003Cstrong>KI im ELAK\u003C\u002Fstrong> bringt KI-Funktionen in den elektronischen Akt (Fragen an ganze Aktensammlungen, strukturierte Zusammenfassungen) für 13.000 Bedienstete im zweiten Halbjahr 2026. \u003Cstrong>KAPA\u003C\u002Fstrong> unterstützt die Beantwortung parlamentarischer Anfragen — Recherche, Konsolidierung, Vorbereitung, mit Human-in-the-Loop als zentralem Prinzip. \u003Cstrong>KI-SUN\u003C\u002Fstrong> ist ein persönlicher Wissensassistent für über 6.000 Seiten Schulungsmaterial der Bundesverwaltung. Die fünfte Stufe — \u003Cstrong>Agentic AI\u003C\u002Fstrong> — adressiert autonome Prozesse wie Terminbuchungen für Bürger über Chatbots.\u003C\u002Fp>\n\u003Cp>Für SEADEV-Kunden im Behörden-Umfeld ist das ein konkreter Referenzrahmen: Souveräne, regional gehostete KI wird in Österreich offiziell zur Verwaltungsstrategie. Wer auf KMU-Seite ähnliche Datenschutz-Anforderungen hat (Gesundheit, Versicherung, kritische Infrastruktur), kann sich an den Public-AI-Anforderungen orientieren — sie sind streng, aber gut dokumentiert.\u003C\u002Fp>\n\u003Cp>\u003Cstrong>Quelle:\u003C\u002Fstrong> \u003Ca href=\"https:\u002F\u002Fwww.bundeskanzleramt.gv.at\u002Fbundeskanzleramt\u002Fnachrichten-der-bundesregierung\u002F2026\u002F05\u002Fproell-public-ai-hackathon-im-bundeskanzleramt.html\" target=\"_blank\" rel=\"noopener noreferrer\">Bundeskanzleramt — Public AI Hackathon\u003C\u002Fa> · \u003Ca href=\"https:\u002F\u002Fwww.bundeskanzleramt.gv.at\u002Fbundeskanzleramt\u002Fnachrichten-der-bundesregierung\u002F2026\u002F03\u002F5-konkrete-ki-anwendungen-fuer-oesterreichs-bundesverwaltung.html\" target=\"_blank\" rel=\"noopener noreferrer\">Bundeskanzleramt — 5 KI-Anwendungen\u003C\u002Fa>\u003C\u002Fp>\n\n\u003Ch2>EU Digital Omnibus — HRAIS Annex III soll auf Dezember 2027 rutschen\u003C\u002Fh2>\n\u003Cp>Nach der gemeldeten vorläufigen Einigung über die Targeted Amendments zum EU AI Act ist die Verschiebung der Annex-III-High-Risk-AI-Systeme-Deadline auf 2. Dezember 2027 (ursprünglich 2. August 2026) und der Annex-I-HRAIS-Deadline auf 2. August 2028 (ursprünglich 2. August 2027) politisch vorgesehen. Formal wird das wirksam, sobald der Omnibus im EU-Amtsblatt veröffentlicht ist — laut \u003Ca href=\"https:\u002F\u002Fwww.gibsondunn.com\u002Feu-ai-act-omnibus-agreement-postponed-high-risk-deadlines-and-other-key-changes\u002F\" target=\"_blank\" rel=\"noopener noreferrer\">Gibson Dunn\u003C\u002Fa> wird das vor dem 2. August 2026 erwartet.\u003C\u002Fp>\n\u003Cp>Die Hauptbegründung der Kommission: Die \u003Ca href=\"https:\u002F\u002Fwww.globalpolicywatch.com\u002F2026\u002F05\u002Feu-ai-act-update-timeline-relief-targeted-simplification-and-new-prohibitions\u002F\" target=\"_blank\" rel=\"noopener noreferrer\">harmonisierten Standards und Compliance-Werkzeuge waren bis Ende 2025 nicht fertig\u003C\u002Fa>, und die nationalen Aufsichtsbehörden sind noch nicht überall benannt. Atempause ja, Freifahrtschein nein — die neuen Verbote (non-konsensuelle Intimate-Deepfakes, CSAM-Generation) treten parallel ab 2. Dezember 2026 in Kraft, und die Watermarking-Pflicht für generative Inhalte ist bei drei Monaten geblieben.\u003C\u002Fp>\n\u003Cp>Kritisch sieht das \u003Ca href=\"https:\u002F\u002Fnetzpolitik.org\" target=\"_blank\" rel=\"noopener noreferrer\">netzpolitik.org\u003C\u002Fa>, die argumentieren, der Omnibus folge der Big-Tech-Wunschliste. Aus DACH-KMU-Sicht ist die Lage zweischneidig: Die zusätzliche Zeit wäre echte Vorbereitungszeit, aber \u003Cstrong>die Erwartung der Aufsichtsbehörden steigt\u003C\u002Fstrong>, weil 2027 viele Organisationen gleichzeitig liefern müssen. Wer jetzt mit sauber dokumentierten Multi-Agent-Architekturen, Logging und Risikomanagement startet, ist deutlich besser positioniert als jemand, der im Sommer 2027 erst anfängt.\u003C\u002Fp>\n\u003Cp>\u003Cstrong>Quelle:\u003C\u002Fstrong> \u003Ca href=\"https:\u002F\u002Fwww.gibsondunn.com\u002Feu-ai-act-omnibus-agreement-postponed-high-risk-deadlines-and-other-key-changes\u002F\" target=\"_blank\" rel=\"noopener noreferrer\">Gibson Dunn — EU AI Act Omnibus Agreement\u003C\u002Fa> · \u003Ca href=\"https:\u002F\u002Fwww.globalpolicywatch.com\u002F2026\u002F05\u002Feu-ai-act-update-timeline-relief-targeted-simplification-and-new-prohibitions\u002F\" target=\"_blank\" rel=\"noopener noreferrer\">Global Policy Watch — EU AI Act Update\u003C\u002Fa> · \u003Ca href=\"https:\u002F\u002Fnetzpolitik.org\" target=\"_blank\" rel=\"noopener noreferrer\">Netzpolitik.org\u003C\u002Fa>\u003C\u002Fp>\n\n\u003Ch2>Fazit — Coding-Agents, Open Models, souveräne Verwaltung\u003C\u002Fh2>\n\u003Cp>KW23 zeigt drei parallele Bewegungen. Erstens: \u003Cstrong>Coding-Agents reifen weiter\u003C\u002Fstrong> — Claude Opus 4.8 setzt laut Anbieter bei Coding und Halluzinationsverhalten nach, Ollama vereinfacht lokale Tooling-Setups, vLLM liefert Stabilitätsfixes für DeepSeek V4 und gpt-oss. Zweitens: \u003Cstrong>Offene Modelle holen auf\u003C\u002Fstrong> — LangChains \"Open Models have crossed a threshold\"-Essay ist nicht nur Marketing, sondern ein praktisches Signal, dass Open-Model-Setups bei Agent-Workflows ernster zu nehmen sind. Drittens: \u003Cstrong>Souveräne KI in der Verwaltung wird konkret\u003C\u002Fstrong> — Österreichs Public-AI-Initiative liefert mit GovGPT und KAPA echte Use-Cases, während Brüssel zusätzliche Vorbereitungszeit für High-Risk-AI-Systeme einplant. Wer 2026 eine souveräne KI-Strategie baut, hat in dieser Woche mehr Argumente bekommen, nicht weniger.\u003C\u002Fp>\n\n\u003Cp>\u003Cem>Kuratiert von SEADEV Studios. Weekly AI News erscheint jeden Dienstag.\u003C\u002Fem>\u003C\u002Fp>\n"]