Zum Hauptinhalt springen
13. Mai 202610 Min. LesezeitAI News

AI News KW 20: EU AI Omnibus, Copilot Custom Agents, Jack Clark

Lukas Obermann

Lukas Obermann

AI News KW 20: EU AI Omnibus, Copilot Custom Agents, Jack Clark

Letzte Woche war im Modell-Layer ungewöhnlich ruhig — keine Frontier-LLM-Releases, zum ersten Mal seit Februar. Dafür rückten Regulierung und Plattformen nach vorn: Der Digital AI Omnibus könnte zentrale High-Risk-Pflichten um 16 Monate verschieben, GitHub Copilot bekommt Custom Agents über .github/agents/, Atlassian öffnet seinen Teamwork Graph für Third-Party-Agents, und Jack Clark argumentiert in einem viel zitierten Essay, dass AI-Systeme bis Ende 2028 an der Entwicklung ihrer eigenen Nachfolger mitarbeiten könnten. Dazu eine viel diskutierte Hacker-News-Story rund um DeepSeek 4 Flash auf Apple Silicon und ein KI-Hackathon im Wiener Bundeskanzleramt. Hier ist die Einordnung.

Top-Story: EU Digital AI Omnibus — High-Risk-Pflichten könnten auf Dezember 2027 rutschen

In Brüssel wurde laut Netzpolitik.org in KW20 weiter über den Digital AI Omnibus verhandelt — und der politisch heikelste Punkt bleibt der Zeitplan des AI Act. Der diskutierte Kompromiss würde zentrale High-Risk-Annex-III-Pflichten vom 2. August 2026 auf den 2. Dezember 2027 verschieben. Annex-I-Obligations für Hochrisiko-Produkte wie Medizinprodukte, Spielzeug oder Funkanlagen würden später folgen. Auch Kennzeichnungs- und Watermarking-Pflichten für generative Inhalte bleiben damit ein Thema, das Unternehmen früh in ihre Roadmap aufnehmen sollten.

Für DACH-Unternehmen, die KI-Plattformen in regulierten Bereichen ausrollen, heißt das: Die High-Risk-Konformitätsbewertung bekommt wahrscheinlich mehr Vorlauf, aber keine Entwarnung. Parallel bleiben die unmittelbar geltenden Verbote und Transparenzpflichten relevant — besonders bei missbräuchlichen Anwendungen wie non-consensual intimate imagery (NCII) und CSAM. Netzpolitik verweist außerdem auf Warnungen zivilgesellschaftlicher Organisationen vor Schlupflöchern in der Produktsicherheits-Regulierung, weil Verschiebungen neue Lücken zwischen AI Act, Medizinprodukteverordnung und Funkanlagenrichtlinie öffnen könnten.

Praktisch: Wer im Herbst 2026 mit einer High-Risk-AI-Anwendung live gehen wollte, sollte den Zeitgewinn nicht als Pause verstehen, sondern als Planungsfenster. Klassifizierung, Dokumentation, Logging, Human Oversight und Kennzeichnungsstrategie lassen sich nicht in den letzten zwei Monaten vor Inkrafttreten sauber nachziehen.

Quelle: Netzpolitik.org — AI Act Coverage

GitHub Copilot Custom Agents — Team-Workflows in .github/agents/

GitHub hat in der Mai-Welle der Copilot-Updates gleich mehrere Features gleichzeitig ausgerollt. Das wichtigste: Custom Agents über ein neues .github/agents/-Verzeichnis. Teams können dort YAML-Definitionen für domänenspezifische Agents ablegen — etwa einen Performance-Optimizer mit Benchmark-Measure-Change-Pattern, einen Security-Reviewer oder einen Doc-Generator. Der Agent wird Teil des Repository und wandert über Forks und Branches mit, ohne dass jeder Entwickler ihn lokal konfigurieren muss.

Dazu kommt ein Model-Picker (Claude Opus 4.7, GPT-5.4, Gemini 3 Pro je nach Task), Self-Review (Agent reviewt eigene Changes mit Copilot Code Review, bevor der PR aufgeht) und Built-in Security Scanning direkt im Agent-Workflow — Code-, Secret- und Dependency-Vulnerabilities werden gefunden, bevor der PR offen ist. Außerdem gibt es einen CLI-Handoff, mit dem ein lokal gestarteter Coding-Task an einen Cloud-Agent übergeben wird, der dann selbständig weiterarbeitet.

In der Begleit-Story "Agent-Driven Development in Copilot Applied Science" beschreibt ein GitHub-Engineer, wie er mit Coding-Agents Agents gebaut hat, die Teile seiner Arbeit automatisieren. Das klingt nach Rekursion mit Anlauf, ist aber ein praktisches Pattern: Custom Agents codifizieren institutionelles Wissen, das sonst in Wiki-Seiten oder Senior-Köpfen versickert.

Quelle: GitHub Changelog

Atlassian Rovo Max — Teamwork Graph wird zur offenen Plattform

Atlassian hat auf der Team '26 Conference eine größere Plattform-Erweiterung angekündigt. Rovo Max ist ein neuer Reasoning-Mode in Rovo Chat, der komplexe Tasks in Multi-Step-Action-Plans zerlegt, autonom ausführt und die Ergebnisse team-weit teilt. Konkret bedeutet das: Rovo Max zieht Status-Daten aus Jira, Entscheidungen aus Confluence und Kundensignale aus Support-Queues über den gesamten Atlassian-Stack zusammen — ohne dass jemand sieben Tabs öffnen muss.

Rovo Studio ist parallel GA gegangen — Enterprise-Workspace, in dem Ideen zu Agents, Automations und Apps werden, eingehängt im Teamwork Graph. Die wichtigste strategische Weiche: Third-Party Agents in Confluence sind in Open Beta. Lovable, Replit, Databricks und Gamma können in Confluence-Pages per @mention gerufen werden — Atlassian öffnet damit den Teamwork Graph für externe Agent-Anbieter und macht ihn zur offenen Plattform.

Für Teams, die Confluence und Jira ohnehin nutzen, ist das ein Wendepunkt: Der Teamwork Graph wird vom geschlossenen Datensilo zum Agent-Marketplace. Für AI-Plattform-Anbieter ist es eine offene Einladung, MCP-Adapter zu bauen — und für SEADEV-Kunden, die ihre interne Wissensbasis in Confluence pflegen, eine Option, die wir uns in den nächsten Wochen genauer ansehen werden.

Quelle: Atlassian DevOps Blog

DeepSeek 4 Flash auf Metal — die Hacker-News-Story

Am 8. Mai stand auf Hacker News eine Community-Story weit oben: "DeepSeek 4 Flash local inference engine for Metal". Die Engine soll DeepSeek 4 Flash auf Apple Silicon mit Metal-Beschleunigung lauffähig machen — mit brauchbaren Token-Raten auf einer Mac-Studio-Workstation. Die Story passt zum übergeordneten Thema, das LLM Stats in seiner KW20-Einordnung herausstellt: Bei vergleichbarer Benchmark-Performance werden chinesische Open-Weight-Modelle in vielen Community-Vergleichen deutlich günstiger bewertet als westliche Closed-Source-Angebote.

Parallel beobachtet LLM Stats, dass auch chinesische Anbieter ihre Release-Strategien ausdifferenzieren: nicht jedes starke Modell bleibt automatisch open-weight, nicht jedes westliche Modell bleibt automatisch closed. Auf r/LocalLLaMA laufen parallel Diskussionen zu Kimi K2.6 und Qwen 3.6 27B als Coding-Modellen, die für Self-Hosting-Szenarien interessant sein könnten. Das Argument, das in der Community am häufigsten fällt: mehrere hundert US-Dollar API-Kosten pro Monat können durch lokale Inferenz entfallen — sofern Hardware, Betrieb und Auslastung passen.

Für DACH-Unternehmen, die ohnehin auf On-Premise-Inferenz setzen, ist das die wichtigere Story als das nächste US-Closed-Source-Release. Die Modelle sind frei verfügbar, die Lizenzen tragfähig, und die Hardware-Anforderungen werden mit jedem Quartal überschaubarer.

Quelle: Hacker News — Best Stories · LLM Stats AI News · r/LocalLLaMA Community

Claude Opus 4.7 — neuer #1 in den LogRocket AI-Tool-Rankings

LogRocket hat in seinem AI Dev Tool Power Ranking Mai 2026 Claude Opus 4.7 auf Platz 1 gesetzt. Begründung: starker Vision-Input, sehr gute Tool-Use-Werte, ein "extra-high effort"-Reasoning-Modus und ein stabiler Preispunkt im Enterprise-Vergleich. GPT-5.4 liegt in der LogRocket-Einordnung knapp dahinter, vor allem wegen nativem Computer-Use, Tool-Search-Funktion und großem Context Window.

Bei den Dev-Tools rangiert Cursor 3 in der Liste weit oben — mit Multi-Repo-Workspaces, parallelen Local/Cloud-Agents und nahtlosem Environment-Handoff. Die Pointe sitzt bei der Trend-Beobachtung: Frontend-Architekturen werden gerade auf "AI-ready" umgebaut. Signal-Reactivity-Convergence (Vue Vapor, React Compiler, Angular Signals) ist nicht zufällig — Agents brauchen vorhersagbare Render-Wege, sonst wird Computer-Use zur Lotterie.

Für AI-OpenStack-Setups bedeutet das: Wer als Frontend OpenWebUI oder eine eigene Vue-Oberfläche fährt, sollte den Render-Pfad sauber halten — Agents werden in den nächsten Quartalen anfangen, mit diesen UIs zu interagieren, nicht nur Menschen.

Quelle: LogRocket — AI Dev Tool Power Rankings Mai 2026

Jack Clark: "AI Systems Are About to Start Building Themselves"

Jack Clark (Mit-Gründer von Anthropic) hat in Import AI #455 am 4. Mai einen längeren Essay veröffentlicht, der die KW20-AI-Diskussion in zwei Lager spaltet. Kernpunkt: Anthropic-interne Daten zur Beschleunigung des eigenen Forschungs-Outputs durch Coding-Agents.

Die Zahlen, die Clark teilt: deutliche Speedups in internen Forschungs-Workflows durch Coding-Agents, gemessen über mehrere Modellgenerationen hinweg. Aus diesem Verlauf extrapoliert er eine hohe Wahrscheinlichkeit, dass AI-Systeme bis Ende 2028 größere Teile der Entwicklung von Nachfolger-Modellen übernehmen. Pflicht-Reading für alle, die AI-Strategie-Argumente vor Geschäftsführungen oder Behörden vortragen — gerade weil der Text sichtbar zwischen Messdaten, Insider-Perspektive und spekulativer Fortschreibung wechselt.

Das Interessante an Clarks Essay ist nicht die Prognose selbst — die ist hochspekulativ und kann sich genauso gut als überzogen herausstellen wie die GPT-3-Welt-Veränderungs-Prognosen von 2020. Interessant ist, dass ein Anthropic-Insider interne Effizienz-Gewinne überhaupt quantifiziert. Für Open-Weight-Player stellt sich damit weniger die Frage, ob Agent-gestützte Forschung wichtig wird, sondern wie schnell ähnliche Methoden in ihre eigenen Trainings- und Evaluationspipelines wandern.

Quelle: Import AI #455

Anthropic Natural Language Autoencoders — der intellektuelle Beitrag der Woche

TheSequence hat in Sequence Radar #857 Anthropics Natural Language Autoencoders Paper als "wichtigsten intellektuellen Beitrag der Woche" eingeordnet. Die Idee in Kurzform: Anstatt Embeddings nur als latente Vektor-Repräsentation zu behandeln, codiert das Verfahren komprimierte Inhalte in natürlich-sprachlichen Strukturen. Das könnte Interpretierbarkeit und Debugging gegenüber dichten Vektor-Räumen verbessern. Für Mechanistic-Interpretability-Forschung ein potenzieller Hebel; für produktive RAG-Pipelines noch zu früh.

Parallel meldet TheSequence das stille Ende der Snap × Perplexity Partnership — der angekündigte 400-Millionen-US-Dollar-Cash-plus-Equity-Deal wurde "amicably ended", weil sich beide Seiten nicht auf das Roll-out einigen konnten. Außerdem im Radar: der Subquadratic Stealth-Launch am 5. Mai, ein Seed-finanziertes Startup ($29 Millionen US-Dollar bei rund 500 Millionen Valuation) mit dem ersten LLM auf vollständig subquadratischer Attention-Architektur und 12-Millionen-Token-Context als Preview. Ob das Context-Window in der Praxis trägt, wird sich zeigen — die bisherigen Long-Context-Versprechen haben sich oft als brüchig erwiesen.

Quelle: TheSequence — Sequence Radar #857

KI-Hackathon im Bundeskanzleramt Wien — die Verwaltung pilotiert

Am 4. und 5. Mai hat das österreichische Bundeskanzleramt in Kooperation mit der TU Austria einen KI-Hackathon veranstaltet. 48 Stunden, 25 Teilnehmende, funktionsfähige Prototypen für Verwaltungs-Effizienz und Benutzerfreundlichkeit. Teil der Public AI Initiative der Bundesregierung, die KI-Anwendungen in der öffentlichen Verwaltung systematisch erschließen will.

Parallel zeigt die KDZ-Gemeindefinanzprognose vom Mai 2026, wie eng die finanziellen Spielräume vieler Gemeinden bleiben. In Vorarlberg bündeln mehrere Gemeinden rund um Feldkirch ihre KI-Kompetenzen im Verbund Regio Vorderland-Feldkirch — ein interessanter Praxis-Case, weil Klein- und Mittelgemeinden allein oft keine tragfähige KI-Strategie auflegen können, im Verbund aber schon.

Für die deutsche Seite läuft die PLAIN-Plattform (KI-Plattform für die Bundesverwaltung) weiter als zentraler Baustein digitaler Souveränität — GPU-Power für rechen-intensive KI-Anwendungen, LLMs als Services integrierbar, betrieben von der Bundesdruckerei. Die Bundesregierung hat parallel das KI-Verordnungs-Umsetzungsgesetz vorgelegt, das Zuständigkeiten der Behörden, Aufsichts- und Bußgeldregelungen festlegt. Beide Stories zeigen: Die DACH-Verwaltung pilotiert nicht mehr nur, sie skaliert.

Quelle: KDZ — Verwaltungsforschung · eGovernment.de

Fazit

KW20 war die erste Woche seit Februar ohne Frontier-LLM-Release — und ausgerechnet diese Pause hat sichtbar gemacht, wie sehr sich die Aufmerksamkeit gerade von der Modell-Ebene zur Plattform- und Regulierungs-Ebene verschiebt. Der EU Digital AI Omnibus könnte DACH-Unternehmen mehr Vorlauf bei High-Risk-Compliance verschaffen, GitHub Copilot und Atlassian Rovo Max definieren neu, was "Agent-Plattform" auf Enterprise-Niveau heißt, und Jack Clarks Essay zwingt die Strategie-Diskussion in eine Richtung, in der "AI Self-Improvement" zumindest als Szenario mitgedacht werden muss. Auf der Open-Weight-Seite hält das chinesische Preis-Momentum weiter an, während Apple Silicon als Inferenz-Plattform für größere Modelle interessanter wird. Wer in DACH eine souveräne AI-Plattform plant, sollte vor allem zwei Themen im Kalender markieren: Kennzeichnungspflichten für generative Inhalte und High-Risk-Pflichten. Bis dahin: Zeit, das eigene Setup robust aufzustellen.

Kuratiert von SEADEV Studios — Stand: 11. Mai 2026

Tags

AI NewsWeekly RoundupEU AI ActDigital OmnibusGitHub CopilotAtlassian RovoDeepSeekClaude OpusJack ClarkKI Verwaltung

Teilen