Thought Leadership

Forecast-Watchdog: Wie ein KI-Agent in der Energiebranche konkret aussieht.

Andreas Martens Juni 2026

KI-Agenten sind aktuell das Buzzword der Energiebranche. Hinter dem Begriff verbirgt sich nichts Mystisches — im Kern ist ein Agent eine Schleife aus vier Bausteinen: ein Ziel, eine Reihe von Tools (APIs, Datenquellen, Service-Calls), eine Entscheidungsschleife, und ein Sprachmodell, das in dieser Schleife Hypothesen klassifiziert. Spannend wird es, wenn man diese vier Bausteine in einen konkreten energiewirtschaftlichen Kontext kippt. Dann entsteht aus dem Buzzword sehr schnell ein operatives Werkzeug.

Dieser Artikel zeigt das an einem Beispiel, das wir bei qurix gerade bauen: dem Forecast-Watchdog. Ein Agent für Direktvermarkter und Energieversorger, der laufend prüft, ob die Anlagen im Portfolio tun, was der Forecast vorhersagt — und der bei Abweichungen rechtzeitig Bescheid sagt, bevor sich die Differenz in der Ausgleichsenergie-Abrechnung niederschlägt.

KI-Agent in der Energiebranche — abstrakte Visualisierung einer agentischen Schleife

* * *

In einem Satz

Der Forecast-Watchdog ist ein autonom laufender Software-Agent, der stündlich die Erzeugungsprognose jeder Anlage Ihres Portfolios mit der tatsächlichen Einspeisung vergleicht, Abweichungen nach Ursache klassifiziert und Ihnen eine konkrete Handlungsempfehlung ins Cockpit legt — bevor die Kosten der Abweichung in der Ausgleichsenergie-Abrechnung sichtbar werden.

Warum gibt es ihn?

In der operativen Realität eines Direktvermarkters entstehen laufend Diskrepanzen zwischen Forecast und Ist-Einspeisung. Drei Ursachen dominieren — und alle drei haben gemeinsam, dass sie heute zu spät entdeckt werden:

Ursache	Wer entdeckt es heute?	Wann wird's teuer?
Wetter-Aktualisierung seit dem letzten Forecast	meist niemand systematisch	wenn die nächste Bilanzkreis-Abrechnung läuft
Anlagen-Outage / Wechselrichter-Fehler	Betriebsführung, oft erst am Folgetag	jede Stunde, in der die Anlage Null liefert, der Bilanzkreis aber Erzeugung erwartet
Modell-Drift eines Forecast-Anbieters	über mehrere Tage kumuliert, wenn überhaupt	systematische Schieflage der gesamten Vermarktung

Ein Portfolio mit 30+ Anlagen lässt sich nicht mehr per Auge überwachen. Der Portfolio-Manager schaut morgens auf die Sammel-Abrechnung — bis dahin sind die Ausgleichsenergie-Kosten bereits entstanden. Mit jeder zusätzlichen Anlage skaliert das Problem linear, die Reaktionszeit aber nicht.

Der Watchdog ersetzt nicht den Menschen. Er ersetzt die nicht-mehr-mögliche manuelle Sichtkontrolle aller Anlagen jede Stunde.

Was macht der Agent konkret?

Stündlich (anpassbar) durchläuft der Watchdog je Anlage einen strukturierten Entscheidungsprozess in fünf Schritten:

┌─────────────────────────────────────────────────────────────┐
│  Schritt 1 — Anomalie-Filter                                │
│  • Forecast vs Ist über die letzten 4 Stunden               │
│  • Anlage gilt als anomal wenn:                             │
│      Health-Status ≠ ok  ODER  |Abweichung| > 25 %          │
└────────────────────────┬────────────────────────────────────┘
                         ▼
┌─────────────────────────────────────────────────────────────┐
│  Schritt 2 — Evidenz sammeln (drei Tools)                   │
│  • Wetter-Freshness (DWD-Update seit letztem Forecast?)     │
│  • Heartbeat (Anlage meldet überhaupt? Wieviel Null?)       │
│  • Provider-Diff (DWD vs ECMWF — divergieren die Anbieter?) │
└────────────────────────┬────────────────────────────────────┘
                         ▼
┌─────────────────────────────────────────────────────────────┐
│  Schritt 3 — Klassifizieren (KI-Modell prüft alle Evidenz)  │
│  Hypothesen:                                                │
│   ✦ weather  — Wetter hat sich geändert                     │
│   ✦ outage   — Anlage liefert Null / veraltete Werte        │
│   ✦ drift    — Forecast-Provider divergieren                │
│   ✦ unknown  — Datenlage nicht eindeutig                    │
└────────────────────────┬────────────────────────────────────┘
                         ▼
┌─────────────────────────────────────────────────────────────┐
│  Schritt 4 — Entscheiden (deterministische Regel-Tabelle)   │
│  • no_action               — alles im grünen Bereich        │
│  • recommend_refresh (info)— Re-Forecast empfehlen          │
│  • create_alert (warn)     — Portfolio-Manager prüfen lassen│
│  • create_alert (critical) — Betriebsführung alarmieren     │
└────────────────────────┬────────────────────────────────────┘
                         ▼
┌─────────────────────────────────────────────────────────────┐
│  Schritt 5 — Aufgabe ins Cockpit (mit Audit-Trail)          │
│  • Severity, Anlage, Ursache, konkrete Empfehlung           │
│  • Vollständiges Lauf-Protokoll für Compliance + Nachvollzug│
└─────────────────────────────────────────────────────────────┘

Wichtig: Der Agent schreibt keine Forecasts und kein Trading selbst zurück. Er empfiehlt — der Mensch bestätigt. Damit bleibt jede schreibende Aktion auditierbar und Mensch-im-Loop.

Wer profitiert wie?

Portfolio-Manager

Kein morgendlicher manueller Sichtcheck mehr. Statt 30 Anlagen durchzuklicken: ein Cockpit mit nur den Anlagen, die heute Aufmerksamkeit brauchen.
Erlöse-Risiko sofort sichtbar. Wenn eine PV-Anlage stillsteht bei steigenden Day-Ahead-Preisen, kommt der kritische Alert noch in derselben Stunde — nicht erst beim nächsten Bilanzkreis-Recheck.

Bilanzkreis-Manager

Ausgleichsenergie-Kosten frühzeitig vermeiden. Ein „outage"-Alarm um 09:00 ermöglicht, den Bilanzkreis noch im aktuellen Tag nachzujustieren oder kurzfristig Energie zu beschaffen.
Provider-Drift wird messbar. Bisher implizit als „Forecast war schlecht" eingebucht — jetzt mit Hinweis, welcher Provider abweicht, also welcher Vertrag zu hinterfragen ist.

Asset-/Betriebsführung

Frühwarn statt Reklamation. Wenn die SCADA noch nicht alarmiert, aber der Forecast-Watchdog „Anlage seit 4 h auf 0 kW" meldet, springt der Service-Einsatz schneller an.
Outage-Historie kommt direkt aus dem Bestand. Jeder Lauf ist archiviert; Muster wie „diese Anlage hatte in den letzten 30 Tagen 3 Outages" sind später als Pattern abrufbar.

Geschäftsführung

Skalierung des Portfolios entkoppelt sich von Personalkosten. 50 oder 500 Anlagen ändern den Operations-Aufwand des Watchdogs nicht.
Compliance-Audit-Trail eingebaut. BNetzA-Monitoring, EEG-§51, Bilanzkreis-Nachweise — jede Agent-Entscheidung mit Zeitstempel, Datenstand und LLM-Klassifizierung archiviert.

* * *

Business Case

Annahmen für ein typisches Direktvermarkter-Portfolio:

Parameter	Wert	Quelle / Annahme
Installierte Leistung	200 MW	Beispiel-Portfolio
Jährliche Erzeugung	~400 GWh	2.000 Volllaststunden gemischt
Heutiger Forecast-Fehler (RMSE)	12 – 15 %	BDEW-Branchenstudien
Ausgleichsenergie-Kosten	3 – 5 €/MWh	BNetzA-Monitoring-Berichte
Reaktionszeit-Reduktion durch Watchdog	24 – 36 h	Annahme
Eingesparte Kosten dadurch	1 – 2 €/MWh	Konservative Schätzung

Einsparpotenzial: 400.000 – 800.000 € pro Jahr für ein 200-MW-Portfolio, skaliert linear mit der Portfoliogröße.

Dazu kommen harte Sekundäreffekte: eingesparte Personalstunden des Portfolio-Managers (bei 30+ Anlagen ca. 1 h/Tag morgendlicher Sichtcheck, ca. 250 h/Jahr), 24/7-Überwachung ohne Schichtdienst, vermiedene Negativpreis-Verluste durch früh erkannte §51-Stunden, und vermiedene Marktprämien-Korrekturen, weil falsche Forecasts noch im laufenden Monat bei der ÜNB-Bestellung nachjustiert werden können.

Architektur in Kurzform

                Externe Quellen
                  │
                  │  DWD MOSMIX     ENTSO-E Erzeugung
                  ▼  Wetter         + Last
            ┌──────────────────────────────┐
            │       Datenintegration       │
            │     (stündliche Polls)       │
            └──────────────┬───────────────┘
                           │
                           ▼
            ┌──────────────────────────────┐
            │       Vergleichs-Schicht     │
            │  • Forecast (DWD + ECMWF)    │
            │  • Ist-Einspeisung           │
            │  • Anlagen-Heartbeat         │
            └──────────────┬───────────────┘
                           │
                           ▼
            ┌──────────────────────────────┐
            │   Watchdog-Agent (LangGraph) │
            │  • 5 Tools (Service-Layer)   │
            │  • LLM-Klassifizierung       │
            │  • Regel-Fallback            │
            └──────────────┬───────────────┘
                           │
                           ▼
            ┌──────────────────────────────┐
            │   Cockpit + Agent-Seite      │
            │  • Aufgabenliste             │
            │  • Audit-Trail je Lauf       │
            │  • Manueller Trigger         │
            └──────────────────────────────┘

Drei Architektur-Eigenschaften sind dabei nicht-verhandelbar:

Offene Datenquellen. DWD und ENTSO-E sind frei zugänglich. Kein US-Hyperscaler-Lock-in, kein proprietärer Daten-Vertrag. Bei Bedarf wird ein zweiter Forecast-Provider (ECMWF, oder ein kommerzieller wie energy & meteo systems) zusätzlich angebunden.
Service-Layer in der Mitte. Die fünf Tools des Agenten (Plant-Health, Deviation, Provider-Compare, Weather-Freshness, Recent-Actuals) sind auch als REST-API verfügbar. Eigene Dashboards, BI-Tools oder Prognose-Apps können dieselben Endpoints nutzen — kein Datensilo.
KI als Klassifikator, nicht als Entscheider. Das LLM klassifiziert die Ursache, eine deterministische Regel-Tabelle entscheidet über die Aktion. Das macht den Agent vorhersagbar, testbar und regelkonform.

Ein typischer Tag mit dem Watchdog

08:00. Sie loggen sich ein. Das Cockpit zeigt: 2 kritische Alerts, 5 Warnungen, 1 Info-Hinweis.

08:01. Sie klicken auf den ersten kritischen Alert:

Biogas Straubing meldet seit 4 h Null trotz positiver Forecast — vermutlich Störung. Empfehlung: Betriebsführung kontaktieren.

Daneben sehen Sie den vollständigen Audit-Trail des Watchdog-Laufs: welche Tools um wieviel Uhr was zurückgegeben haben, welche Hypothese das LLM mit welcher Begründung gewählt hat. Sie können die Empfehlung einschätzen, statt sie nur zur Kenntnis zu nehmen.

08:03. Eine SMS an die Betriebsführung. Sie markieren den Alert als „in Bearbeitung". Beim nächsten Lauf um 09:00 sieht der Agent, dass die Aufgabe schon offen ist, und legt keinen Duplikat-Alert an.

08:15. Sie öffnen die nächste Warnung:

Forecast-Anbieter divergieren bei Windpark Brandenburg um 22 % — Modell-Drift möglich.

Im »Vergleich«-Tab sehen Sie die zwei Forecast-Linien gegen die Ist-Linie. DWD liegt heute systematisch zu niedrig. Sie melden das beim Forecast-Provider und nutzen für die nächsten 24 h den zweiten Provider als Lead.

09:00. Nächster Tick. Der Watchdog läuft automatisch. Sie arbeiten an Ihrem Tagesgeschäft. Wenn etwas kritisch wird, sehen Sie es in der Cockpit-Übersicht — Sie müssen nicht prüfen.

Was unterscheidet den Watchdog von SCADA und klassischer Monitoring-Software?

	SCADA / EMS	Klassisches BI-Tool	Forecast-Watchdog
Datenfokus	Einzelanlage, technisch	Aggregierte KPIs	Einzelanlage im Kontext Markt + Forecast
Reaktion	Alarm bei Schwellwerten	Reports im Nachgang	Hypothese + Handlungsempfehlung
Skalierung	pro Anlage konfiguriert	Dashboard manuell gepflegt	autonom skalierend
Ursachenanalyse	nein	nein	drei Hypothesen automatisch geprüft
Lernkurve	hoch (vor Ort)	hoch (BI)	gering (Aufgabenliste lesen)
Erweiterbarkeit	proprietär	proprietär	Standard-API + MCP-offen

Der Watchdog ersetzt SCADA nicht. Er schließt die Lücke zwischen SCADA (Anlagenüberwachung) und Vermarktung (Bilanzkreis, Erlössteuerung) — genau dort, wo heute niemand systematisch hinschaut.

Technische Realisierung (für Architekten)

Agent-Runtime: LangGraph (Open-Source, Anthropic-Maintainer). StateGraph mit 5 Nodes, deterministisches Routing.
LLM: Claude Sonnet 4.6 (Anthropic), max 20 Tokens pro Klassifizierungs-Call. Kein Tool-Use durch das LLM — die Tools werden durch den Graph aufgerufen.
Persistenz: zwei Tabellen pro Agent-Familie: agent_runs (Lauf-Audit, voll replay-fähig) und agent_tasks (User-sichtbare Aufgaben).
APIs: REST (/api/agents/*) plus MCP-Server unter /mcp — dieselben Funktionen sind für externe LLM-Clients (Claude Desktop, IDE-Plugins, MCP Inspector) ansprechbar.
Deployment: Single-Tenant, On-Prem oder Sovereign Cloud, Docker-Compose-fähig, KRITIS-tauglich.
Daten-Lifecycle: stündliche Forecasts (DWD-Daten + Power-Curve) + stündliche Ist-Werte (ENTSO-E-Erzeugung × Kapazitätsanteil) + Watchdog-Lauf alle Stunde.

Häufige Fragen

Können die Empfehlungen blind übernommen werden?

Nein. Der Watchdog ist ein Empfehlungs-System — er schreibt keine Forecasts und keine Trades zurück. Mensch entscheidet. Die deterministische Regel-Tabelle sorgt aber dafür, dass kein „Hallucinations-Risiko" durchschlägt.

Was passiert, wenn die KI eine falsche Hypothese vorschlägt?

Die Regel-Tabelle fängt klare Health-Signale ab. Beispiel: das LLM sagt „unknown", aber der Heartbeat zeigt 0 kW + Health-Status zero → der Watchdog erzeugt trotzdem einen kritischen Outage-Alert deterministisch.

Was ist mit der DSGVO?

Keine personenbezogenen Daten im Workflow. Nur Anlagen-Stammdaten, Energie-Zeitreihen und Marktdaten.

Was kostet ein LLM-Lauf?

Pro Watchdog-Tick ca. 5–20 Cent (Claude-Sonnet-API), je nach Anzahl anomaler Anlagen. Im 200-MW-Portfolio typisch 50–80 Cent/Tag — vernachlässigbar gegenüber dem Einsparpotenzial.

Wie integrieren wir das in unsere bestehende Toolchain?

Drei Pfade: (1) Single-Sign-On + Web-UI nutzen; (2) REST-API in die eigene BI-Welt einbinden; (3) MCP-Server unter /mcp als Tool-Provider für eigene LLM-Workflows.

Funktioniert das auch ohne KI-Modell?

Ja, in einem Notbetrieb-Modus. Die Regel-Tabelle deckt 80 % der Fälle auch ohne LLM-Klassifizierung deterministisch ab (Health-Signal + Threshold-Vergleich). Die LLM verbessert die übrigen 20 % — wenn die Anthropic-Verbindung wegfällt, läuft der Agent regelbasiert weiter.

In welchen Schritten kann der Watchdog in Betrieb gehen?

Phase	Aufwand	Was passiert
Inbetriebnahme	1 Woche	Anlagen mit MaStR-Nr. anlegen, DWD-Station je Anlage matchen, ENTSO-E-Connector konfigurieren
Schatten-Betrieb	2 Wochen	Watchdog läuft täglich, alle Alerts sichtbar, Sie reagieren wie gewohnt — und lernen die Klassifizierung kennen
Produktivbetrieb	ab Woche 4	Watchdog ist erste Anlaufstelle morgens. Kritische Alerts gehen zusätzlich per E-Mail/Push an die Bereitschaft
Erweiterung	nach Bedarf	weitere Agents (Marktprämien-Audit, Battery-Roundtrip, Vertragsradar) auf derselben Plattform

* * *

Zusammenfassung

Der Forecast-Watchdog ist kein Reporting-Tool und kein Trading-Roboter — er ist ein autonomer Wachposten, der laufend prüft, ob Ihre Anlagen das tun, was Ihr Forecast sagt. Er sagt Ihnen rechtzeitig was schiefläuft, woran es liegen könnte und was zu tun ist.

Bei einem typischen 200-MW-Direktvermarkter-Portfolio rechnet sich das Tool durch reduzierte Ausgleichsenergie-Kosten allein in der Größenordnung von 400.000 – 800.000 € pro Jahr — bei vernachlässigbaren laufenden Kosten und ohne Lock-in zu einem US-Cloud-Anbieter.

Reaktionszeit von 24 h auf weniger als 1 h. Ohne dass jemand jede Anlage manuell prüfen muss. Audit-fähig, regelkonform, erweiterbar.

Genauso ein Agent — fokussiert, im eigenen Sicherheitsperimeter, gegen vorab definierte Acceptance-Kriterien — lässt sich auch für andere Use-Cases in der Energiebranche bauen. Aktuell läuft dafür unser Agent-Sprint-Pilot.

Konkret werden

Wenn Sie überlegen, ob ein Forecast-Watchdog oder ein ähnlicher KI-Agent in Ihrem Haus Sinn macht — wir bauen so etwas aktuell für 1.000 € pro Use-Case:

Pilot · Sommer 2026 qurix Agent Sprint — ein KI-Agent für Ihren Use-Case in 5 Wochen, für 1.000 € Pilot-Seite ansehen

Reden wir 30 Minuten über Ihren KI-Agent-Use-Case.

Wir prüfen mit Ihnen, ob ein agentischer Workflow hier der richtige Hebel ist, oder ob es eine einfachere Antwort gibt. Ohne Verkaufsmodus.

Kontakt aufnehmen