Forecast-Watchdog: Wie ein KI-Agent in der Energiebranche konkret aussieht.
KI-Agenten sind aktuell das Buzzword der Energiebranche. Hinter dem Begriff verbirgt sich nichts Mystisches — im Kern ist ein Agent eine Schleife aus vier Bausteinen: ein Ziel, eine Reihe von Tools (APIs, Datenquellen, Service-Calls), eine Entscheidungsschleife, und ein Sprachmodell, das in dieser Schleife Hypothesen klassifiziert. Spannend wird es, wenn man diese vier Bausteine in einen konkreten energiewirtschaftlichen Kontext kippt. Dann entsteht aus dem Buzzword sehr schnell ein operatives Werkzeug.
Dieser Artikel zeigt das an einem Beispiel, das wir bei qurix gerade bauen: dem Forecast-Watchdog. Ein Agent für Direktvermarkter und Energieversorger, der laufend prüft, ob die Anlagen im Portfolio tun, was der Forecast vorhersagt — und der bei Abweichungen rechtzeitig Bescheid sagt, bevor sich die Differenz in der Ausgleichsenergie-Abrechnung niederschlägt.
In einem Satz
Der Forecast-Watchdog ist ein autonom laufender Software-Agent, der stündlich die Erzeugungsprognose jeder Anlage Ihres Portfolios mit der tatsächlichen Einspeisung vergleicht, Abweichungen nach Ursache klassifiziert und Ihnen eine konkrete Handlungsempfehlung ins Cockpit legt — bevor die Kosten der Abweichung in der Ausgleichsenergie-Abrechnung sichtbar werden.
Warum gibt es ihn?
In der operativen Realität eines Direktvermarkters entstehen laufend Diskrepanzen zwischen Forecast und Ist-Einspeisung. Drei Ursachen dominieren — und alle drei haben gemeinsam, dass sie heute zu spät entdeckt werden:
| Ursache | Wer entdeckt es heute? | Wann wird's teuer? |
|---|---|---|
| Wetter-Aktualisierung seit dem letzten Forecast | meist niemand systematisch | wenn die nächste Bilanzkreis-Abrechnung läuft |
| Anlagen-Outage / Wechselrichter-Fehler | Betriebsführung, oft erst am Folgetag | jede Stunde, in der die Anlage Null liefert, der Bilanzkreis aber Erzeugung erwartet |
| Modell-Drift eines Forecast-Anbieters | über mehrere Tage kumuliert, wenn überhaupt | systematische Schieflage der gesamten Vermarktung |
Ein Portfolio mit 30+ Anlagen lässt sich nicht mehr per Auge überwachen. Der Portfolio-Manager schaut morgens auf die Sammel-Abrechnung — bis dahin sind die Ausgleichsenergie-Kosten bereits entstanden. Mit jeder zusätzlichen Anlage skaliert das Problem linear, die Reaktionszeit aber nicht.
Der Watchdog ersetzt nicht den Menschen. Er ersetzt die nicht-mehr-mögliche manuelle Sichtkontrolle aller Anlagen jede Stunde.
Was macht der Agent konkret?
Stündlich (anpassbar) durchläuft der Watchdog je Anlage einen strukturierten Entscheidungsprozess in fünf Schritten:
┌─────────────────────────────────────────────────────────────┐
│ Schritt 1 — Anomalie-Filter │
│ • Forecast vs Ist über die letzten 4 Stunden │
│ • Anlage gilt als anomal wenn: │
│ Health-Status ≠ ok ODER |Abweichung| > 25 % │
└────────────────────────┬────────────────────────────────────┘
▼
┌─────────────────────────────────────────────────────────────┐
│ Schritt 2 — Evidenz sammeln (drei Tools) │
│ • Wetter-Freshness (DWD-Update seit letztem Forecast?) │
│ • Heartbeat (Anlage meldet überhaupt? Wieviel Null?) │
│ • Provider-Diff (DWD vs ECMWF — divergieren die Anbieter?) │
└────────────────────────┬────────────────────────────────────┘
▼
┌─────────────────────────────────────────────────────────────┐
│ Schritt 3 — Klassifizieren (KI-Modell prüft alle Evidenz) │
│ Hypothesen: │
│ ✦ weather — Wetter hat sich geändert │
│ ✦ outage — Anlage liefert Null / veraltete Werte │
│ ✦ drift — Forecast-Provider divergieren │
│ ✦ unknown — Datenlage nicht eindeutig │
└────────────────────────┬────────────────────────────────────┘
▼
┌─────────────────────────────────────────────────────────────┐
│ Schritt 4 — Entscheiden (deterministische Regel-Tabelle) │
│ • no_action — alles im grünen Bereich │
│ • recommend_refresh (info)— Re-Forecast empfehlen │
│ • create_alert (warn) — Portfolio-Manager prüfen lassen│
│ • create_alert (critical) — Betriebsführung alarmieren │
└────────────────────────┬────────────────────────────────────┘
▼
┌─────────────────────────────────────────────────────────────┐
│ Schritt 5 — Aufgabe ins Cockpit (mit Audit-Trail) │
│ • Severity, Anlage, Ursache, konkrete Empfehlung │
│ • Vollständiges Lauf-Protokoll für Compliance + Nachvollzug│
└─────────────────────────────────────────────────────────────┘
Wer profitiert wie?
Portfolio-Manager
- Kein morgendlicher manueller Sichtcheck mehr. Statt 30 Anlagen durchzuklicken: ein Cockpit mit nur den Anlagen, die heute Aufmerksamkeit brauchen.
- Erlöse-Risiko sofort sichtbar. Wenn eine PV-Anlage stillsteht bei steigenden Day-Ahead-Preisen, kommt der kritische Alert noch in derselben Stunde — nicht erst beim nächsten Bilanzkreis-Recheck.
Bilanzkreis-Manager
- Ausgleichsenergie-Kosten frühzeitig vermeiden. Ein „outage"-Alarm um 09:00 ermöglicht, den Bilanzkreis noch im aktuellen Tag nachzujustieren oder kurzfristig Energie zu beschaffen.
- Provider-Drift wird messbar. Bisher implizit als „Forecast war schlecht" eingebucht — jetzt mit Hinweis, welcher Provider abweicht, also welcher Vertrag zu hinterfragen ist.
Asset-/Betriebsführung
- Frühwarn statt Reklamation. Wenn die SCADA noch nicht alarmiert, aber der Forecast-Watchdog „Anlage seit 4 h auf 0 kW" meldet, springt der Service-Einsatz schneller an.
- Outage-Historie kommt direkt aus dem Bestand. Jeder Lauf ist archiviert; Muster wie „diese Anlage hatte in den letzten 30 Tagen 3 Outages" sind später als Pattern abrufbar.
Geschäftsführung
- Skalierung des Portfolios entkoppelt sich von Personalkosten. 50 oder 500 Anlagen ändern den Operations-Aufwand des Watchdogs nicht.
- Compliance-Audit-Trail eingebaut. BNetzA-Monitoring, EEG-§51, Bilanzkreis-Nachweise — jede Agent-Entscheidung mit Zeitstempel, Datenstand und LLM-Klassifizierung archiviert.
Business Case
Annahmen für ein typisches Direktvermarkter-Portfolio:
| Parameter | Wert | Quelle / Annahme |
|---|---|---|
| Installierte Leistung | 200 MW | Beispiel-Portfolio |
| Jährliche Erzeugung | ~400 GWh | 2.000 Volllaststunden gemischt |
| Heutiger Forecast-Fehler (RMSE) | 12 – 15 % | BDEW-Branchenstudien |
| Ausgleichsenergie-Kosten | 3 – 5 €/MWh | BNetzA-Monitoring-Berichte |
| Reaktionszeit-Reduktion durch Watchdog | 24 – 36 h | Annahme |
| Eingesparte Kosten dadurch | 1 – 2 €/MWh | Konservative Schätzung |
Einsparpotenzial: 400.000 – 800.000 € pro Jahr für ein 200-MW-Portfolio, skaliert linear mit der Portfoliogröße.
Dazu kommen harte Sekundäreffekte: eingesparte Personalstunden des Portfolio-Managers (bei 30+ Anlagen ca. 1 h/Tag morgendlicher Sichtcheck, ca. 250 h/Jahr), 24/7-Überwachung ohne Schichtdienst, vermiedene Negativpreis-Verluste durch früh erkannte §51-Stunden, und vermiedene Marktprämien-Korrekturen, weil falsche Forecasts noch im laufenden Monat bei der ÜNB-Bestellung nachjustiert werden können.
Architektur in Kurzform
Externe Quellen
│
│ DWD MOSMIX ENTSO-E Erzeugung
▼ Wetter + Last
┌──────────────────────────────┐
│ Datenintegration │
│ (stündliche Polls) │
└──────────────┬───────────────┘
│
▼
┌──────────────────────────────┐
│ Vergleichs-Schicht │
│ • Forecast (DWD + ECMWF) │
│ • Ist-Einspeisung │
│ • Anlagen-Heartbeat │
└──────────────┬───────────────┘
│
▼
┌──────────────────────────────┐
│ Watchdog-Agent (LangGraph) │
│ • 5 Tools (Service-Layer) │
│ • LLM-Klassifizierung │
│ • Regel-Fallback │
└──────────────┬───────────────┘
│
▼
┌──────────────────────────────┐
│ Cockpit + Agent-Seite │
│ • Aufgabenliste │
│ • Audit-Trail je Lauf │
│ • Manueller Trigger │
└──────────────────────────────┘
Drei Architektur-Eigenschaften sind dabei nicht-verhandelbar:
- Offene Datenquellen. DWD und ENTSO-E sind frei zugänglich. Kein US-Hyperscaler-Lock-in, kein proprietärer Daten-Vertrag. Bei Bedarf wird ein zweiter Forecast-Provider (ECMWF, oder ein kommerzieller wie energy & meteo systems) zusätzlich angebunden.
- Service-Layer in der Mitte. Die fünf Tools des Agenten (Plant-Health, Deviation, Provider-Compare, Weather-Freshness, Recent-Actuals) sind auch als REST-API verfügbar. Eigene Dashboards, BI-Tools oder Prognose-Apps können dieselben Endpoints nutzen — kein Datensilo.
- KI als Klassifikator, nicht als Entscheider. Das LLM klassifiziert die Ursache, eine deterministische Regel-Tabelle entscheidet über die Aktion. Das macht den Agent vorhersagbar, testbar und regelkonform.
Ein typischer Tag mit dem Watchdog
08:00. Sie loggen sich ein. Das Cockpit zeigt: 2 kritische Alerts, 5 Warnungen, 1 Info-Hinweis.
08:01. Sie klicken auf den ersten kritischen Alert:
Biogas Straubing meldet seit 4 h Null trotz positiver Forecast — vermutlich Störung. Empfehlung: Betriebsführung kontaktieren.
Daneben sehen Sie den vollständigen Audit-Trail des Watchdog-Laufs: welche Tools um wieviel Uhr was zurückgegeben haben, welche Hypothese das LLM mit welcher Begründung gewählt hat. Sie können die Empfehlung einschätzen, statt sie nur zur Kenntnis zu nehmen.
08:03. Eine SMS an die Betriebsführung. Sie markieren den Alert als „in Bearbeitung". Beim nächsten Lauf um 09:00 sieht der Agent, dass die Aufgabe schon offen ist, und legt keinen Duplikat-Alert an.
08:15. Sie öffnen die nächste Warnung:
Forecast-Anbieter divergieren bei Windpark Brandenburg um 22 % — Modell-Drift möglich.
Im »Vergleich«-Tab sehen Sie die zwei Forecast-Linien gegen die Ist-Linie. DWD liegt heute systematisch zu niedrig. Sie melden das beim Forecast-Provider und nutzen für die nächsten 24 h den zweiten Provider als Lead.
09:00. Nächster Tick. Der Watchdog läuft automatisch. Sie arbeiten an Ihrem Tagesgeschäft. Wenn etwas kritisch wird, sehen Sie es in der Cockpit-Übersicht — Sie müssen nicht prüfen.
Was unterscheidet den Watchdog von SCADA und klassischer Monitoring-Software?
| SCADA / EMS | Klassisches BI-Tool | Forecast-Watchdog | |
|---|---|---|---|
| Datenfokus | Einzelanlage, technisch | Aggregierte KPIs | Einzelanlage im Kontext Markt + Forecast |
| Reaktion | Alarm bei Schwellwerten | Reports im Nachgang | Hypothese + Handlungsempfehlung |
| Skalierung | pro Anlage konfiguriert | Dashboard manuell gepflegt | autonom skalierend |
| Ursachenanalyse | nein | nein | drei Hypothesen automatisch geprüft |
| Lernkurve | hoch (vor Ort) | hoch (BI) | gering (Aufgabenliste lesen) |
| Erweiterbarkeit | proprietär | proprietär | Standard-API + MCP-offen |
Der Watchdog ersetzt SCADA nicht. Er schließt die Lücke zwischen SCADA (Anlagenüberwachung) und Vermarktung (Bilanzkreis, Erlössteuerung) — genau dort, wo heute niemand systematisch hinschaut.
Technische Realisierung (für Architekten)
- Agent-Runtime:
LangGraph(Open-Source, Anthropic-Maintainer). StateGraph mit 5 Nodes, deterministisches Routing. - LLM: Claude Sonnet 4.6 (Anthropic), max 20 Tokens pro Klassifizierungs-Call. Kein Tool-Use durch das LLM — die Tools werden durch den Graph aufgerufen.
- Persistenz: zwei Tabellen pro Agent-Familie:
agent_runs(Lauf-Audit, voll replay-fähig) undagent_tasks(User-sichtbare Aufgaben). - APIs: REST (
/api/agents/*) plus MCP-Server unter/mcp— dieselben Funktionen sind für externe LLM-Clients (Claude Desktop, IDE-Plugins, MCP Inspector) ansprechbar. - Deployment: Single-Tenant, On-Prem oder Sovereign Cloud, Docker-Compose-fähig, KRITIS-tauglich.
- Daten-Lifecycle: stündliche Forecasts (DWD-Daten + Power-Curve) + stündliche Ist-Werte (ENTSO-E-Erzeugung × Kapazitätsanteil) + Watchdog-Lauf alle Stunde.
Häufige Fragen
Können die Empfehlungen blind übernommen werden?
Nein. Der Watchdog ist ein Empfehlungs-System — er schreibt keine Forecasts und keine Trades zurück. Mensch entscheidet. Die deterministische Regel-Tabelle sorgt aber dafür, dass kein „Hallucinations-Risiko" durchschlägt.
Was passiert, wenn die KI eine falsche Hypothese vorschlägt?
Die Regel-Tabelle fängt klare Health-Signale ab. Beispiel: das LLM sagt „unknown", aber der Heartbeat zeigt 0 kW + Health-Status zero → der Watchdog erzeugt trotzdem einen kritischen Outage-Alert deterministisch.
Was ist mit der DSGVO?
Keine personenbezogenen Daten im Workflow. Nur Anlagen-Stammdaten, Energie-Zeitreihen und Marktdaten.
Was kostet ein LLM-Lauf?
Pro Watchdog-Tick ca. 5–20 Cent (Claude-Sonnet-API), je nach Anzahl anomaler Anlagen. Im 200-MW-Portfolio typisch 50–80 Cent/Tag — vernachlässigbar gegenüber dem Einsparpotenzial.
Wie integrieren wir das in unsere bestehende Toolchain?
Drei Pfade: (1) Single-Sign-On + Web-UI nutzen; (2) REST-API in die eigene BI-Welt einbinden; (3) MCP-Server unter /mcp als Tool-Provider für eigene LLM-Workflows.
Funktioniert das auch ohne KI-Modell?
Ja, in einem Notbetrieb-Modus. Die Regel-Tabelle deckt 80 % der Fälle auch ohne LLM-Klassifizierung deterministisch ab (Health-Signal + Threshold-Vergleich). Die LLM verbessert die übrigen 20 % — wenn die Anthropic-Verbindung wegfällt, läuft der Agent regelbasiert weiter.
In welchen Schritten kann der Watchdog in Betrieb gehen?
| Phase | Aufwand | Was passiert |
|---|---|---|
| Inbetriebnahme | 1 Woche | Anlagen mit MaStR-Nr. anlegen, DWD-Station je Anlage matchen, ENTSO-E-Connector konfigurieren |
| Schatten-Betrieb | 2 Wochen | Watchdog läuft täglich, alle Alerts sichtbar, Sie reagieren wie gewohnt — und lernen die Klassifizierung kennen |
| Produktivbetrieb | ab Woche 4 | Watchdog ist erste Anlaufstelle morgens. Kritische Alerts gehen zusätzlich per E-Mail/Push an die Bereitschaft |
| Erweiterung | nach Bedarf | weitere Agents (Marktprämien-Audit, Battery-Roundtrip, Vertragsradar) auf derselben Plattform |
Zusammenfassung
Der Forecast-Watchdog ist kein Reporting-Tool und kein Trading-Roboter — er ist ein autonomer Wachposten, der laufend prüft, ob Ihre Anlagen das tun, was Ihr Forecast sagt. Er sagt Ihnen rechtzeitig was schiefläuft, woran es liegen könnte und was zu tun ist.
Bei einem typischen 200-MW-Direktvermarkter-Portfolio rechnet sich das Tool durch reduzierte Ausgleichsenergie-Kosten allein in der Größenordnung von 400.000 – 800.000 € pro Jahr — bei vernachlässigbaren laufenden Kosten und ohne Lock-in zu einem US-Cloud-Anbieter.
Reaktionszeit von 24 h auf weniger als 1 h. Ohne dass jemand jede Anlage manuell prüfen muss. Audit-fähig, regelkonform, erweiterbar.
Genauso ein Agent — fokussiert, im eigenen Sicherheitsperimeter, gegen vorab definierte Acceptance-Kriterien — lässt sich auch für andere Use-Cases in der Energiebranche bauen. Aktuell läuft dafür unser Agent-Sprint-Pilot.
Konkret werden
Wenn Sie überlegen, ob ein Forecast-Watchdog oder ein ähnlicher KI-Agent in Ihrem Haus Sinn macht — wir bauen so etwas aktuell für 1.000 € pro Use-Case:
Pilot · Sommer 2026 qurix Agent Sprint — ein KI-Agent für Ihren Use-Case in 5 Wochen, für 1.000 € Pilot-Seite ansehenReden wir 30 Minuten über Ihren KI-Agent-Use-Case.
Wir prüfen mit Ihnen, ob ein agentischer Workflow hier der richtige Hebel ist, oder ob es eine einfachere Antwort gibt. Ohne Verkaufsmodus.
Kontakt aufnehmen