Thought Leadership

Im Inneren des Energy-Market-Agents — der Audit-Trail

Andreas Martens Mai 2026

Die meisten „KI-kuratierten" Briefings sind unauditierbare Behauptungen. Ein Modell liefert eine Liste, der Leser kann nicht überprüfen, welche Quellen geprüft wurden, welche Suchanfragen gefeuert wurden, was rausgefiltert wurde. In einem regulierten B2B-Kontext — gerade in der Energiewirtschaft — reicht das nicht.

Der Energy-Market-Research-Agent (energy-market.qurix.tech) ist anders gebaut. Jeder Wochenlauf hinterlässt einen Audit-Trail: die tatsächlich gefeuerten Such-Queries, die Kandidaten-URLs, die gesehenen Quellen-Domains, die rausgefilterten Einträge und die Gründe. Die Zahlen weiter unten stammen aus einem echten Lauf.

Der Agent läuft jeden Montag um 07:00 UTC, kuratiert die News der vergangenen sieben Tage und liefert bis zu zehn nach Wirkung sortierte Einträge mit konkreten Handlungsempfehlungen pro Akteur. Hinter diesem simpel klingenden Ergebnis stehen vier Stufen — jede mit einer klaren Aufgabe, jede mit einem Log-Eintrag, den der Betreiber im Nachhinein einsehen kann.

Vier Stufen, eine Pipeline

Jede Stufe macht eine Sache. Jede Stufe loggt was sie getan hat. Keine Black Box.

Quellen-Auswahl Wo der Agent sucht

Offenes Web via Brave Search, mit Bias auf deutschsprachige Regulatorik- und Branchen-Quellen.

Der Agent durchsucht das offene Web (Brave Search; Tavily als Fallback). Der deutsche Bias entsteht über drei indirekte Hebel: der System-Prompt ist deutsch, die Suchanfragen werden auf Deutsch formuliert, englische Quellen sind nur dann zulässig, wenn der DACH-Markt-Bezug klar ist. Das Audit-Log dokumentiert die Top-Quellen-Domains pro Lauf — in einem aktuellen Batch waren die häufigsten Treffer remit.bundesnetzagentur.de, bundeswirtschaftsministerium.de, transnetbw.de und bdew.de: genau die Regulatorik-, Netz- und Verbands-Schicht, durch die Entscheidungen wirklich fließen. Kuratierte RSS-Feeds für diese Quellen stehen auf der Roadmap.

Such-Strategie Vier bis sechs parallele Queries mit Domain-Vokabular

REMIT, EPEX, BNetzA-Festlegung, Direktvermarkter — die Queries nutzen die Sprache der Branche.

Jeder Lauf zerlegt die Woche in vier bis sechs orthogonale Sub-Themen: regulatorische Änderungen, Marktpreise, M&A, Personalwechsel, Branchen-Ankündigungen, Brennstoff- und Gas-Bewegungen. Das Modell wird mit dem Domain-Vokabular geprompted, das es nutzen soll — REMIT, MaBiS, Redispatch 3.0, EPEX/EEX, Bilanzkreis, EDIFACT/MaKo — damit die Queries nicht zu generischer „Energie-News-Suche" verkommen. Eine harte Grenze von zwölf Suchaufrufen pro Lauf verhindert, dass ein einzelner Batch das Budget sprengt. Jede Query wird mit ihrer Trefferzahl und dem Provider geloggt.

Akteur-Mapping Eine News, verschiedene Konsequenzen pro Akteur

Eine §14a-Festlegung heißt für ein Stadtwerk „Tarif-Design", für einen Direktvermarkter „Bilanzkreis-Hedging", für einen Netzbetreiber „Smart-Meter-Rollout".

Eine regulatorische Entscheidung wirkt selten für alle Marktakteure gleich. Eine BNetzA-Festlegung zu §14a EnWG erzeugt eine Aufgabe für das Tarif-Team eines Stadtwerks (Tarif-Design für steuerbare Verbraucher), eine andere für einen Direktvermarkter (Bilanzkreis-Hedging auf dimmbaren HT-/NT-Lasten) und eine dritte für einen Netzbetreiber (Smart-Meter-Gateway-Rollout). Der Agent wird angewiesen, pro Artikel auszuformulieren, was jede Akteursgruppe konkret tun muss — operativ, nicht abstrakt. Heute ist das Freitext pro Akteur; strukturierte Felder pro Stakeholder (ein Absatz je Akteur, abfragbar) sind die nächste Iteration.

Scoring & Filter Von 60 Roh-Kandidaten zu 4 News mit Hebel

Drei-stufiger Trichter: LLM-Ranking → server-seitiger Datums-Filter → Qualität-vor-Quantität-Regel.

Der Kandidatenpool aus sechs Such-Aufrufen umfasst typischerweise 50-80 Einträge. Drei Filter-Stufen engen das auf die finale Liste ein: das Modell bewertet nach Branchen-Impact und sortiert Duplikate sowie irrelevante Einträge aus; ein server-seitiger Python-Filter erzwingt das strikte 7-Tage-Fenster und droppt alles Ältere mit geloggtem Grund (stale_date); die Qualität-vor-Quantität-Regel erlaubt weniger als zehn Einträge, wenn die Woche ruhig war — eine kurze Liste schlägt eine aufgefüllte. Das Audit-Log erfasst Kandidaten-Anzahl, distinkte URLs, vom Modell eingereichte Einträge, vom Datums-Filter gedroppte Einträge und die final persistierte Anzahl.

Was ein echter Lauf zeigt

Die Vier-Stufen-Pipeline ist nicht aspirational. Der Audit-Trail eines aktuellen Batches (Kalenderwoche 21, 2026) zeigt exakt, was im Inneren passiert ist.

Der Agent feuerte sechs Such-Queries, in der Sprache, die die Branche tatsächlich nutzt:

Energiewirtschaft Deutschland News Mai 2026 BNetzA Festlegung
Strommarkt Bilanzkreis Redispatch Mai 2026
Direktvermarkter PV Wind Mai 2026 Regulierung
EPEX EEX Day-Ahead Strompreise Mai 2026 KW21
REMIT II Energiehandel Regulierung BNetzA Mai 2026
Gaspreise TTF Großhandel Mai 2026 Entwicklung

Sechzig Roh-Treffer kamen aus diesen sechs Queries zurück — vierundfünfzig distinkte URLs nach De-Duplikation. Die Top-Quellen-Domains nach Häufigkeit waren ein klarer Mix aus Regulatorik, Ministerium und Trade-Press:

bundeswirtschaftsministerium.de (4) · ad-hoc-news.de (4) · remit.bundesnetzagentur.de (3) · rp-online.de (3) · bloomberg.com (2) · transnetbw.de (2) · bdew.de (2) · uniper.energy (2)

Aus diesen 54 distinkten URLs wählte das Modell fünf Artikel aus, sortiert nach Branchen-Impact, und reichte sie ein. Der server-seitige Datums-Filter droppte daraufhin einen Artikel mit stale_date (veröffentlicht außerhalb des 7-Tage-Fensters), übrig blieben vier finale Einträge im Briefing dieser Woche.

60 Roh-Kandidaten → 54 distinkte URLs → 5 vom Modell eingereicht → 1 gedroppt (stale_date) → 4 final. Jede Zahl ist aus dem Audit-Log abfragbar.

Warum dieser Audit-Trail wichtig ist

Der Grund, jede Stufe zu loggen, ist nicht technische Hygiene. Es ist der Unterschied zwischen einem ernsthaften B2B-Werkzeug und einem Marketing-Demo. Drei konkrete Vorteile, sobald die Audit-Daten existieren.

Verifizierung für Token-Halter. Eine Firma, die ein maßgeschneidertes Briefing bekommt, kann die zugrundeliegende Methodik verifizieren: ja, der Lauf hat tatsächlich bnetza.de und transnetbw.de gelesen, nicht nur Wikipedia. Der Qualitätsanspruch ist nicht mehr rhetorisch.

Qualitätskontrolle für den Betreiber. Ein Lauf mit null BNetzA-Treffern, weniger als vier Queries oder fehlender Domain-Diversität ist ein Signal, dass etwas schiefgelaufen ist — veralteter Prompt, Search-API-Ausfall, Modell-Regression. Audit-Daten machen aus stillen Fehlern sichtbare.

Methodik-Iteration. Die Top-Domain-Verteilung über viele Läufe zeigt, wo kuratierte RSS-Feeds (Stufe-1-Roadmap) den größten Mehrwert liefern würden: Domains, die wir häufiger im Briefing wollen, gegen das Rauschen des offenen Webs gewichtet.

* * *

Was das für „Agentic AI in Production" heißt

„Agentic AI" ist derzeit ein Marketing-Label, das an alles geheftet wird, was ein Sprachmodell mit einem Tool-Call kombiniert. Diese Formulierung wirft zwei sehr unterschiedliche Dinge in einen Topf: ein Chat-Interface, das gelegentlich im Web sucht, versus eine domänen-geformte Pipeline mit bewusstem Scope, Logging und Validierung auf jeder Stufe.

Der Energy-Market-Research-Agent ist die zweite Sorte. Er ist gebaut für eine konkrete Domäne (deutschsprachige Energiewirtschaft), mit konkretem Takt (Montag 07:00 UTC, für die vergangenen sieben Tage), konkreter Output-Form (bis zu zehn nach Wirkung sortierte Einträge mit Handlungsempfehlung pro Akteur) und konkreter Audit-Haltung (jede Query, jede Domain, jeder Drop-Grund geloggt für den Betreiber).

Der Unterschied zwischen einem KI-Demo und einem KI-System, das den Betrieb trägt, ist nicht das Modell. Es ist, ob jede Stufe der Pipeline inspizierbar, verifizierbar und auf Evidenz-Basis verbesserbar ist.

Für energy-market.qurix.tech heißt das: das öffentliche Briefing ist kostenlos und live unter der URL. Ausgewählte Partner-Organisationen bekommen einen Token, der dieselbe Pipeline gescopt auf ihre spezifische Firma laufen lässt — gleiche Audit-Haltung, gleiches Logging, nur eingeengt auf News mit direktem Impact auf sie. Token auf Anfrage.

Live-System

Der hier beschriebene Agent läuft jeden Montag produktiv. Das öffentliche Briefing ist kostenlos.

Live-Produkt · Kostenlos Energy-Market Research Agent — wöchentliches Briefing für die DACH-Energiewirtschaft energy-market.qurix.tech

Maßgeschneidertes Briefing für Ihre Firma?

Ausgewählte Partner erhalten einen firmen-spezifischen Token — gleiche Pipeline, gleicher Audit-Trail, aber eingeengt auf News mit direktem Impact auf Ihr Geschäft.

Token anfragen