Phase 3: Entwicklung einer lokalen Multi-Model-Schreibpipeline

Problemstellung

Einzelne Sprachmodelle zeigten bei längeren Projekten erhebliche Schwächen:

  • Stilbrüche,
  • Inkonsistenzen,
  • Plotfehler,
  • Lore-Verlust,
  • hohe Rechenkosten.

Es wurde daher eine rollenbasierte Multi-Agent-Architektur entwickelt.

Ziele

Funktional

  • Trennung von Schreiben und Review
  • Persistentes Memory
  • Iterative Verbesserung
  • Unterstützung großer Projekte

Technisch

  • Vollständig lokal
  • Modulare Architektur
  • Austauschbare Modelle
  • Hohe Skalierbarkeit
  • Robuste Wiederaufnahme

Erste Implementierung: Python-Pipeline

Die erste Version entstand als lineare Python-Pipeline.

WRITE-Modus

Idee
   ↓
Writer
(Mistral Small 3.2)
   ↓
Review
   ↓
Merge
(Nemotron Cascade)
   ↓
Memory
(Nemotron Nano)

REVIEW-Modus

Kapitel
    ↓
Review0
(Nemotron Nano)
    ↓
Review1
(Qwen)
    ↓
Review2
(Gemma)
    ↓
Merge
(Nemotron Cascade)
    ↓
Memory

Modellrollen

Rolle Modell Aufgabe
Writer Mistral Small 3.2 Kreative Texterstellung
Review0 Nemotron Nano Schnelle Vorprüfung
Review1 Qwen 3.5 Struktur, Logik, Lore
Review2 Gemma 4 Stil und Konsistenz
Merge Nemotron Cascade 2 Konsolidierung
Memory Nemotron Nano Wissensextraktion

 

Memory-System

Für jedes Kapitel werden erzeugt:

  • Zusammenfassungen
  • Charakterdaten
  • Orte
  • Fraktionen
  • Ereignisse
  • Regeln
  • Zeitachsen
  • Embeddings

Workflow:

Kapitel
   ↓
Analyse
   ↓
Zusammenfassung
   ↓
Metadaten
   ↓
Embedding
   ↓
Memory

Batch-Review-System

Später wurde die Architektur erweitert:

Kapitel 1..N
      ↓
Mistral Review
Qwen Review
Gemma Review
      ↓
Kapitel-Merge
      ↓
Globaler Merge
      ↓
Memory Update

Dadurch konnten komplette Werke analysiert werden, bevor gezielte Überarbeitungen erfolgten.

Erkenntnisse

Es zeigte sich, dass:

  • kleine Spezialmodelle oft effizienter arbeiten als große Universalmodelle,
  • unterschiedliche Modellfamilien systematische Fehler reduzieren,
  • ein gutes Merge-Modell wichtiger ist als ein sehr großes Schreibmodell,
  • Analyse und Schreiben getrennt werden sollten.

Ergebnis

Erreicht wurden:

  • lokale Multi-Agent-Pipeline,
  • persistentes Memory,
  • Batch-Review,
  • iterative Überarbeitung,
  • automatische Qualitätskontrolle,
  • Wiederaufnahme unterbrochener Läufe,
  • modulare Rollenarchitektur.

Sichtbar im Bild unten ist ein Sinnbild für diese Pipeline.