Seite 4 von 6
Phase 3: Entwicklung einer lokalen Multi-Model-Schreibpipeline
Problemstellung
Einzelne Sprachmodelle zeigten bei längeren Projekten erhebliche Schwächen:
- Stilbrüche,
- Inkonsistenzen,
- Plotfehler,
- Lore-Verlust,
- hohe Rechenkosten.
Es wurde daher eine rollenbasierte Multi-Agent-Architektur entwickelt.
Ziele
Funktional
- Trennung von Schreiben und Review
- Persistentes Memory
- Iterative Verbesserung
- Unterstützung großer Projekte
Technisch
- Vollständig lokal
- Modulare Architektur
- Austauschbare Modelle
- Hohe Skalierbarkeit
- Robuste Wiederaufnahme
Erste Implementierung: Python-Pipeline
Die erste Version entstand als lineare Python-Pipeline.
WRITE-Modus
Idee
↓
Writer
(Mistral Small 3.2)
↓
Review
↓
Merge
(Nemotron Cascade)
↓
Memory
(Nemotron Nano)
REVIEW-Modus
Kapitel
↓
Review0
(Nemotron Nano)
↓
Review1
(Qwen)
↓
Review2
(Gemma)
↓
Merge
(Nemotron Cascade)
↓
Memory
Modellrollen
| Rolle | Modell | Aufgabe |
|---|---|---|
| Writer | Mistral Small 3.2 | Kreative Texterstellung |
| Review0 | Nemotron Nano | Schnelle Vorprüfung |
| Review1 | Qwen 3.5 | Struktur, Logik, Lore |
| Review2 | Gemma 4 | Stil und Konsistenz |
| Merge | Nemotron Cascade 2 | Konsolidierung |
| Memory | Nemotron Nano | Wissensextraktion |
Memory-System
Für jedes Kapitel werden erzeugt:
- Zusammenfassungen
- Charakterdaten
- Orte
- Fraktionen
- Ereignisse
- Regeln
- Zeitachsen
- Embeddings
Workflow:
Kapitel
↓
Analyse
↓
Zusammenfassung
↓
Metadaten
↓
Embedding
↓
Memory
Batch-Review-System
Später wurde die Architektur erweitert:
Kapitel 1..N
↓
Mistral Review
Qwen Review
Gemma Review
↓
Kapitel-Merge
↓
Globaler Merge
↓
Memory Update
Dadurch konnten komplette Werke analysiert werden, bevor gezielte Überarbeitungen erfolgten.
Erkenntnisse
Es zeigte sich, dass:
- kleine Spezialmodelle oft effizienter arbeiten als große Universalmodelle,
- unterschiedliche Modellfamilien systematische Fehler reduzieren,
- ein gutes Merge-Modell wichtiger ist als ein sehr großes Schreibmodell,
- Analyse und Schreiben getrennt werden sollten.
Ergebnis
Erreicht wurden:
- lokale Multi-Agent-Pipeline,
- persistentes Memory,
- Batch-Review,
- iterative Überarbeitung,
- automatische Qualitätskontrolle,
- Wiederaufnahme unterbrochener Läufe,
- modulare Rollenarchitektur.
Sichtbar im Bild unten ist ein Sinnbild für diese Pipeline.