Was ist Hindsight? Link zu Überschrift
Hindsight ist ein Open-Source Knowledge Graph von Vectorize.io, der als persönliches Wissensmanagement-System fungiert. Im Kern speichert Hindsight Informationen als verknüpfte Fakten in einem Graphen, reichert sie mit Embeddings an und macht sie über eine LLM-gestützte API durchsuchbar. Man kann es sich als ein „Second Brain" vorstellen – ein System, das Wissen aufnimmt, verknüpft und bei Bedarf wieder abrufbar macht.
Was mich an Hindsight besonders angesprochen hat: Es lässt sich komplett self-hosted betreiben, bringt ein MCP-Tool (sync_retain) für die Integration mit AI-Coding-Agents mit, und die Daten bleiben vollständig unter eigener Kontrolle.
Mein Setup Link zu Überschrift
Mein Hindsight-Deployment läuft auf einem Hetzner-Server und wird komplett über Docker Compose orchestriert. Die Architektur besteht aus vier Containern:
Architektur-Überblick Link zu Überschrift
┌─────────────────────────────────────────────────┐
│ Internet │
└──────────────────────┬──────────────────────────┘
│
┌────────▼────────┐
│ Traefik v2.11 │
│ (Reverse Proxy)│
│ Let's Encrypt │
└───┬─────────┬───┘
│ │
┌────────────▼──┐ ┌──▼────────────┐
│ Hindsight │ │ Auth │
│ v0.5.0 │ │ (ForwardAuth) │
│ Port 9999/ │ └───────────────┘
│ 8888 │
└───────┬───────┘
│
┌───────▼───────┐
│ PostgreSQL │
│ pgvector:pg15│
│ (ext. Volume)│
└───────────────┘
Die Komponenten im Detail Link zu Überschrift
| Komponente | Details |
|---|---|
| Hindsight | ghcr.io/vectorize-io/hindsight:0.5.0 – Image-Tag fest gepinnt |
| Datenbank | pgvector/pgvector:pg15 mit externem Volume pgdata |
| Reverse Proxy | Traefik v2.11 mit automatischen Let’s Encrypt TLS-Zertifikaten |
| Authentifizierung | Basic Auth für die Control Plane (Port 9999), Bearer Token ForwardAuth für die API (Port 8888) |
LLM & Retrieval-Konfiguration Link zu Überschrift
Für die LLM-Anbindung nutze ich Gemini 2.5 Flash – ein guter Kompromiss aus Geschwindigkeit und Qualität. Die Embeddings und der Reranker laufen komplett lokal, was die Abhängigkeit von externen APIs reduziert und die Datensouveränität erhöht.
Der Graph Retriever ist auf link_expansion eingestellt – seit Version 0.5.0 die einzige verfügbare Option, nachdem BFS und MPFP entfernt wurden. In der Praxis liefert Link Expansion gute Ergebnisse beim Traversieren verknüpfter Fakten.
Update-Erfahrung: v0.4.22 → v0.5.0 Link zu Überschrift
Am 9. April 2026 habe ich das Update von v0.4.22 auf v0.5.0 durchgeführt. Mein Update-Prozess sieht dabei wie folgt aus:
- Image-Tag anpassen – von
:latestauf den gepinnten Tagghcr.io/vectorize-io/hindsight:0.5.0 - Neues Image pullen
- Datenbank-Backup erstellen – als Vorsichtsmaßnahme (in meinem Fall ein 1,4 MB großes
backup_pre_v0.5.0_.sql.gz) - docker-compose.yml auf den Server kopieren
- Nur den Hindsight-Container neu starten
- Logs prüfen
- Health-Check über die API durchführen
Das Ergebnis: Keine Fehler. Die Datenbank-Migration lief vollautomatisch beim Container-Start, und der Health-Check war sofort grün. Die gesamte Ausfallzeit betrug etwa 30 Sekunden.
Was v0.5.0 mitbringt Link zu Überschrift
Die neue Version hat einige spannende Features:
- 3-Phasen Retain Pipeline – verbesserte Verarbeitung beim Speichern neuer Fakten
- Constellation View – eine neue Visualisierung des Knowledge Graphs
- Bank Template Import/Export – Templates für wiederkehrende Wissensstrukturen
sync_retainMCP Tool – Integration mit AI-Coding-Agents wie Pi- OpenRouter Support – zusätzliche LLM-Provider-Optionen
- Google Embeddings/Reranker Support – native Unterstützung für Google-Modelle
Gleichzeitig wurde aufgeräumt: Die BFS- und MPFP-Graph-Retrieval-Methoden wurden entfernt (Link Expansion ist nun der Standard), und die Hindsight-Hermes-Integration wurde ebenfalls gestrichen.
Tipps für das eigene Setup Link zu Überschrift
Ein paar Learnings aus meiner Erfahrung:
Image-Tags pinnen Link zu Überschrift
Ich empfehle, den Image-Tag in der docker-compose.yml immer fest zu pinnen statt :latest zu verwenden. So hat man volle Kontrolle über Updates und kann bei Problemen einfach zurückrollen.
Backups vor Updates Link zu Überschrift
Ein pg_dump vor jedem Update dauert nur Sekunden und kann im Ernstfall viel Ärger ersparen. Bei mir liegt das Backup direkt im Deployment-Verzeichnis.
Authentifizierung absichern Link zu Überschrift
Das zweistufige Auth-Konzept mit Basic Auth für die Admin-Oberfläche und Bearer Token ForwardAuth für die API hat sich bewährt. Die Control Plane sollte auf keinen Fall ohne Schutz erreichbar sein.
Lokale Embeddings Link zu Überschrift
Wer die Daten lieber unter eigener Kontrolle behält, sollte Embeddings und Reranker lokal laufen lassen. Die Performance ist auf einem dedizierten Server völlig ausreichend.
Fazit Link zu Überschrift
Hindsight hat sich für mich als solides Werkzeug für persönliches Wissensmanagement etabliert. Das Self-Hosting via Docker Compose ist unkompliziert, Updates verlaufen sauber, und die Integration mit AI-Tools über MCP macht das System im Alltag praktisch nutzbar. Wer nach einer Alternative zu kommerziellen „Second Brain"-Lösungen sucht und seine Daten selbst hosten möchte, sollte Hindsight definitiv einen Blick wert sein.
Links: