community

Dewey: Dokumente semantisch durchsuchen, AI-Antworten mit Zitaten

31. März 2026 um 17:39Aktualisiert: 31. März1 Quellen

TL;DR

Dewey ist ein RAG-Framework, das Dokumente nicht als flache Absatz-Sammlung behandelt, sondern Dokumente, Abschnitte und Chunks als eigenständige API-Primitive modelliert. Ein 'Section Manifest' liefert die vollständige Überschriften-Hierarchie mit Byte-Offsets – Agents können so günstig die Struktur scannen, bevor sie teure Chunk-Abrufe starten. Der /research-Endpunkt führt einen Agenten aus, der Multi-Hop-Reasoning über mehrere Dokumente ermöglicht – also das Verknüpfen von Ergebnissen über Paper-Grenzen hinweg.

Nauti's Take

Der Kern-Insight ist nicht neu – die RAG-Community diskutiert hierarchisches Chunking seit mindestens 2023 – aber Dewey liefert ihn als saubere API statt als Forschungs-Proof-of-Concept. Das ist der entscheidende Schritt.

Besonders das Section Manifest als Scan-Layer vor dem eigentlichen Retrieval erinnert an klassische Datenbank-Indizes: erst den Index befragen, dann die Zeilen laden. Dass /research einen echten Agenten-Loop fährt statt nur Top-k zurückzugeben, ist ambitioniert – die Qualität hängt aber stark davon ab, wie gut das Dokument ursprünglich strukturiert ist.

Schlecht OCR-te PDFs oder Dokumente ohne konsistente Überschriften werden das System schnell an seine Grenzen bringen.

Einordnunganzeigen

Flaches Chunking ist der blinde Fleck der meisten RAG-Implementierungen: Wer ein PDF wie eine Datenbank-Tabelle behandelt, verliert die semantische Hierarchie, die wissenschaftliche Texte erst nutzbar macht. Deweys Ansatz, Dokumentstruktur als API-Primitive zu exponieren, ist konzeptuell näher an dem, wie Menschen Literatur recherchieren – Inhaltsverzeichnis überfliegen, relevante Abschnitte auswählen, dann lesen. Für Teams, die ernsthaft über wissenschaftliche Korpora arbeiten, kann die Kombinationaus günstigem Struktur-Scan und zitierfähigen Antworten den Unterschied zwischen brauchbarem und unbrauchbarem Retrieval bedeuten.

Quellen

31.3.26

Show HN: Dewey – Ingest docs, search semantically, get cited AI answers

#agents #reasoning

TL;DR

Nauti's Take

Quellen

Ähnliche Stories

Beiträge aus dem Newsletter