Yerel RAG

Bir klasoru indeksle, embedding cache ile sor; veriler senin makinende kalir.

Hizli kullanim

/rag index ~/projects/docs
/rag ask ~/projects/docs "auth modulu nasil refresh tokeni dogruluyor?"

Indeksleme nasil calisir?

  1. Klasor recursive taranir; .gitignore ve node_modules gibi yaygin dizinler atlanir.
  2. Dosyalar token bazli chunk\'lara bolunur (varsayilan 800 token, 80 overlap).
  3. Hibrid embedding hesaplanir:
    • Hosted: aktif saglayicinin embedding modeli (orn. text-embedding-3-small).
    • Yerel: onnx-mini-lm modeli (saglayici ariza durumunda).
  4. Embeddings + meta-veri JSON dosyasinda cache\'lenir: ~/.nexvexa-agent/rag/<hash>.json.

Sorgulama

Soru gelir, embedding hesaplanir, en yakin k chunk getirilir, model context\'ine eklenir. Default k=8.

/rag ask ./docs "deploy.sh hangi env degerlerini bekliyor?"

Indeksleme durumu

/rag list                 # indekslenen klasorler
/rag info ./docs          # chunk sayisi, dosya sayisi, son guncelleme
/rag rebuild ./docs       # zorla yeniden indeksle

Sinirlar

  • Cok buyuk projelerde ilk indeksleme zaman alabilir; embedding cache\'i ikinci sefer hizli yapar.
  • Imaj/binary dosyalar atlanir.
  • Saglayici embedding API\'si yoksa yerel ONNX kullanilir; kalite biraz dusuk olabilir.