GitHub Hemen Kur

Yerel RAG

Bir klasoru indeksle, embedding cache ile sor; veriler senin makinende kalir.

Hizli kullanim

/rag index ~/projects/docs
/rag ask ~/projects/docs "auth modulu nasil refresh tokeni dogruluyor?"

Indeksleme nasil calisir?

Klasor recursive taranir; .gitignore ve node_modules gibi yaygin dizinler atlanir.
Dosyalar token bazli chunk\'lara bolunur (varsayilan 800 token, 80 overlap).
Hibrid embedding hesaplanir:
- Hosted: aktif saglayicinin embedding modeli (orn. text-embedding-3-small).
- Yerel: onnx-mini-lm modeli (saglayici ariza durumunda).
Embeddings + meta-veri JSON dosyasinda cache\'lenir: ~/.nexvexa-agent/rag/<hash>.json.

Sorgulama

Soru gelir, embedding hesaplanir, en yakin k chunk getirilir, model context\'ine eklenir. Default k=8.

/rag ask ./docs "deploy.sh hangi env degerlerini bekliyor?"

Indeksleme durumu

/rag list                 # indekslenen klasorler
/rag info ./docs          # chunk sayisi, dosya sayisi, son guncelleme
/rag rebuild ./docs       # zorla yeniden indeksle

Sinirlar

Cok buyuk projelerde ilk indeksleme zaman alabilir; embedding cache\'i ikinci sefer hizli yapar.
Imaj/binary dosyalar atlanir.
Saglayici embedding API\'si yoksa yerel ONNX kullanilir; kalite biraz dusuk olabilir.