Yerel RAG
Bir klasoru indeksle, embedding cache ile sor; veriler senin makinende kalir.
Hizli kullanim
/rag index ~/projects/docs
/rag ask ~/projects/docs "auth modulu nasil refresh tokeni dogruluyor?"
Indeksleme nasil calisir?
- Klasor recursive taranir;
.gitignorevenode_modulesgibi yaygin dizinler atlanir. - Dosyalar token bazli chunk\'lara bolunur (varsayilan 800 token, 80 overlap).
- Hibrid embedding hesaplanir:
- Hosted: aktif saglayicinin embedding modeli (orn.
text-embedding-3-small). - Yerel:
onnx-mini-lmmodeli (saglayici ariza durumunda).
- Hosted: aktif saglayicinin embedding modeli (orn.
- Embeddings + meta-veri JSON dosyasinda cache\'lenir:
~/.nexvexa-agent/rag/<hash>.json.
Sorgulama
Soru gelir, embedding hesaplanir, en yakin k chunk getirilir, model context\'ine eklenir. Default k=8.
/rag ask ./docs "deploy.sh hangi env degerlerini bekliyor?"
Indeksleme durumu
/rag list # indekslenen klasorler
/rag info ./docs # chunk sayisi, dosya sayisi, son guncelleme
/rag rebuild ./docs # zorla yeniden indeksle
Sinirlar
- Cok buyuk projelerde ilk indeksleme zaman alabilir; embedding cache\'i ikinci sefer hizli yapar.
- Imaj/binary dosyalar atlanir.
- Saglayici embedding API\'si yoksa yerel ONNX kullanilir; kalite biraz dusuk olabilir.