Skip to content
🔍Retrieval-Augmented Generation (RAG)

Retrieval-Augmented Generation (RAG)

RAG, yanıt üretmeden önce bir bilgi tabanından ilgili belgeleri getiren ve böylece LLM çıktısını doğrulanmış gerçeklere dayandıran bir yapay zeka mimarisidir.

What Is Retrieval-Augmented Generation (RAG)?

Retrieval-Augmented Generation, yaygın adıyla RAG, büyük dil modeli (LLM) yanıtlarını harici bir bilgi tabanından ilgili bilgileri önce getirip ardından bu bağlamı kullanarak yanıt üreterek geliştiren bir yapay zeka mimari kalıbıdır. Modelin yalnızca ön eğitim sırasında öğrendiği kalıplara güvenmek yerine, RAG üretim sürecine gerçek ve güncel verileri enjekte ederek doğruluğu önemli ölçüde artırır ve LLM'lerin bilgi uydurma eğilimini azaltır. Kavram, Meta AI araştırmacıları tarafından 2020'de tanıtılmış ve o zamandan bu yana üretim düzeyinde yapay zeka chatbot'ları ve soru-cevap sistemleri oluşturmak için baskın paradigma haline gelmiştir. Bir RAG hattında kullanıcı sorgusu önce bir gömme modeli aracılığıyla sayısal vektöre dönüştürülür, ardından vektör veritabanında önceden indekslenmiş belge parçalarıyla eşleştirilir. En iyi eşleşen parçalar, orijinal sorguyla birlikte LLM istemine ek bağlam olarak aktarılır ve model, bu belirli pasajlara dayalı bir yanıt sentezler. Bu sayede yapay zeka gerçek kaynaklara atıfta bulunabilir, yeniden eğitim gerektirmeden güncel kalabilir ve ön eğitim sırasında hiç görmediği özel veriler hakkındaki soruları yanıtlayabilir.

How Retrieval-Augmented Generation (RAG) Works

Bir RAG hattının üç temel aşaması vardır. İlk olarak, besleme aşamasında PDF'ler, web sayfaları veya yardım makaleleri gibi belgeler, her biri genellikle 200 ile 1000 token arasında olan daha küçük parçalara bölünür ve her parça, OpenAI text-embedding-3-small veya Voyage AI gibi bir model kullanılarak yoğun vektör gömmesine dönüştürülür. Bu gömmeler, her parçanın anlamsal anlamını yakalar ve orijinal metinle birlikte vektör veritabanında saklanır. İkinci olarak, sorgu anında kullanıcı mesajı aynı modelle gömülür ve benzerlik araması en alakalı parçaları getirir. Modern sistemler, her iki yaklaşımın en iyisini elde etmek için yoğun vektör aramasını seyrek anahtar kelime eşleştirmesiyle (BM25) Karşılıklı Sıralama Birleştirmesi (RRF) kullanarak kombine eder; bu teknik hibrit arama olarak bilinir. Bir çapraz kodlayıcı yeniden sıralayıcı, hassasiyet için sonuçları yeniden düzenleyebilir. Üçüncü olarak, getirilen parçalar LLM sistem istemine bağlam olarak enjekte edilir ve model, bu pasajlara doğrudan dayalı bir yanıt üretir. Güvenilirlik puanlama, getirilen bağlamın sorguyu yeterince kapsayıp kapsamadığını değerlendirir ve kapsamıyorsa sistem, halüsinasyon yapmak yerine kibarca geri çekilebilir.

Why Retrieval-Augmented Generation (RAG) Matters

Yapay zeka chatbot'ları dağıtan işletmeler için RAG, yardımcı bir asistan ile bir sorumluluk arasındaki farktır. RAG olmadan bir LLM yalnızca ön eğitim verilerine başvurabilir; bu veriler güncel olmayabilir, genel olabilir veya belirli bir şirketle tamamen ilgisiz olabilir. RAG, chatbot'un gerçek belgelerinizi kullanarak ürünleriniz, politikalarınız ve prosedürleriniz hakkındaki soruları yanıtlamasına olanak tanır. Bu, daha yüksek ilk temas çözüm oranları, daha az insan temsilciye yönlendirme ve önemli ölçüde daha fazla müşteri güveni anlamına gelir. RAG ayrıca içeriğiniz her değiştiğinde pahalı ince ayar döngülerini ortadan kaldırır: bilgi tabanını güncellediğinizde chatbot hemen yeni bilgileri yansıtır. Sağlık, finans veya hukuk gibi düzenlemeli sektörler için her yanıtı belirli bir kaynak belgeye kadar izleyebilme yeteneği, uyumluluk ve denetim izleri açısından zorunludur.

How Chatloom Uses Retrieval-Augmented Generation (RAG)

RAG, Chatloom yapay zeka motorunun temel mimarisidir. Bir Chatloom ajanını web sitesi içeriğiniz, PDF'ler veya özel metinlerle eğittiğinizde, bu içerik parçalama, gömme oluşturma ve vektörleri pgvector veritabanında saklama işlemlerini gerçekleştiren bir besleme hattından geçer. Sorgu anında Chatloom hibrit arama (yoğun artı seyrek, RRF birleştirmesiyle), Cohere aracılığıyla çapraz kodlayıcı yeniden sıralama ve chatbot'un yalnızca sağlam temele sahip olduğunda yanıt vermesini sağlayan dört seviyeli güvenilirlik puanlama sistemi (yüksek, orta, düşük, yok) uygular. Güvenilirlik düşükse Chatloom, tahmin yürütmek yerine dürüst bir "bu konuda yeterli bilgim yok" yanıtı verir. Bu hattın her adımı, Chatloom'un yerleşik RAG metrikleri panosu aracılığıyla gözlemlenebilir olup getirme gecikmesi, benzerlik puanları ve bilgi boşlukları hakkında tam görünürlük sağlar.

Related Terms

Explore related concepts to deepen your understanding.

Frequently Asked Questions

RAG ile ince ayar (fine-tuning) arasındaki fark nedir?
İnce ayar, modelin dahili ağırlıklarını ek verilerle eğiterek değiştirir; bu pahalıdır ve statik bir anlık görüntü oluşturur. RAG ise temel modeli değiştirmeden bırakır ve bunun yerine sorgu anında harici bir bilgi tabanından ilgili bilgileri getirir. Bu, RAG'ı çok daha esnek kılar: yeniden eğitim gerektirmeden içeriğinizi anında güncelleyebilir ve aynı temel model, bilgi tabanını değiştirerek farklı bilgi alanlarına hizmet edebilir.
RAG, yapay zeka halüsinasyonlarını tamamen ortadan kaldırır mı?
RAG, yanıtları getirilen belgelere dayandırarak halüsinasyonları önemli ölçüde azaltır ancak tamamen ortadan kaldırmaz. Model yine de getirilen bağlamı yanlış yorumlayabilir veya açıkça belirtilmeyen mantıklı görünen bağlantılar üretebilir. Yüksek kaliteli uygulamalar, düşük kaliteli getirmeleri tespit etmek ve tahmin yürütmek yerine yanıt vermeyi reddetmek için güvenilirlik puanlaması ekler; bu, Chatloom'un kullandığı yaklaşımdır.
RAG bilgi tabanında ne tür belgeler kullanılabilir?
Çoğu RAG sistemi PDF'ler, web sayfaları, düz metin dosyaları, Word belgeleri ve CSV veya JSON gibi yapılandırılmış veriler dahil geniş bir belge formatı yelpazesini destekler. Temel gereksinim, içeriğin metin olarak çıkarılabilmesi ve anlamlı parçalara bölünebilmesidir. Chatloom; URL tarama, doğrudan PDF yükleme ve manuel metin girişini destekler.

Related Resources

Chatbot bakımını bırakın. Bir AI agent yayınlayın.

İlk agent'ınızı

bir saatten kısa sürede inşa edin.

Bir şablon seçin, içeriğinizi bağlayın ve her kanalda yayınlayın. Ücretsiz planınız hazır olduğunuzda sizi bekliyor.

Sonsuza dek ücretsiz plan
Kredi kartı gerekmez
Bir saatten kısa sürede üretime hazır

    Gizlilik tercihlerin

    Chatloom'un çalışması ve ürünümüzü geliştirmek için çerezler kullanıyoruz. İsteğe bağlı analiz ve pazarlama verilerinin kullanımını yönet.

    RAG Nedir? Getirme-Destekli Üretim Açıklaması - Chatloom