Hybrid Search
Hibrit arama, yoğun vektör aramasını (anlamsal benzerlik) seyrek anahtar kelime aramasıyla (tam eşleştirme) birleştirerek daha doğru ve kapsamlı getirme sonuçları sunar.
What Is Hybrid Search?
Hibrit arama, temelde farklı iki arama paradigmasını — yoğun vektör arama ve seyrek anahtar kelime arama — tek başına her iki yaklaşımdan daha iyi doğruluk elde etmek için birleştiren bir getirme stratejisidir. Yoğun arama anlamsal olarak benzer içeriği bulmak için yapay zeka gömmelerini kullanır. Seyrek arama ise tam sorgu terimlerini içeren belgeleri bulmak için BM25 gibi geleneksel anahtar kelime eşleştirme algoritmaları kullanır ve belirli isimlerde, kodlarda ve teknik terminolojide üstündür. Hibrit arama her iki aramayı paralel olarak çalıştırır ve sonuçları tipik olarak Karşılıklı Sıralama Birleştirmesi (RRF) kullanarak birleştirir.
How Hybrid Search Works
Hibrit arama paralel getirme ve birleştirme hattıyla çalışır. Sorgu geldiğinde iki yoldan eşzamanlı olarak işlenir. Yoğun yol sorguyu gömer ve en benzer parçaları getirir. Seyrek yol anahtar kelime eşleştirmesi yapar. İki sıralı liste RRF ile birleştirilir ve her iki listede de görünen sonuçlar doğal olarak yükseltilir.
Why Hybrid Search Matters
Tek modlu arama, doğrudan chatbot doğruluğunu etkileyen kör noktalar oluşturur. Saf vektör arama belirli ürün adları veya hata kodları hakkındaki sorguları kaçırabilir. Saf anahtar kelime arama anlamsal olarak eşdeğer ama leksikal olarak farklı sorguları kaçırır. Hibrit arama her ikisini de sorunsuz şekilde ele alarak tek başına her iki yönteme kıyasla getirme hatırlamasını %10-30 artırır.
How Chatloom Uses Hybrid Search
Hibrit arama Chatloom'un RAG hattının temel bileşenidir. Sistem her bilgi tabanı parçası için hem yoğun vektör gömmelerini (pgvector'da) hem de seyrek anahtar kelime indekslerini (GIN indeksli PostgreSQL tsvector) saklar. Sorgu anında her iki arama paralel çalışır ve sonuçlar özel rrf_score() veritabanı fonksiyonu aracılığıyla Karşılıklı Sıralama Birleştirmesiyle birleştirilir.
Related Terms
Explore related concepts to deepen your understanding.
Frequently Asked Questions
- Karşılıklı Sıralama Birleştirmesi nedir?
- RRF, birden fazla sıralı listeyi tek bir sıralı listede birleştiren bir algoritmadır. Her sonuç için sıra pozisyonuna dayalı puan hesaplar: 1/(k+sıra). Birden fazla listede görünen sonuçlar her birinden puan biriktirir.
- Hibrit arama tek modlu aramadan yavaş mı?
- Gecikme artışı minimumdur çünkü yoğun ve seyrek aramalar sıralı değil paralel çalışır. Pratikte hibrit arama yalnızca yoğun aramaya kıyasla 5-15 milisaniye ekler.
- Hibrit arama ne zaman yalnızca vektör aramasından daha iyidir?
- Bilgi tabanınız belirli tanımlayıcılar (ürün kodları, hata numaraları, özel isimler), teknik terminoloji veya tam anahtar kelime eşleşmelerinin önemli olduğu içerik barındırdığında hibrit arama özellikle avantajlıdır.