Vector Database
Vektör veritabanı, yüksek boyutlu gömme vektörlerini benzerlik arama algoritmalarıyla indeksleme, saklama ve sorgulama için optimize edilmiş özelleşmiş bir veri deposudur.
What Is Vector Database?
Vektör veritabanı, yapay zeka modelleri tarafından üretilen sayısal gömmeler olan yüksek boyutlu vektör verilerini işlemek için özel olarak tasarlanmış bir veri depolama ve getirme sistemidir. Yapılandırılmış alanlar üzerinde tam eşleşmelerle kayıtları bulan geleneksel veritabanlarının aksine, vektör veritabanları benzerlikle bulur: bir sorgu vektörü verildiğinde, yüksek boyutlu uzayda ona en yakın vektörleri döndürür. Yaklaşık En Yakın Komşu (ANN) araması olarak adlandırılan bu işlem, anlamsal arama, öneri sistemleri ve RAG'ın temelidir. Vektör veritabanı ekosistemi özel çözümler (Pinecone, Weaviate, Qdrant, Milvus, Chroma) ve mevcut veritabanlarına eklentiler (PostgreSQL için pgvector, MongoDB için Atlas Vector Search) içerir.
How Vector Database Works
Vektör veritabanı iki temel işlemi yönetir: indeksleme ve sorgulama. İndeksleme sırasında gömme vektörleri meta verileri ve orijinal metinleriyle birlikte veritabanına eklenir. Veritabanı verimli benzerlik araması için bir indeks yapısı oluşturur. HNSW, en popüler algoritmalardan biridir ve her düğümün bir vektör, kenarların yakın vektörleri bağladığı çok katmanlı bir graf oluşturur. Sorgulama sırasında bir arama vektörü sağlanır ve indeks yaklaşık en yakın komşuları bulmak için grafı hızlıca gezinir.
Why Vector Database Matters
Vektör veritabanları, RAG'ı ölçeklenebilir ve hızlı kılan kritik altyapı bileşenidir. Verimli bir vektör veritabanı olmadan her kullanıcı sorgusu, sorgu gömmesini bilgi tabanındaki her parçayla karşılaştırmayı gerektirir — bilgi tabanı birkaç bin parçanın ötesine büyüdüğünde imkansız derecede yavaşlayan bir işlem. Vektör veritabanıyla getirme, bilgi tabanı boyutundan bağımsız olarak hızlı kalır ve milyonlarca indeksli parçayla bile gerçek zamanlı konuşma deneyimleri sağlar.
How Chatloom Uses Vector Database
Chatloom, vektör veritabanı olarak PostgreSQL vektör eklentisi pgvector'u kullanır. Bu seçim, vektör aramasını doğrudan ilişkisel veri modeliyle entegre ederek Chatloom'un gömmeleri parça meta verileri, belge referansları ve ajan yapılandırmasıyla birlikte ek altyapı gerektirmeden tek bir veritabanında saklamasına olanak tanır. Chatloom vektör aramayı, Karşılıklı Sıralama Birleştirmesiyle her iki yaklaşımı birleştirerek GIN indeksli tsvector sütunuyla seyrek anahtar kelime aramasıyla tamamlar.
Related Terms
Explore related concepts to deepen your understanding.
Frequently Asked Questions
- Chatbot'um için ayrı bir vektör veritabanına ihtiyacım var mı?
- Zorunlu değil. pgvector gibi eklentiler PostgreSQL'e vektör yetenekleri ekler ve ayrı bir hizmet çalıştırmadan gömmelerinizi diğer verilerinizle birlikte saklayabilirsiniz. Pinecone ve Weaviate gibi özel çözümler büyük ölçekli uygulamalar için daha gelişmiş özellikler sunar.
- Vektör veritabanı ne kadar veri işleyebilir?
- Modern vektör veritabanları milyonlardan milyarlarca vektöre kadar işleyebilir. pgvector birkaç milyon parçaya kadar bilgi tabanları için iyi çalışır. Çoğu chatbot bilgi tabanı binlerce ile on binlerce parça içerir, herhangi bir vektör veritabanının kapasitesi dahilindedir.
- Yaklaşık En Yakın Komşu araması nedir?
- ANN algoritmaları, sorgu vektörüne tam olarak değil yaklaşık olarak en yakın vektörleri bulur. Bu yaklaşıklık, milisaniyelerin altında arama hızı sağlar — brute-force aramaya kıyasla %95-99 hatırlama oranı ile küçük bir doğruluk ödünü karşılığında büyük hız artışı elde edilir.