Embedding (AI)
Yapay zeka gömmesi, bir metin parçasının anlamsal anlamını temsil eden yoğun sayısal vektördür ve kavramların matematiksel karşılaştırılmasına olanak tanır.
What Is Embedding (AI)?
Yapay zekada gömme, bir içerik parçasının — genellikle metin olmak üzere görsel, ses veya yapılandırılmış veri de olabilir — anlamsal anlamını temsil eden yoğun sayısal vektördür (tipik olarak 256 ile 3072 boyut arasında kayan nokta sayıları dizisi). Gömmelerin ardındaki temel içgörü, anlamın geometrik uzaya eşlenebilmesidir: benzer anlamlı metinler yakın vektörlerle, ilişkisiz metinler uzak vektörlerle temsil edilir. "Şifremi nasıl sıfırlarım?" ve "Giriş bilgilerimi unuttum" cümleleri, az ortak kelime paylaşmalarına rağmen çok benzer gömme vektörlerine sahip olacaktır çünkü aynı temel anlamı ifade ederler. OpenAI text-embedding-3-small, Cohere embed-v3 ve Voyage AI gibi gömme modelleri, eş anlamlılar, açıklamalar, kavramsal hiyerarşiler ve bağlamsal anlam dahil nüanslı anlamsal ilişkileri yakalayarak bu temsilleri dev metin külliyatlarında eğiterek öğrenir.
How Embedding (AI) Works
Gömme üretimi, metni eğitilmiş bir sinir ağından (tipik olarak transformer kodlayıcı) geçirerek girdiyi sabit uzunluklu bir vektöre sıkıştırarak çalışır. Eğitim sırasında model, kontrastif öğrenme yoluyla anlamsal olarak benzer metinleri vektör uzayında birbirine yakın konumlandırmayı öğrenir. RAG hattında gömmeler iki amaca hizmet eder: besleme sırasında her belge parçası gömülür ve saklanır; getirme sırasında kullanıcının sorgusu aynı modelle gömülür ve en yakın parçalar benzerlik aramasıyla bulunur.
Why Embedding (AI) Matters
Gömmeler, anlamsal aramayı — tam anahtar kelime eşleşmeleri yerine anlama dayalı ilgili bilgi bulma yeteneğini — mümkün kılan şeydir. Müşteriler belgelerinizdeki terminolojiyi nadiren kullanır. "Paramı geri alabilir miyim" diye sorabilirler; belgenizde ise "iade uygunluk kriterleri" yazmaktadır. Gömme tabanlı arama bu anlamsal eşdeğerliği tanır.
How Chatloom Uses Embedding (AI)
Chatloom, RAG getirme hattını güçlendirmek için gömme modellerini (OpenAI text-embedding-3-small ve Voyage AI arasında yapılandırılabilir) kullanır. Bilgi tabanı beslenmesi sırasında her belge parçası gömülür ve kosinüs benzerlik araması için pgvector veritabanında saklanır. Sorgu anında kullanıcı mesajı aynı modelle gömülür ve hibrit arama, maksimum kapsama için yoğun vektör benzerliğini seyrek anahtar kelime eşleştirmesiyle birleştirir.
Related Terms
Explore related concepts to deepen your understanding.
Frequently Asked Questions
- Gömmeler ile anahtar kelimeler arasındaki fark nedir?
- Anahtar kelimeler tam metin eşleşmeleridir. Gömmeler anlamsal anlamı sayısal vektörler olarak yakalar ve ortak kelime paylaşmayan ancak ilişkili kavramlar ifade eden metinler arasında benzerlik karşılaştırması sağlar. "Otomobil" ve "araba" anahtar kelime örtüşmesi olmasa da neredeyse aynı gömmelere sahiptir.
- Gömmeler kaç boyuta sahiptir?
- Yaygın gömme modelleri 256 ile 3072 boyut arasında vektörler üretir. OpenAI text-embedding-3-small varsayılan olarak 1536 boyut kullanır. Daha yüksek boyutlar daha fazla nüans yakalayabilir ancak daha fazla depolama ve hesaplama gerektirir.
- Farklı diller için aynı gömme modelini kullanabilir miyim?
- Evet, modern gömme modelleri çok dillidir. Farklı dillerdeki metinleri aynı vektör uzayına gömebilirler, yani İspanyolca bir soru İngilizce yanıtıyla benzer olacaktır. Bu, çok dilli chatbot dağıtımları için önemli bir avantaj olan diller arası getirmeyi mümkün kılar.