English: Diagram illustrating the two-phase process for document retrieval using dense embeddings.
Indexing Phase:
Documents are transformed into vector representations using dense embeddings.
These vectors are stored in a vector database.
Inference Phase:
The posed question is converted into a query vector using the same embedding technique.
The vector database retrieves the top four most relevant articles by computing the cosine distance between the query vector and stored document vectors.
The content of the selected articles is introduced to the Large Language Model (LLM) as context, together with the original question.
The LLM is then instructed to formulate an answer.
This process ensures efficient and relevant document retrieval based on the semantic content of queries.
Polski: Diagram ilustrujący dwuetapowy proces wyszukiwania dokumentów przy użyciu gęstych osadzeń.
Faza indeksowania:
Dokumenty są przekształcane w reprezentacje wektorowe przy użyciu gęstych osadzeń.
Te wektory są przechowywane w wektorowej bazie danych.
Faza wnioskowania:
Zadane pytanie jest konwertowane na wektor zapytania przy użyciu tej samej techniki osadzania.
Wektorowa baza danych wyszukuje cztery najbardziej odpowiednie artykuły, obliczając odległość kosinusową między wektorem zapytania a przechowywanymi wektorami dokumentów.
Treść wybranych artykułów jest wprowadzana do Dużego Modelu Językowego (LLM) jako kontekst, wraz z oryginalnym pytaniem.
Następnie instruuje się LLM, aby sformułował odpowiedź.
Ten proces gwarantuje efektywne i trafne wyszukiwanie dokumentów na podstawie semantycznej zawartości zapytań.
Українська: Діаграма, яка показує двоетапний процес пошуку документів з використанням щільних вкладень.
Етап індексування:
Документи перетворюють на векторні подання з використанням щільних вкладень.
Ці вектори зберігають у векторній базі даних.
Етап висновування:
Задане питання перетворюють на вектор запиту з використання того же щільного подання.
Векторна база даних знаходить чотири найвідповідніші позиції, обчислюючи косинусну відстань між вектором запиту та векторами збережених документів.
Вміст обраних позицій пропонується Великій Мовній Моделі (ВММ) як контекст, разом із первинним запитанням.
ВММ відтак кажуть сформулювати відповідь.
Цей процес забезпечує ефективний та доречний пошук документів на основі семантичного вмісту запитів.
da dijelite – da kopirate, distributirate i prenosite djelo
da remiksate – da prilagodite djelo
Pod sljedećim uslovima:
pripisivanje – Morate pripisati odgovarajuće autorske zasluge, osigurati link ka licenci i naznačiti jesu li napravljene izmjene. To možete uraditi na bilo koji razumni način, ali ne tako da se sugerira da davalac licence odobrava Vas ili Vašu upotrebu njegovog djela.
dijeli pod istim uslovima – Ako mijenjate, transformišete ili nadograđujete ovaj materijal, morate ga objaviti i distribuirati samo pod istom ili sličnom licencom poput ove.
Ova datoteka sadržava dodatne podatke koje je vjerovatno dodala digitalna kamera ili skener u procesu snimanja, odnosno digitalizacije. Ako je datoteka mijenjana, podaci možda nisu u skladu sa stvarnim stanjem.