Skip to content
Busque para obtener información sobre los productos y soluciones de InterSystems, las oportunidades de carrera y más.
Abstract data representation
Retrieval Augmented Generation (RAG): Co to je a jak předchází chybám AI
Zjistěte, jak Retrieval Augmented Generation (RAG) zvyšuje přesnost umělé inteligence kombinací jazykových modelů s vyhledáváním dat v reálném čase, což přináší revoluci do chatbotů a vyhledávačů.

Retrieval Augmented Generation (RAG) je technika umělé inteligence, která vylepšuje velké jazykové modely (LLM) kombinací jejich inherentních znalostí s vyhledáváním informací v reálném čase z externích databází.

Tento přístup umožňuje generativním modelům umělé inteligence generovat přesnější, aktuálnější a kontextuálně relevantní odpovědi tím, že jejich výstupy jsou podloženy aktuálními a ověřitelnými daty.

S tím, jak se umělá inteligence stále více začleňuje do různých aspektů našeho života, od rozhodování v podnikání až po osobní asistenty, je potřeba aktuálních a přesných informací stále důležitější. rAG řeší tuto potřebu tím, že překlenuje propast mezi rozsáhlými znalostmi jazykových modelů a faktickými informacemi v reálném čase.

Abstract image of binary data emitted from AGI brain.

Klíčové poznatky

  • RAG vylepšuje generativní modely umělé inteligence tím, že kombinuje generování jazyka s vyhledáváním informací v reálném čase, čímž výrazně snižuje počet chyb a halucinací.
  • Tato technika umožňuje systémům umělé inteligence poskytovat aktuální a ověřitelné informace, které jsou klíčové pro zachování důvěry v rozhodování založeném na umělé inteligenci.
  • Implementace RAG zlepšuje výkonnost umělé inteligence v různých aplikacích, od chatbotů a vyhledávačů až po systémy pro zodpovídání otázek a shrnutí textu.

Pochopení RAG

Díky tomu, že reakce umělé inteligence jsou založeny na externích zdrojích dat, řeší RAG klíčová omezení tradičních jazykových modelů, jako jsou zastaralé informace a halucinace. Představte si RAG jako vysoce výkonného výzkumného asistenta. Když je mu položena otázka, nespoléhá se pouze na svou paměť (jako tradiční modely AI), ale aktivně prohledává rozsáhlou knihovnu aktuálních informací, aby poskytl co nejpřesnější a nejrelevantnější odpověď. Tento přístup umožňuje systémům AI sledovat rychle se měnící informace a poskytovat kontextově vhodnější reakce.

Engineer designing AI technology with reflection on eyeglasses

Význam RAG: varovný příběh

Představte si zaneprázdněného manažera, který se připravuje na důležitou schůzku s potenciálním investorem. V časové tísni se obrátí na asistenta s umělou inteligencí, aby na poslední chvíli shromáždil několik informací o jejich oboru. Ptají se: "Jaké bylo tempo růstu odvětví obnovitelných zdrojů energie v loňském roce?" AI sebevědomě odpovídá: "Odvětví obnovitelných zdrojů energie zaznamenalo v loňském roce silný růst o 15,7 %, čímž výrazně předstihlo tradiční zdroje energie." Tento konkrétní údaj na vedoucího pracovníka zapůsobil, a proto jej uvedl ve své prezentaci. Během schůzky však potenciální investor toto číslo zpochybní s tím, že jeho zdroje uvádějí míru růstu pouze 8,3 %.

Tento scénář ilustruje běžný problém tradičních LLM: halucinace. LLM mohou někdy generovat věrohodně znějící, ale nesprávné informace, zejména pokud se jedná o specifické, nedávné nebo rychle se měnící údaje.

Zde se stává klíčovým RAG. Pokud by asistent s umělou inteligencí používal RAG:

  • V průběžně aktualizované databázi by se vyhledávaly nejnovější a nejpřesnější informace o míře růstu obnovitelných zdrojů energie.
  • Pokud nebyl k dispozici přesný údaj, mohl uvést rozmezí na základě více spolehlivých zdrojů nebo výslovně uvést, že nemá k dispozici aktuální údaje.
  • Odpověď mohla obsahovat zdroj informací a datum jejich poslední aktualizace.

Tento příklad podtrhuje, proč je systém RAG tak důležitý:

  1. Zabraňuje dezinformacím: díky tomu, že odpovědi jsou podloženy získatelnými fakty, RAG výrazně snižuje riziko halucinací umělé inteligence
  2. Zachovává důvěru: uživatelé se mohou spolehnout na aktuální a přesné informace, které jsou pro obchodní rozhodování klíčové.
  3. Zajišťuje transparentnost: RAG umožňuje UI uvádět zdroje, což uživatelům umožňuje nezávisle ověřit informace.

S tím, jak se umělá inteligence stále více začleňuje do naší každodenní práce a rozhodovacích procesů, se schopnost poskytovat přesné, aktuální a ověřitelné informace stává nejen užitečnou, ale i nezbytnou. RAG je klíčovou technologií pro dosažení tohoto cíle, která překlenuje propast mezi rozsáhlými znalostmi LLM a potřebou spolehlivých informací v reálném čase.

Female and make programmers training for coding, cyber security or software on computer.

Klíčové složky RAG

Systémy RAG se opírají o několik základních prvků, které společně zajišťují rozšířené možnosti umělé inteligence:

Jazykové modely

Jádrem systémů RAG jsou velké jazykové modely jako GPT-3, GPT-4 a BERT. Tyto sofistikované modely umělé inteligence jsou vyškoleny na obrovském množství textových dat, což jim umožňuje porozumět a generovat reakce podobné lidským.

V rámci RAG jsou zodpovědné za:

  1. Porozumění dotazům uživatelů
  2. Syntéza informací ze získaných dat
  3. Vytváření ucelených a kontextuálně vhodných odpovědí

Databáze a systémy vyhledávání informací

V externích znalostních bázích jsou uloženy strukturované i nestrukturované informace, ke kterým lze rychle přistupovat a vyhledávat je. Tyto databáze mají zásadní význam pro poskytování aktuálních a specifických informací, které nemusí být obsaženy v trénovacích datech jazykového modelu.

Mezi hlavní aspekty patří:

  1. Efektivní ukládání velkých objemů dat
  2. Systémy pro rychlé zpracování a vyhledávání dotazů
  3. Podpora různých typů dat (text, obrázky, metadata)

Systémy pro vyhledávání informací hrají zásadní roli při identifikaci a získávání relevantních dat z těchto databází. Mezi běžné metody vyhledávání patří:

  1. Vyhledávání podle klíčových slov
  2. Vektorové vyhledávání
  3. Sémantické vyhledávání
  4. Algoritmus BM25 pro řazení relevantních dokumentů

Reprezentace vektorů a indexování

"Vektorizace" dat je základem moderních systémů RAG. Jedná se o převod textových dat na číselné vektory, což umožňuje vektorové vyhledávání a efektivní porovnávání podobnosti. Mezi hlavní funkce patří:

  1. Generování vložených dat pomocí předtrénovaných modelů
  2. Techniky redukce dimenzionality pro kompaktní reprezentaci
  3. Míry podobnosti, jako je kosinová podobnost, pro porovnávání vektorů

Vektorová databáze je specializovaný systém určený k efektivnímu ukládání a dotazování těchto vektorových reprezentací. Nabízejí:

  1. Možnost rychlého vyhledávání nejbližších sousedů
  2. Škálovatelnost pro zpracování velkých souborů dat
  3. Podpora složitých operací dotazování

Techniky indexování, jako jsou algoritmy přibližného nejbližšího souseda (ANN), mohou dále zvýšit rychlost a účinnost vyhledávání v systémech RAG.

Emerging Digital Structure - Growing Connection Lines Symbolizing Innovative Artificial Intelligence Or Big Data Models - Technology Background

Jak RAG funguje

Proces RAG zahrnuje několik sofistikovaných kroků k získání dat a vytvoření přesných a kontextuálně relevantních odpovědí:

Krok 1: Proces vyhledávání

Po zadání dotazu nebo výzvy systém prohledá externí znalostní databázi a vyhledá relevantní informace. Touto znalostní bází může být sbírka dokumentů, databáze nebo jiný strukturovaný zdroj dat.

RAG používá pokročilé vyhledávací algoritmy k identifikaci nejrelevantnějších informací. Tyto algoritmy mohou využívat techniky, jako je sémantické vyhledávání nebo husté vektorové vyhledávání. Cílem je najít kontextově relevantní data, která mohou zlepšit odezvu jazykového modelu.

Krok 2: Architektura RAG a školení modelu

Funkční architektura RAG kombinuje komponentu kodéru , komponentu retrieveru a komponentu generátoru. Zde se dozvíte, jak fungují dohromady:

  1. Kodér: převádí vstupní dotazy na vektorovou reprezentaci
  2. Retriever: prohledává znalostní databázi pomocí zakódovaného dotazu
  3. Generátor: vytvoří konečnou odpověď na základě získaných informací

Během tréninku se modely RAG učí vyvažovat informace ze svých interních znalostí (předtrénink) s externě získanými daty. Tento proces zlepšuje schopnost modelu generovat přesné a kontextově relevantní odpovědi.

Krok 3: Mechanismy přeřazování a pozornosti

Po počátečním vyhledávání systémy RAG často používají opětovné řazení, aby dále zpřesnily relevanci vyhledaných informací. Tento krok pomáhá určit priority nejcennějších dat pro konečný proces generování. Přeřazení lze použít:

  1. Skóre relevance
  2. Míry sémantické podobnosti
  3. Kontextově specifické heuristiky

Mechanismy pozornosti hrají v RAG klíčovou roli tím, že rozhodují o tom, které části získaných informací jsou pro vytvoření odpovědi nejdůležitější. Tyto systémy umožňují modelu zaměřit se při tvorbě výstupu na konkrétní části získaných dat.

Pozornost v RAG pomáhá modelu:

  1. Zvažte důležitost různých vyhledaných pasáží
  2. Integrace externích znalostí s interními znalostmi
  3. Vytvářet ucelenější a kontextuálně vhodnější odpovědi

Kombinací těchto kroků mohou systémy RAG vytvářet kvalitnější výstupy, které jsou věcně správné a kontextově relevantní.

Aplikace RAG

RAG vylepšuje systémy umělé inteligence v různých oblastech a zlepšuje přesnost a relevanci při zpracování a vytváření informací:

Chatboti a konverzační umělá inteligence

RAG výrazně zlepšuje chatboty a konverzační umělou inteligenci tím, že poskytuje přesnější a kontextově relevantní odpovědi. Tyto systémy mohou přistupovat k externím znalostním bázím, které doplňují jejich vyškolené znalosti, což jim umožňuje efektivně zpracovávat širší škálu uživatelských dotazů.

Chatboti s podporou RAG mohou:

  1. Poskytování aktuálních informací
  2. Nabídněte podrobné vysvětlení
  3. Udržování konzistence napříč konverzacemi

Tato technologie je cenná zejména v oblasti zákaznického servisu, kde chatboti mohou rychle vyhledat konkrétní údaje o produktu nebo kroky k řešení problémů. Umožňuje také přirozenější a informativnější dialogy virtuálních asistentů, díky čemuž jsou pro uživatele užitečnější a zajímavější.

Hlavní poskytovatelé umělé inteligence, jako jsou Anthropic, Google a OpenAI, vyvinuli šablony pro vytváření chatbotů RAG. Tyto šablony umožňují vývojářům vytvářet chatboty, které kombinují pokročilé funkce vyhledávače s generativními modely, což usnadňuje vývoj aplikací, které si poradí se složitými dotazy a poskytují inteligentní odpovědi, aniž by bylo nutné rozsáhlé trénování vlastního modelu.

Vyhledávače a sémantické vyhledávání

Kombinací generativní umělé inteligence a vyhledávání informací mohou vyhledávače poskytovat přesnější a kontextově relevantní výsledky. Mezi hlavní výhody patří:

  1. Lepší porozumění záměrům uživatelů
  2. Vylepšené hodnocení výsledků vyhledávání
  3. Generování stručných shrnutí pro úryvky vyhledávání

RAG umožňuje vyhledávačům jít nad rámec porovnávání klíčových slov a interpretovat sémantický význam dotazů. To vede k intuitivnějšímu vyhledávání, kdy uživatelé mohou najít relevantní informace, i když jejich vyhledávací výrazy přesně neodpovídají hledanému obsahu.

Systémy odpovědí na otázky

Pomocí nástroje RAG lze vytvářet interní nástroje, které odpovídají na otázky, a to i na ty složité, které obvykle zodpovídá člověk. Mezi výhody RAG při zodpovídání otázek patří:

  1. Přístup k aktuálním informacím
  2. Schopnost citovat zdroje
  3. Zpracování složitých, vícedílných otázek

Systémy poháněné RAG nejpůsobivěji odpovídají na otázky v oblastech, jako je lékařská diagnostika, podpora, právní výzkum a vzdělávací platformy. Dokážou rychle vyhledat relevantní fakta z rozsáhlých databází a generovat ucelené, informativní odpovědi přizpůsobené konkrétnímu dotazu uživatele.

Generativní umělá inteligence ve zdravotnictví
Prozkoumejte, jak generativní umělá inteligence ve zdravotnictví přináší revoluci v péči o pacienty,
diagnostika a objevování léků. Seznamte se s jeho aplikacemi, výhodami a etickými aspekty.

RAG a sumarizace textu: příklad z reálného světa

Sumarizační nástroje s podporou RAG jsou užitečné zejména v oblastech, jako je žurnalistika, akademický výzkum a obchodní zpravodajství.

Zatímco mnoho nástrojů LLM, jako je GPT-4, dokáže shrnout určitý text, nástroje bez schopností RAG mají problémy s kontextualizací tohoto textu v rámci rozsáhlejší znalostní báze nebo oblasti s hlubokými daty specifickými pro danou oblast.

Představte si novináře, který pracuje na mimořádné zprávě o novém lékařském průlomu v léčbě rakoviny.

Potřebuje rychle shrnout hutný 50stránkový výzkumný článek a dát jej do kontextu v rámci širšího oboru onkologie. Zde se dozvíte, jak by vám mohl pomoci shrnující nástroj na bázi RAG:

  1. Novinář vloží výzkumný článek do nástroje pro shrnutí s podporou RAG.
  2. Nástroj zpracuje dokument a na základě jeho obsahu vygeneruje dotaz nebo sadu dotazů.
  3. Pomocí vektorového vyhledávání se systém dotazuje do své databáze a vyhledává relevantní informace:
    • Aktuální lékařské časopisy
    • Předchozí novinky
    • Odborné názory na léčbu rakoviny
    • Souvislosti s milníky výzkumu rakoviny
    • Statistiky o současné účinnosti léčby rakoviny
  4. Systém RAG vyhledává a hodnotí nejvýznamnější externí informace.
  5. Nástroj poté vygeneruje shrnutí, které obsahuje jak původní článek, tak vyhledané externí informace:
    • Vytváří základní shrnutí klíčových bodů dokumentu
    • Zahrnuje základní informace o předchozích milnících výzkumu rakoviny
    • Vysvětluje složitou lékařskou terminologii a zpřístupňuje ji široké veřejnosti
    • Zahrnuje srovnání se současnou mírou účinnosti léčby rakoviny
    • Zahrnuje názory odborníků na možný dopad nové léčby

Konečným výstupem je komplexní, v souvislostech zpracovaná zpráva, která:

  • Vysvětluje průlom v laické terminologii
  • Srovnává ji se stávajícími léčebnými postupy
  • Poskytuje odborná stanoviska k jeho potenciálnímu dopadu
  • Zasazuje objev do širšího kontextu výzkumu rakoviny

Toto shrnutí rozšířené o RAG umožňuje novinářům rychle pochopit a sdělit význam výzkumu i bez hlubších odborných znalostí v oblasti onkologie. Šetří čas, zvyšuje přesnost a poskytuje bohatší a informativnější základ pro jejich zpravodajské články.

Díky využití obsahu původního článku i relevantních externích zdrojů vytváří nástroj RAG hodnotnější a výstižnější shrnutí, než jakého by bylo možné dosáhnout pouze tradičními technikami shrnutí.

Digital transformation concept. System engineering. Binary code. Programming.

Výzvy a omezení

Zavedení systémů RAG může být spojeno se značnými výpočetními a finančními náklady, zejména pokud se jedná o vyhledávání a zpracování rozsáhlých dat. Zde je několik dalších možných překážek při zavádění technologie RAG:

Vypořádání se s nejasnostmi a halucinacemi

I při zavedených ochranných opatřeních RAG mohou mít generativní systémy umělé inteligence problémy s nejednoznačnými dotazy nebo protichůdnými informacemi ve vyhledaných datech. To může vést k halucinacím - výstupům, které vypadají věrohodně, ale jsou fakticky nesprávné nebo nesmyslné.

Chcete-li tento problém zmírnit, implementujte robustní mechanismy kontroly faktů, používejte více zdrojů dat pro křížové ověřování a používejte bodové hodnocení důvěryhodnosti generovaného obsahu.

Zachování spolehlivosti a důvěry uživatelů

Vybudování a udržení důvěry uživatelů je pro přijetí RAG zásadní. Nekonzistentní nebo nesprávné odpovědi mohou rychle narušit důvěru v systém. Mezi klíčové strategie patří informování uživatelů o omezeních systému, uvádění citací nebo zdrojů informací a umožnění uživatelům vyjádřit se k odpovědím.

Bezpečnost a ochrana osobních údajů

Systémy RAG často přistupují k rozsáhlým databázím, což vyvolává obavy o bezpečnost údajů a ochranu soukromí. Ochrana citlivých informací při zachování funkčnosti systému je křehká rovnováha.

Mezi důležitá ochranná opatření patří přísné kontroly přístupu a šifrování datových úložišť, anonymizace osobních údajů ve školících datech a pravidelné bezpečnostní audity a penetrační testy.

Global network security technology, business people protect personal information. Encryption with a padlock icon on the virtual interface.

Technická infrastruktura pro RAG

Zavedení RAG vyžaduje robustní technické základy:

Požadavky na hardware a software

Systémy RAG vyžadují značné výpočetní zdroje. Pro současné zpracování rozsáhlých jazykových modelů a vyhledávacích operací jsou nezbytné výkonné procesory a dostatek paměti. Pro efektivní odvozování modelů se často ukazuje jako klíčová akcelerace GPU.

Na straně softwaru usnadňují implementaci RAG specializované rámce. Mezi oblíbené volby patří Hugging Face Transformers a LangChain.

Škálování pomocí cloudových služeb a rozhraní API

Rozhraní API hrají v systémech RAG klíčovou roli a umožňují bezproblémovou integraci různých komponent. Umožňují přístup k předtrénovaným jazykovým modelům, úložištím dokumentů a vektorovým databázím s otevřeným zdrojovým kódem.

Populární nástroje s otevřeným zdrojovým kódem, jako je Apache Kafka pro streamování dat, Elasticsearch pro ukládání a vyhledávání dokumentů a FAISS (Facebook AI Similarity Search) pro efektivní vyhledávání podobnosti v hustých vektorech, lze integrovat prostřednictvím rozhraní API a vytvořit tak robustní systémy RAG.

Závěrečné myšlenky

Retrieval Augmented Generation (RAG) je velkým pokrokem v technologii umělé inteligence. Řeší hlavní problémy tradičních velkých jazykových modelů pomocí vektorového vyhledávání a generativní AI.

Tento přístup umožňuje přesnější, kontextově relevantní a aktuálnější aplikace poháněné AI v různých odvětvích.

Platformy jako InterSystems IRIS® usnadňují implementaci RAG tím, že nabízejí integrované vektorové funkce, vysoce výkonné zpracování a flexibilní integraci AI v rámci bezpečného prostředí připraveného pro podniky.

Díky schopnosti zpracovávat strukturovaná i nestrukturovaná data v jednotném systému InterSystems IRIS zjednodušuje architekturu potřebnou pro RAG a zároveň poskytuje robustní nástroje pro orchestraci a audit AI.

S rozvojem AI bude RAG i nadále představovat základní technologii pro vytváření spolehlivějších, efektivnějších a inteligentnějších systémů. Jsme na prahu neuvěřitelných inovací v různých oblastech, od pokročilých chatbotů a sémantických vyhledávačů až po komplexní nástroje pro analýzu dat.

Pomocí RAG a platforem, jako je InterSystems IRIS, mohou organizace vytvářet řešení umělé inteligence, která jsou nejen výkonnější a přesnější, ale také důvěryhodnější a přizpůsobivější reálným potřebám.

Často kladené otázky o RAG

Retrieval-augmented generation (RAG) rozšiřuje jazykové modely AI o externí zdroje znalostí. Tento inovativní přístup zvyšuje přesnost, snižuje počet halucinací a rozšiřuje možnosti modelu v různých aplikacích.

Jak může generování rozšířené o vyhledávání vylepšit úlohy zpracování přirozeného jazyka?
RAG zlepšuje výkonnost jazykových modelů v úlohách zpracování přirozeného jazyka. Kombinuje generativní sílu velkých jazykových modelů s přesnými mechanismy vyhledávání dat.

Tato integrace umožňuje systémům umělé inteligence přistupovat k aktuálním informacím a poskytovat přesnější odpovědi. RAG vylepšuje úlohy, jako je zodpovídání otázek, shrnutí textu a generování obsahu.
Jaký je postup při vytváření systému generování s rozšířeným vyhledáváním?
Nastavení systému RAG zahrnuje několik klíčových kroků. Nejprve je třeba vytvořit vložené báze znalostí a indexovat tyto informace pro efektivní vyhledávání.

Dále musí být systém nakonfigurován tak, aby během inference prováděl vyhledávání s nízkou latencí. Získané informace jsou nakonec integrovány s výstupem jazykového modelu, aby bylo možné generovat přesné a kontextově relevantní odpovědi.
V čem se generování s využitím vyhledávání liší od tradičních jazykových modelů?
RAG se od tradičních jazykových modelů liší tím, že zahrnuje externí zdroje dat. Zatímco standardní modely se spoléhají pouze na své předem natrénované znalosti, RAG je rozšiřuje o relevantní informace získané ze samostatného korpusu.

Tento přístup umožňuje systémům RAG přístup k aktuálnějším a specifičtějším informacím, čímž se snižuje riziko zastaralých nebo nesprávných výstupů. Umožňuje také modelu poskytovat podrobnější a kontextuálně přiměřené odpovědi.
Jaké jsou běžné aplikace generování rozšířeného o vyhledávání ve strojovém učení?
RAG nachází uplatnění v různých úlohách strojového učení. Je obzvláště užitečná v systémech pro zodpovídání otázek, kde může poskytovat přesnější a aktuálnější informace.

RAG také vylepšuje chatboty a virtuální asistenty a zlepšuje jejich schopnost zapojit se do kontextově relevantních konverzací. Kromě toho se používá v systémech pro generování obsahu, sumarizaci dokumentů a vyhledávání informací.
Jak funguje generování rozšířené o vyhledávání ve spojení s technikami hlubokého učení?
RAG se bez problémů integruje s technikami hlubokého učení. Využívá sílu velkých jazykových modelů, jako je GPT-3 nebo GPT-4, které jsou založeny na architektuře hlubokého učení.

Vyhledávací komponenta RAG využívá metody hlubokého učení pro generování embeddingů a vyhledávání podobností. Tato kombinace umožňuje systému RAG využívat jak generativní schopnosti modelů hlubokého učení, tak přesnost systémů pro vyhledávání informací.

Související obsah

bře 28, 2024
Vytvářejte generativní aplikace umělé inteligence s vestavěnými možnostmi vektorového vyhledávání v systému InterSystems IRIS. Vyhledávání ve strukturovaných i nestrukturovaných datech, přidání sémantiky a překonání omezení LLM.
bře 21, 2024
Datová platforma InterSystems IRIS 2024.1 představuje novou výkonnou funkci Vector Search, která umožňuje snadno přidat do aplikací sémantické vyhledávání a generativní funkce umělé inteligence.
lis 04, 2024
Prozkoumejte vektorové vyhledávání: technologii, která mění pravidla hry a pohání umělou inteligenci a strojové učení. Zjistěte, jak funguje a jak se mění vyhledávání dat pomocí systému InterSystems IRIS.

Dé el siguiente paso

Nos encantaría hablar. Rellene algunos datos y nos pondremos en contacto con usted.
*Campos obligatorios
Highlighted fields are required
*Campos obligatorios
Highlighted fields are required
** Al seleccionar "sí", usted da su consentimiento para que se le contacte para noticias, actualizaciones y otros fines de marketing relacionados con productos y eventos actuales y futuros de InterSystems. Además, usted da su consentimiento para que la información de contacto de su empresa se introduzca en nuestra solución de CRM que está alojada en Estados Unidos, pero que se mantiene de acuerdo con las leyes de protección de datos aplicables.