Skip to content
Telusuri untuk mempelajari tentang produk dan solusi InterSystems, peluang karier, dan banyak lagi.
Abstract data representation
Retrieval Augmented Generation (RAG): Apa Itu dan Bagaimana RAG Mencegah Kesalahan AI
Temukan bagaimana Retrieval Augmented Generation (RAG) meningkatkan akurasi AI dengan menggabungkan model bahasa dengan pengambilan data secara real-time, merevolusi chatbot dan mesin pencari.

Retrieval Augmented Generation (RAG ) adalah teknik AI yang meningkatkan large language models (LLM) dengan menggabungkan pengetahuan yang melekat pada model tersebut dengan pengambilan informasi secara real-time dari database eksternal.

Pendekatan ini memungkinkan model AI generatif untuk menghasilkan respons yang lebih akurat, terkini, dan relevan secara kontekstual dengan membumikan output mereka pada data terkini yang dapat diverifikasi.

Karena AI terus berintegrasi ke dalam berbagai aspek kehidupan kita, mulai dari pengambilan keputusan bisnis hingga asisten pribadi, kebutuhan akan informasi yang akurat dan terkini menjadi semakin penting. RAG menjawab kebutuhan ini dengan menjembatani kesenjangan antara pengetahuan yang luas tentang model bahasa dan informasi faktual secara real-time.

Abstract image of binary data emitted from AGI brain.

Hal-hal Penting yang Dapat Dipetik

  • RAG meningkatkan model kecerdasan buatan generatif dengan menggabungkan pembuatan bahasa dengan pengambilan informasi waktu nyata, sehingga secara signifikan mengurangi kesalahan dan halusinasi.
  • Teknik ini memungkinkan sistem AI untuk memberikan informasi terkini dan dapat diverifikasi, yang sangat penting untuk menjaga kepercayaan dalam pengambilan keputusan berbasis AI.
  • Menerapkan RAG akan meningkatkan kinerja AI di berbagai aplikasi, mulai dari chatbot dan mesin pencari hingga sistem penjawab pertanyaan dan ringkasan teks.

Memahami RAG

Dengan mendasarkan respons AI pada sumber data eksternal, RAG mengatasi keterbatasan utama model bahasa tradisional, seperti informasi yang sudah ketinggalan zaman dan halusinasi. Bayangkan RAG sebagai asisten peneliti yang sangat efisien. Ketika mengajukan pertanyaan, ia tidak hanya mengandalkan memorinya (seperti model AI tradisional), tetapi secara aktif mencari melalui perpustakaan yang luas berisi informasi terkini untuk memberikan jawaban yang paling akurat dan relevan. Pendekatan ini memungkinkan sistem AI untuk tetap mengikuti perkembangan informasi yang berubah dengan cepat dan memberikan respons yang lebih sesuai secara kontekstual.

Engineer designing AI technology with reflection on eyeglasses

Pentingnya RAG: Sebuah Kisah Peringatan

Bayangkan seorang eksekutif yang sibuk mempersiapkan pertemuan penting dengan calon investor. Karena terdesak waktu, mereka meminta bantuan asisten AI untuk mengumpulkan beberapa fakta di menit-menit terakhir tentang industri mereka. Mereka bertanya, "Berapa tingkat pertumbuhan sektor energi terbarukan tahun lalu?" AI dengan percaya diri menjawab, "Sektor energi terbarukan mengalami tingkat pertumbuhan yang kuat sebesar 15,7% tahun lalu, melampaui sumber energi tradisional dengan selisih yang signifikan." Terkesan oleh angka spesifik ini, eksekutif menyertakannya dalam presentasi mereka. Namun, dalam pertemuan tersebut, calon investor mempertanyakan angka tersebut, dengan menyatakan bahwa sumber mereka menunjukkan tingkat pertumbuhan hanya 8,3%.

Skenario ini menggambarkan masalah umum dengan LLM tradisional: halusinasi. LLM terkadang dapat menghasilkan informasi yang terdengar masuk akal namun tidak benar, terutama ketika berurusan dengan data yang spesifik, terbaru, atau berubah dengan cepat.

Di sinilah RAG menjadi sangat penting. Jika asisten AI menggunakan RAG:

  • Ia akan mencari database yang terus diperbarui untuk mendapatkan informasi terbaru dan akurat tentang tingkat pertumbuhan energi terbarukan.
  • Jika angka pastinya tidak tersedia, mungkin saja mereka memberikan kisaran berdasarkan beberapa sumber yang dapat dipercaya, atau secara eksplisit menyatakan bahwa mereka tidak memiliki data terkini.
  • Tanggapan tersebut dapat menyertakan sumber informasi dan tanggal terakhir kali informasi tersebut diperbarui.

Contoh kasus ini menekankan mengapa RAG sangat penting:

  1. Mencegah kesalahan informasi: dengan mendasarkan respons pada fakta yang dapat diambil, RAG secara signifikan mengurangi risiko halusinasi AI
  2. Menjaga kepercayaan: pengguna dapat mengandalkan AI yang disempurnakan RAG untuk mendapatkan informasi terkini dan akurat, yang sangat penting untuk keputusan bisnis.
  3. Memberikan transparansi: RAG memungkinkan AI untuk mengutip sumber, sehingga pengguna dapat memverifikasi informasi secara mandiri.

Ketika AI semakin terintegrasi ke dalam pekerjaan sehari-hari dan proses pengambilan keputusan, kemampuan untuk memberikan informasi yang akurat, terkini, dan dapat diverifikasi menjadi tidak hanya membantu, tetapi juga penting. RAG adalah teknologi utama dalam mencapai tujuan ini, menjembatani kesenjangan antara pengetahuan LLM yang luas dan kebutuhan akan informasi yang dapat diandalkan dan real-time.

Female and make programmers training for coding, cyber security or software on computer.

Komponen Utama RAG

Sistem RAG mengandalkan beberapa elemen penting yang bekerja sama untuk memberikan kemampuan AI yang lebih baik:

Model Bahasa

Large language models seperti GPT-3, GPT-4, dan BERT membentuk inti dari sistem RAG. Model AI yang canggih ini dilatih dengan data teks dalam jumlah yang sangat besar, sehingga memungkinkan mereka untuk memahami dan menghasilkan respons seperti manusia.

Dalam kerangka kerja RAG, mereka bertanggung jawab untuk:

  1. Memahami pertanyaan pengguna
  2. Mensintesis informasi dari data yang diambil
  3. Menghasilkan tanggapan yang koheren dan sesuai dengan konteks

Database dan Sistem Pencarian Informasi

Basis pengetahuan eksternal menyimpan informasi terstruktur dan tidak terstruktur yang dapat diakses dan diambil dengan cepat. Database ini sangat penting untuk menyediakan informasi terbaru dan spesifik yang mungkin tidak ada dalam data pelatihan model bahasa.

Aspek-aspek utama meliputi:

  1. Penyimpanan data dalam jumlah besar yang efisien
  2. Pemrosesan kueri cepat dan sistem pencarian kembali
  3. Dukungan untuk berbagai jenis data (teks, gambar, metadata)

Sistem pencarian informasi memainkan peran penting dalam mengidentifikasi dan mengekstrak data yang relevan dari database ini. Metode pengambilan yang umum meliputi:

  1. Pencarian kata kunci
  2. Pencarian vektor
  3. Pencarian semantik
  4. Algoritma BM25 untuk menentukan peringkat dokumen yang relevan

Representasi Vektor dan Pengindeksan

"Vektorisasi" data merupakan hal yang mendasar bagi sistem RAG modern. Ini melibatkan konversi data teks menjadi vektor numerik, sehingga memungkinkan pencarian vektor dan perbandingan kemiripan yang efisien. Fitur-fitur utama meliputi:

  1. Pembuatan penyematan menggunakan model yang telah dilatih sebelumnya
  2. Teknik pengurangan dimensi untuk representasi yang ringkas
  3. Ukuran kemiripan seperti kemiripan kosinus untuk membandingkan vektor

Database vektor adalah sistem khusus yang dirancang untuk menyimpan dan menanyakan representasi vektor ini secara efisien. Mereka menawarkan:

  1. Kemampuan pencarian tetangga terdekat yang cepat
  2. Skalabilitas untuk menangani kumpulan data yang besar
  3. Dukungan untuk operasi kueri yang kompleks

Teknik pengindeksan, seperti algoritma approximate nearest neighbor (ANN), dapat lebih meningkatkan kecepatan dan efisiensi pencarian dalam sistem RAG.

Emerging Digital Structure - Growing Connection Lines Symbolizing Innovative Artificial Intelligence Or Big Data Models - Technology Background

Bagaimana RAG Bekerja

Proses RAG melibatkan beberapa langkah canggih untuk mengambil data dan menghasilkan respons yang akurat dan relevan secara kontekstual:

Langkah 1: Proses Pengambilan

Ketika diberi pertanyaan atau perintah, sistem akan mencari basis pengetahuan eksternal untuk menemukan informasi yang relevan. Basis pengetahuan ini dapat berupa koleksi dokumen, database, atau sumber data terstruktur lainnya.

RAG menggunakan algoritma pencarian canggih untuk mengidentifikasi informasi yang paling relevan. Algoritma ini dapat menggunakan teknik seperti pencarian semantik atau pengambilan vektor padat. Tujuannya adalah untuk menemukan data yang relevan secara kontekstual yang dapat meningkatkan respons model bahasa.

Langkah 2: Pelatihan Arsitektur dan Model RAG

Arsitektur RAG yang fungsional menggabungkan komponen encoder , komponen retriever, dan komponen generator. Inilah cara mereka bekerja sama:

  1. Encoder: mengubah kueri masukan menjadi representasi vektor
  2. Retriever: mencari basis pengetahuan menggunakan kueri yang dikodekan
  3. Generator: membuat respons akhir menggunakan informasi yang diambil

Selama pelatihan, model RAG belajar menyeimbangkan informasi dari pengetahuan internal mereka (pra-pelatihan) dengan data yang diambil dari luar. Proses ini meningkatkan kemampuan model untuk menghasilkan respons yang akurat dan relevan secara kontekstual.

Langkah 3: Mekanisme Pemeringkatan dan Perhatian

Setelah pengambilan awal, sistem RAG sering menggunakan pemeringkatan ulang untuk lebih menyempurnakan relevansi informasi yang diambil. Langkah ini membantu memprioritaskan bagian data yang paling berharga untuk proses pembuatan akhir. Pemeringkatan ulang dapat menggunakan:

  1. Skor relevansi
  2. Ukuran kemiripan semantik
  3. Heuristik khusus konteks

Mekanisme perhatian memainkan peran penting dalam RAG dengan memutuskan bagian mana dari informasi yang diambil yang paling penting untuk menghasilkan respons. Sistem ini memungkinkan model untuk fokus pada bagian tertentu dari data yang diambil ketika membuat output-nya.

Perhatian dalam RAG membantu model:

  1. Menimbang pentingnya bagian-bagian berbeda yang diambil
  2. Mengintegrasikan pengetahuan eksternal dengan pemahaman internal
  3. Menghasilkan tanggapan yang lebih koheren dan sesuai dengan konteks

Dengan menggabungkan langkah-langkah ini, sistem RAG dapat menghasilkan output berkualitas lebih tinggi yang secara faktual benar dan relevan secara kontekstual.

Aplikasi RAG

RAG meningkatkan sistem AI di berbagai domain, meningkatkan akurasi dan relevansi dalam pemrosesan informasi dan tugas-tugas generatif:

Chatbots dan AI Percakapan

RAG secara signifikan meningkatkan chatbot dan AI percakapan dengan memberikan respons yang lebih akurat dan relevan secara kontekstual. Sistem ini dapat mengakses basis pengetahuan eksternal untuk melengkapi pengetahuan yang telah dilatih, sehingga memungkinkan mereka untuk menangani lebih banyak pertanyaan pengguna secara efektif.

Chatbot yang didukung RAG mampu:

  1. Memberikan informasi terkini
  2. Menawarkan penjelasan yang rinci
  3. Menjaga konsistensi di seluruh percakapan

Teknologi ini sangat berharga dalam layanan pelanggan, di mana chatbot dapat dengan cepat mengambil detail produk tertentu atau langkah-langkah pemecahan masalah. Ini juga memungkinkan dialog yang lebih alami dan informatif dalam asisten virtual, menjadikannya lebih membantu dan menarik bagi pengguna.

Penyedia AI utama seperti Anthropic, Google, dan OpenAI telah mengembangkan templat untuk membuat chatbot RAG. Template ini memungkinkan pengembang untuk membangun chatbot yang menggabungkan kemampuan mesin pencari tingkat lanjut dengan model generatif, sehingga lebih mudah untuk mengembangkan aplikasi yang dapat menangani kueri yang rumit dan memberikan respons cerdas tanpa memerlukan pelatihan model khusus yang ekstensif.

Mesin Pencari dan Pencarian Semantik

Dengan menggabungkan kekuatan AI generatif dengan pencarian informasi, mesin pencari dapat memberikan hasil yang lebih akurat dan relevan secara kontekstual. Manfaat utama meliputi:

  1. Pemahaman yang lebih baik tentang maksud pengguna
  2. Peningkatan peringkat hasil pencarian
  3. Pembuatan ringkasan ringkas untuk cuplikan pencarian

RAG memungkinkan mesin pencari untuk melakukan lebih dari sekadar pencocokan kata kunci, dengan menafsirkan makna semantik di balik kueri. Hal ini mengarah pada pengalaman penelusuran yang lebih intuitif, di mana pengguna dapat menemukan informasi yang relevan bahkan ketika istilah penelusuran mereka tidak benar-benar cocok dengan konten yang mereka cari.

Sistem Penjawab Pertanyaan

RAG dapat digunakan untuk membangun alat bantu internal yang menjawab pertanyaan, bahkan pertanyaan kompleks yang biasanya diajukan oleh manusia. Keuntungan RAG dalam menjawab pertanyaan meliputi:

  1. Akses ke informasi terkini
  2. Kemampuan untuk mengutip sumber
  3. Menangani pertanyaan yang rumit dan terdiri dari banyak bagian

Sistem yang didukung RAG menjawab pertanyaan dengan sangat mengesankan di berbagai bidang seperti diagnosis medis, dukungan, penelitian hukum, dan platform pendidikan. Mereka dapat dengan cepat mengambil fakta-fakta yang relevan dari database yang sangat besar dan menghasilkan tanggapan yang koheren dan informatif yang disesuaikan dengan pertanyaan spesifik pengguna.

AI Generatif dalam Perawatan Kesehatan
Jelajahi bagaimana AI generatif dalam perawatan kesehatan merevolusi perawatan pasien,
diagnosis, dan penemuan obat. Pelajari tentang aplikasi, manfaat, dan pertimbangan etisnya.

RAG dan Peringkasan Teks: Contoh di Dunia Nyata

Alat bantu peringkasan yang didukung RAG sangat berguna dalam bidang-bidang seperti jurnalisme, penelitian akademis, dan intelijen bisnis.

Meskipun banyak LLM seperti GPT-4 dapat meringkas sebuah teks, alat bantu yang tidak memiliki kemampuan RAG sulit untuk mengontekstualisasikan teks tersebut dalam basis pengetahuan yang lebih besar atau bidang yang memiliki data spesifik domain yang dalam.

Bayangkan seorang jurnalis yang sedang mengerjakan sebuah berita tentang terobosan medis baru dalam pengobatan kanker.

Mereka harus dengan cepat meringkas makalah penelitian setebal 50 halaman dan mengontekstualisasikannya dalam bidang yang lebih luas, yaitu bidang onkologi. Berikut ini adalah bagaimana alat ringkasan yang didukung RAG dapat membantu:

  1. Jurnalis memasukkan makalah penelitian ke dalam alat ringkasan yang disempurnakan RAG.
  2. Alat ini memproses makalah dan menghasilkan kueri atau serangkaian kueri berdasarkan isinya.
  3. Dengan menggunakan pencarian vektor, sistem menanyakan database untuk menemukan informasi yang relevan:
    • Jurnal medis terkini
    • Artikel berita sebelumnya
    • Pendapat para ahli tentang perawatan kanker
    • Latar belakang pencapaian penelitian kanker
    • Statistik tentang tingkat keberhasilan pengobatan kanker saat ini
  4. Sistem RAG mengambil dan mengurutkan informasi eksternal yang paling relevan.
  5. Alat ini kemudian menghasilkan ringkasan, yang menggabungkan makalah asli dan informasi eksternal yang diambil:
    • Ini membuat ringkasan dasar dari poin-poin utama makalah
    • Ini mengintegrasikan informasi latar belakang tentang pencapaian penelitian kanker sebelumnya
    • Buku ini menjelaskan terminologi medis yang rumit, sehingga dapat diakses oleh khalayak umum
    • Ini termasuk perbandingan dengan tingkat keberhasilan pengobatan kanker saat ini
    • Ini menggabungkan pendapat para ahli tentang dampak potensial dari pengobatan baru

Hasil akhirnya adalah laporan yang komprehensif dan kontekstual yang:

  • Menjelaskan terobosan dalam istilah awam
  • Membandingkannya dengan perawatan yang ada
  • Memberikan pendapat ahli tentang dampak potensial yang ditimbulkannya
  • Menempatkan penemuan ini dalam lanskap penelitian kanker yang lebih luas

Ringkasan yang disempurnakan dengan RAG ini memungkinkan jurnalis untuk dengan cepat memahami dan mengkomunikasikan pentingnya penelitian, bahkan tanpa keahlian mendalam dalam bidang onkologi. Ini menghemat waktu, meningkatkan akurasi, dan memberikan dasar yang lebih kaya dan lebih informatif untuk artikel berita mereka.

Dengan memanfaatkan konten makalah asli dan sumber eksternal yang relevan, alat yang didukung RAG menghasilkan ringkasan yang lebih bernilai dan berwawasan luas daripada yang dapat dicapai melalui teknik ringkasan tradisional saja.

Digital transformation concept. System engineering. Binary code. Programming.

Tantangan dan Keterbatasan

Menerapkan sistem RAG dapat melibatkan biaya komputasi dan keuangan yang signifikan, terutama saat berurusan dengan pengambilan dan pemrosesan data berskala besar. Berikut adalah beberapa rintangan potensial lainnya saat menerapkan teknologi RAG:

Berurusan dengan Ambiguitas dan Halusinasi

Bahkan dengan adanya perlindungan RAG, sistem AI generatif masih bisa kesulitan dengan kueri yang ambigu atau informasi yang saling bertentangan dalam data yang diambil. Hal ini dapat menyebabkan halusinasi - output yang tampak masuk akal tetapi secara faktual tidak benar atau tidak masuk akal.

Untuk memitigasi hal ini, terapkan mekanisme pengecekan fakta yang kuat, gunakan berbagai sumber data untuk verifikasi silang, dan gunakan penilaian kepercayaan untuk konten yang dihasilkan.

Menjaga Keandalan dan Kepercayaan Pengguna

Membangun dan mempertahankan kepercayaan pengguna sangat penting untuk adopsi RAG. Tanggapan yang tidak konsisten atau salah dapat dengan cepat mengikis kepercayaan terhadap sistem. Strategi utama termasuk memberi tahu pengguna tentang batasan sistem, memberikan kutipan atau sumber informasi, dan membiarkan pengguna memberikan umpan balik atas tanggapan mereka.

Pertimbangan Keamanan dan Privasi Data

Sistem RAG sering kali mengakses database yang besar, sehingga menimbulkan kekhawatiran tentang keamanan dan privasi data. Melindungi informasi sensitif sambil mempertahankan fungsionalitas sistem merupakan hal yang sulit diseimbangkan.

Perlindungan penting mencakup kontrol akses yang ketat dan enkripsi untuk penyimpanan data, anonimisasi informasi pribadi dalam data pelatihan, dan audit keamanan reguler serta pengujian penetrasi.

Global network security technology, business people protect personal information. Encryption with a padlock icon on the virtual interface.

Infrastruktur Teknis untuk RAG

Menerapkan RAG membutuhkan fondasi teknis yang kuat:

Persyaratan Perangkat Keras dan Perangkat Lunak

Sistem RAG menuntut sumber daya komputasi yang signifikan. Prosesor berkinerja tinggi dan memori yang besar sangat penting untuk menangani large language model dan operasi pengambilan secara bersamaan. Akselerasi GPU sering kali terbukti sangat penting untuk inferensi model yang efisien.

Di sisi perangkat lunak, kerangka kerja khusus memfasilitasi implementasi RAG. Pilihan populer termasuk Hugging Face Transformers dan LangChain.

Penskalaan dengan Layanan Cloud dan API

API memainkan peran penting dalam sistem RAG, memungkinkan integrasi berbagai komponen tanpa hambatan. Mereka memungkinkan akses ke model bahasa yang sudah terlatih, penyimpanan dokumen, dan basis data vektor sumber terbuka.

Alat-alat sumber terbuka yang populer seperti Apache Kafka untuk streaming data, Elasticsearch untuk penyimpanan dan pencarian dokumen, dan FAISS (Facebook AI Similarity Search) untuk pencarian kemiripan yang efisien di vektor padat dapat diintegrasikan melalui API untuk membangun sistem RAG yang kuat.

Kesimpulan

Retrieval Augmented Generation (RAG) adalah peningkatan besar dalam teknologi AI. RAG memecahkan masalah utama model bahasa besar tradisional dengan menggunakan pencarian vektor dan AI generatif.

Pendekatan ini memungkinkan aplikasi bertenaga AI yang lebih akurat, relevan secara kontekstual, dan mutakhir di berbagai industri.

Platform seperti InterSystems IRIS® memfasilitasi implementasi RAG dengan menawarkan kemampuan vektor terintegrasi, pemrosesan berkinerja tinggi, dan integrasi AI yang fleksibel di lingkungan yang aman dan siap untuk perusahaan.

Dengan kemampuannya untuk menangani data terstruktur dan tidak terstruktur dalam satu sistem, InterSystems IRIS menyederhanakan arsitektur yang diperlukan untuk RAG sekaligus menyediakan alat yang kuat untuk orkestrasi dan audit AI.

Seiring dengan berkembangnya AI, RAG akan terus menjadi teknologi dasar untuk membuat sistem yang lebih andal, efisien, dan cerdas. Kami berada di puncak inovasi luar biasa di berbagai bidang mulai dari chatbot canggih dan mesin pencari semantik hingga alat analisis data yang kompleks.

Dengan menggunakan RAG dan platform seperti InterSystems IRIS, organisasi bisa membangun solusi AI yang tidak hanya lebih kuat dan akurat, namun juga lebih bisa dipercaya dan mudah beradaptasi dengan kebutuhan di dunia nyata.

Pertanyaan yang Sering Diajukan Tentang RAG

Retrieval-augmented generation (RAG) meningkatkan model bahasa AI dengan memasukkan sumber pengetahuan eksternal. Pendekatan inovatif ini meningkatkan akurasi, mengurangi halusinasi, dan memperluas kemampuan model di berbagai aplikasi.

Bagaimana generasi yang ditambah dengan pengambilan meningkatkan tugas pemrosesan bahasa alami?
RAG meningkatkan kinerja model bahasa dalam tugas pemrosesan bahasa alami. Integrasi ini menggabungkan kekuatan generatif dari model bahasa yang besar dengan mekanisme pengambilan data yang tepat.

Integrasi ini memungkinkan sistem AI untuk mengakses informasi terkini dan memberikan respons yang lebih akurat. RAG menyempurnakan tugas-tugas seperti menjawab pertanyaan, meringkas teks, dan membuat konten.
Apa saja proses yang terlibat dalam menyiapkan sistem retrieval-augmented generation?
Menyiapkan sistem RAG melibatkan beberapa langkah utama. Pertama, diperlukan pembuatan penyematan dari basis pengetahuan dan pengindeksan informasi ini untuk pengambilan yang efisien.

Selanjutnya, sistem harus dikonfigurasikan untuk melakukan pengambilan dengan latensi rendah selama inferensi. Terakhir, informasi yang diambil diintegrasikan dengan output model bahasa untuk menghasilkan respons yang akurat dan relevan secara kontekstual.
Dalam hal apa saja retrieval-augmented generation berbeda dari model bahasa tradisional?
RAG berbeda dari model bahasa tradisional dengan memasukkan sumber data eksternal. Sementara model standar hanya mengandalkan pengetahuan yang telah dilatih sebelumnya, RAG menambahnya dengan informasi relevan yang diambil dari korpus terpisah.

Pendekatan ini memungkinkan sistem RAG mengakses informasi yang lebih mutakhir dan spesifik, sehingga mengurangi risiko keluaran yang ketinggalan zaman atau tidak tepat. Hal ini juga memungkinkan model untuk memberikan respons yang lebih rinci dan sesuai dengan konteks.
Apa saja aplikasi umum dari generasi yang ditambah dengan pengambilan dalam pembelajaran mesin?
RAG menemukan aplikasi dalam berbagai tugas pembelajaran mesin. Hal ini sangat berguna dalam sistem penjawab pertanyaan, di mana ia dapat memberikan informasi yang lebih akurat dan terkini.

RAG juga meningkatkan chatbots dan asisten virtual, meningkatkan kemampuan mereka untuk terlibat dalam percakapan yang relevan secara kontekstual. Selain itu, ini digunakan dalam pembuatan konten, ringkasan dokumen, dan sistem pencarian informasi.
Bagaimana cara kerja generasi yang ditambah dengan retrieval dalam hubungannya dengan teknik pembelajaran mendalam?
RAG terintegrasi secara mulus dengan teknik pembelajaran yang mendalam. RAG memanfaatkan kekuatan model bahasa besar seperti GPT-3 atau GPT-4, yang didasarkan pada arsitektur pembelajaran yang mendalam.

Komponen pengambilan RAG menggunakan metode pembelajaran yang mendalam untuk pembuatan embedding dan pencarian kemiripan. Kombinasi ini memungkinkan RAG untuk mendapatkan manfaat dari kemampuan generatif model pembelajaran mendalam dan ketepatan sistem pencarian informasi.

Konten Terkait

27 Juni, 2024
Membangun aplikasi AI generatif dengan kemampuan pencarian vektor tertanam pada InterSystems IRIS. Cari data terstruktur dan tidak terstruktur, tambahkan semantik, dan atasi keterbatasan LLM.
21 Maret, 2024
InterSystems IRIS Data Platform 2024.1 memperkenalkan Pencarian Vektor, sebuah fasilitas baru yang canggih yang memungkinkan Anda dengan mudah menambahkan pencarian semantik dan kemampuan AI generatif ke dalam aplikasi Anda.
27 September, 2024
Fundamentals
Jelajahi pencarian vektor: terbosan teknologi yang menggunakan AI dan pembelajaran mesin. Pelajari cara kerja dan transformasi pengambilan data dengan InterSystems IRIS.

Ambil Langkah Selanjutnya

Kami ingin sekali berbicara. Isi beberapa detail dan kami akan menghubungi Anda.
*Bidang yang dibutuhkan
Highlighted fields are required
*Bidang yang dibutuhkan
Highlighted fields are required

Dengan mengirimkan informasi kontak bisnis Anda kepada InterSystems melalui formulir ini, Anda mengakui dan menyetujui bahwa InterSystems dapat memproses informasi ini, untuk tujuan memenuhi pengajuan Anda, melalui sistem yang dihosting di Amerika Serikat, tetapi tetap konsisten dengan undang-undang perlindungan data yang berlaku.



** Dengan memilih ya, Anda memberikan persetujuan untuk dihubungi untuk mendapatkan berita, pembaruan, dan tujuan pemasaran lainnya yang berkaitan dengan produk dan acara InterSystems yang sudah ada dan yang akan datang. Selain itu, Anda menyetujui informasi kontak bisnis Anda dimasukkan ke dalam solusi CRM kami yang dikelola di Amerika Serikat, tetapi tetap konsisten dengan undang-undang perlindungan data yang berlaku.