InterSystems IRIS®包含强大的内置生成式人工智能功能,因此您可以通过语义搜索和生成式人工智能在任何类型的数据上构建智能企业应用程序。
Vector 功能(矢量功能)是 InterSystems IRIS 核心多模型数据库引擎的原生功能,与 JSON、全文本、对象、关系表、键值和其他数据类型并存。 这使得在同一引擎中使用结构化和非结构化数据为人工智能应用程序提供动力成为可能,而无需移动数据。 它比使用单独的专用矢量数据库更简单,更有效。
InterSystems IRIS 具有低延迟查询性能和高速摄取功能,可提供无与伦比的实时功能。 您可以将生成式人工智能应用于流媒体数据(包括视频),并将其与多种类型的数据相结合。
矢量搜索(Vector Search)
InterSystems IRIS 的嵌入式矢量搜索功能可让您搜索非结构化和半结构化数据。 数据被转换为矢量(也称为 "嵌入"),然后存储在 InterSystems IRIS 中并编制索引,用于语义搜索、检索增强生成(RAG)、语义搜索、文本分析、推荐引擎和其他用例。
矢量搜索包括用于存储和查询嵌入的矢量 SQL 数据类型,以及用于计算矢量相似性的内置函数。 这些功能内置于 InterSystems IRIS 的核心,可实现最高的速度、规模、安全性和可靠性。 矢量数据操作利用硬件加速(内置 SIMD 矢量处理)实现极致性能。
为应用程序添加语义
矢量搜索允许您根据语义或数据的含义而不是数据本身来查询数据。 想象一个多维空间,每个数据点(如短语或记录)对应一个向量。 具有相似含义或上下文的数据在这个向量空间中彼此接近。
随着人工智能技术的不断进步,现在这些向量可以将低维数据投射到包含更多数据背景的高维空间中,从而更好地捕捉数据的含义。 矢量嵌入提供了更细粒度的意义模型。
第一步是将数据转换为矢量嵌入,并将其作为矢量存储在 InterSystems IRIS 中。 然后,您就可以使用矢量函数进行查询并快速找到类似数据。 这样,您就可以实现 "向我显示与此职位描述匹配的简历 "或 "根据我的偏好为我在加勒比海的海滩度假寻找个性化的旅游推荐 "等查询需求。 这将为您的 InterSystems IRIS 应用程序带来全新的功能。
利用 RAG 打造人工智能驱动的体验
矢量搜索支持 RAG 架构,该架构正迅速成为克服大型语言模型 (LLM) 的局限性(如陈旧数据、标记限制和幻觉)的主要方法。
RAG 结合了两个步骤:一个是检索器,它使用矢量搜索从 InterSystems IRIS 数据库中检索相关文档和数据;另一个是生成器,即 LLM 本身,它以所需的格式和语气制作与上下文相关的回复。
您可以使用新鲜的权威信息(包括您的专有数据)生成准确的回复,利用您选择的 LLM 理解问题、措辞回复并添加补充信息。
开发人员可以利用大型GenAI 生态系统,使用平台、插件和库快速轻松地构建高级生成式 AI 应用程序,包括:
- ChatGPT
- LangChain
- Hugging Face
- Llama2
- LlamaIndex
- Cohere
人工智能协调(AI Orchestration)
新的云端 GenAI 服务层出不穷,带来了令人惊叹的新可能性,但同时也给创建和管理一个可靠的系统带来了困难。 InterSystems IRIS 互操作性可让您轻松创建跨多个模型的复合应用程序,无论它们在哪里运行。 通过低代码图形编辑器,无需编程即可创建人工智能解决方案,而内置的 API 管理功能则可对 GenAI 驱动的新服务进行保护、发布和货币化。
分布式操作可自动捕获,以便进行审计和调试。 可视化跟踪(Visual Trace)功能使开发人员和管理员能够跟踪整个协调流程中的消息并检查其内容。 想了解问题是由人工智能服务、您提供给它的数据还是它使用的业务逻辑造成的吗? 使用可视化跟踪(Visual Trace)。
企业准备就绪
InterSystems IRIS 在数据安全性、合规性和高可用性方面已得到验证,适用于关键任务企业应用。
利用我们的嵌入式矢量搜索功能构建生成式人工智能应用,为您提供:
- 对您的数据实现完全控制
- 您可选择 LLM、协调框架和代理框架
- 全面审计和可追溯性
- 本地运行 LLM,确保敏感数据完全本地化和安全
- 利用庞大的人工智能服务生态系统,无论它们在哪里运行,都具有完全的安全性和可靠性