在过去的一年里,生成式AI的力量让世界震惊,而向量嵌入正是幕后魔法的一部分。嵌入是一种将数据(文本、图像、视频、用户、音乐等)表示为空间中的点的方式。当两个点靠在一起时,它们在语义上是相关的。例如,嵌入可以表示冰淇淋和西兰花都是食物,但只有冰淇淋通常是一种甜点。


向量嵌入使开发人员能够构建多种用户体验,例如:从文档中找到最相关的段落,在合适的时间将合适的产品与合适的人匹配,或推荐视觉上相似的时尚产品。


向量嵌入还使开发人员能够构建高度相关的基于大型语言模型(LLM)的生成式AI应用程序,这要归功于一种称为检索增强生成(RAG)的方法。开箱即用的 LLM 只能熟悉用于训练它们的数据。在 RAG 模型中,开发人员使用嵌入来将 LLM 融合到相关的业务信息中,并使用它们来生成高度相关的响应。




向量嵌入将视觉上相似的项目聚集在一起,从而实现快速向量相似性搜索


内部矢量搜索


矢量搜索之前提供的功能涵盖了广泛的开发人员需求和企业需求:


可根据您的需求进行扩展

借助矢量搜索,开发人员无需担心服务的扩展和缩减;该服务根据负载自动缩放。矢量搜索还可以实现定制和可调。例如,开发人员可以轻松地在召回率和延迟之间进行调整,以匹配他们的用例。


让您的矢量数据保持最新

您的业务数据可能会随着时间的推移而发生变化,矢量搜索可以快速适应这些变化。通过增量流式更新,开发人员不必等待整个索引重建。您可以将嵌入流式传输到矢量搜索中,并在几秒钟内准备好进行查询。


私密且安全

矢量搜索通过安全性和合规性功能(例如 VPC 服务控制、客户管理加密密钥 (CMEK) 和访问透明度)让企业用户高枕无忧。


这些功能有助于满足开发人员关键任务工作负载的安全、隐私和合规性要求。


虽然矢量搜索支持易于使用的公共端点部署,但开发人员还可以选择设置 VPC 或 Private Service Connect(公共预览版)端点,以提高数据安全性。


易于集成

矢量搜索与其他 Vertex AI 平台产品完美搭配。例如,为了轻松构建高度相关的 gen AI 或搜索用户体验,开发人员可以使用 Vertex AI Model Garden 的 LLM 从其业务数据生成嵌入,并将其索引到向量搜索中以进行快速检索。


新功能:更容易上手


近日,Google Cloud 宣布了矢量搜索的新搜索功能,以及一系列改进,使开发人员可以更轻松地启动和运行。得益于这些改进,Vector search 使将 LLM 和其他嵌入基础模型与业务数据配对变得更加简单,从而为用户提供快速且相关的用户体验。


  • 矢量搜索用户界面:借助现已推出公共预览版的新 UI,开发人员可以更轻松地开始使用,并监控索引和向量性能。开发人员还可以无需编码,直接从 UI 创建和部署索引。

  • 更快上手:新的增强功能现已普遍推出,可将较小索引的索引构建时间从几小时缩短至几分钟,从而最大限度地减少开发摩擦并使开发人员更快地启动和运行。

  • 新的过滤功能:随着公共预览版即将推出新的过滤功能,除了目前可用的基于标签的过滤之外,应用程序开发人员还可以在查询时定义和过滤数字范围元数据。这一改进为新的基于矢量的应用程序用例提供了支持。


改进的文档:改进的文档使您可以更轻松地学习如何入门、探索不同的功能以及按照使用矢量搜索构建应用程序的分步示例进行操作。

http://g.co/cloud/vectorsearch




未来,Google Cloud 将继续投资 Vertex AI Search,添加新的生成式 AI 特性和功能。对于矢量搜索,其也即将推出新功能,让各种技能水平的开发人员能更轻松地将搜索和生成人工智能功能纳入他们的技术堆栈中,以创造新的、令人兴奋的用户体验。


返回全部