Amazon Bedrock 的知识库现在支持更多的数据连接器预览版 新闻博客
Amazon Bedrock 知识库现支持额外的数据连接器预览版
关键要点
Amazon Bedrock 现在新增了用于数据连接器的选择,支持连接网站域、Confluence、Salesforce 和 SharePoint。这些新连接器可以帮助用户在 RAG 应用中获取公共和私有的企业数据,以提升响应的相关性和准确性。用户可以通过控制台或编程方式添加数据源。通过 Amazon Bedrock 知识库,基础模型FMs和代理可以从公司私有数据源中检索上下文信息,以实现检索增强生成RAG。RAG 使 FMs 能够提供更相关、精准和定制的响应。
在过去几个月中,我们不断增加了嵌入模型、向量存储和 FMs 的选择,现在很高兴地宣布,除了 亚马逊简单存储服务 (Amazon S3),您现在还可以将网站域、Confluence、Salesforce 和 SharePoint 作为数据源连接到您的 RAG 应用中暂处于预览版。
新数据源连接器的优势
通过包含您的网站域,您可以让 RAG 应用访问公司在社交媒体等公共平台上的数据,从而增强对用户输入的响应的相关性、及时性和全面性。借助新的连接器,您现在可以将现有的公司数据源如 Confluence、Salesforce 和 SharePoint添加到 RAG 应用中。
接下来,我将展示如何操作。以下示例中,我将使用网络爬虫添加一个网站域,并将 Confluence 连接为知识库的数据源。连接 Salesforce 和 SharePoint 也遵循类似的步骤。

添加网站域作为数据源
要尝试此功能,请进入 Amazon Bedrock 控制台,创建一个知识库。提供知识库的详细信息,包括名称和描述,并创建一个新的或使用现有的服务角色,确保具备相关的 AWS 身份与访问管理 (IAM) 权限。
然后,选择您要使用的数据源。我选择 Web Crawler。
接下来,配置网络爬虫。我为数据源输入名称和描述,然后定义源 URL。对于此演示,我添加我 AWS 新闻博客作者页面的 URL,您可以添加最多十个起始 URL 的网站。
可选地,您可以配置自定义加密设置和数据删除策略,以定义在删除数据源时向量存储数据是否被保留或删除。我将保持默认的高级设置。
在同步范围部分,您可以配置要使用的域级别、每分钟最大爬取 URL 的数量,以及要包括或排除特定 URL 的正则表达式模式。
完成 Web 爬虫数据源配置后,通过选择嵌入模型并配置所选的向量存储,完成知识库的设置。创建完成后,您可以检查知识库的详细信息,以监视数据源同步状态。在同步完成后,您可以测试知识库,查看 FM 响应及其 URL 引用。
若需以编程方式创建数据源,您可以使用 AWS 命令行界面 (AWS CLI) 或 AWS SDKs。代码示例,请参阅 Amazon Bedrock 用户指南。
连接 Confluence 作为数据源
接下来,在知识库设置中选择 Confluence 作为数据源。
免费加速器官方正版下载要配置 Confluence 作为数据源,我再次提供数据源的名称和描述,并选择托管方式,输入 Confluence URL。
连接到 Confluence 时,您可以选择基础和 OAuth 20 身份验证。对于本演示,我选择 基础身份验证,需要提供用户名您的 Confluence 用户账户电子邮件地址和密码Confluence API 令牌。我将相关凭证存储在 AWS Secrets Manager 中,并选择该密钥。
注意:确保密钥名称以“AmazonBedrock”开头,并且您为知识库设置的 IAM 服务角色具有访问此密钥的权限。
在元数据设置中,您可以通过正则表达式包括和排除模式控制要爬取内容的范围,并配置内容分块和解析策略。
完成 Confluence 数据源配置后,通过选择嵌入模型并配置所选的向量存储,完成知识库的设置。
创建完成后,您可以检查知识库的细节,以监控数据源同步状态。在同步完成后,您可以测试知识库。对于本演示,我在 Confluence 空间中添加了一些虚构的会议记录。让我们问一下其中一个会议的行动项!
关于如何将 Salesforce 和 SharePoint 作为数据源连接的说明,请查看 Amazon Bedrock 用户指南。
需要了解的事项
包含和排除过滤器所有数据源支持包含和排除过滤器,以使您能够对从给定来源爬取的数据进行细粒度控制。网络爬虫请记住,您只能在自己的网页或您有授权爬取的网页上使用网络爬虫。现已可用
新的数据源连接器今天在所有可用于 Amazon Bedrock 知识库的 AWS 区域提供。请查看 区域列表 了解详细信息和未来更新。要了解更多关于知识库的信息,请访问 Amazon Bedrock 产品页面。有关定价的详细信息,请查看 Amazon Bedrock 定价页面。
今天就尝试在 Amazon Bedrock 控制台 中使用新的数据源连接器,并将反馈发送到 AWS rePost for Amazon Bedrock 或通过您通常的 AWS 联系人,并与 communityaws 的生成 AI 开发者社区互动。
Antje
Antje Barth
Antje Barth 是 AWS 生成 AI 的首席开发者倡导者。她联合创作了 OReilly 出版的《AWS 上的生成 AI》和《AWS 上的数据科学》一书。Antje 经常在全球的 AI/ML 会议、活动和聚会上发表演讲。她还共同创立了杜塞尔多夫妇女大数据的分会。
AWS在四个额外的AWS区域获得HDS认证 安全博客
AWS新增四个区域获得HDS认证关键要点AWS在四个额外区域取得了HDS认证,全球认证区域总数增至24个。新取得认证的区域包括:亚太地区香港、亚太地区大阪、亚太地区海得拉巴和以色列特拉维夫。HDS认证可确保个人健康数据的安全和保护,符合日益严格的云服务提供商要求。Amazon Web Service...