创建AWS Bedrock知识库及填坑指南

发布于:2025-06-28 ⋅ 阅读:(20) ⋅ 点赞:(0)

前言

作者之前的关于Dify实践RAG系统的文章:用它搭建AI Agent原来这么简单!-CSDN博客,文末留了TODO:

“后面会对此RAG系统进行扩展和增强:

1)知识库同步自Web站点

2)链接外部知识库

3)将构建的RAG应用嵌入网页”

之前的博文完成了1),在研究2)的过程中,发现涉及内容较多,如创建AWS Bedrock知识库、构建后端API服务,今天先拆开单独讲解一下创建AWS Bedrock知识库。

AWS Bedrock是亚马逊云科技(AWS)在2023年推出的一项服务,它旨在帮助开发者更轻松地构建和管理现代化的应用程序。Bedrock提供了一种简化的方式来使用AWS的基础设施和服务,包括计算、存储、数据库和网络等核心功能,同时支持容器化应用和微服务架构。通过Bedrock,开发者可以更快地进行开发、部署和扩展应用程序,而无需深入了解底层的云基础设施细节。这使得开发者能够专注于业务逻辑和应用程序的创新,提高了开发效率和灵活性。

 一、注册AWS并添加IAM用户

进入

进入使用基础模型构建生成式人工智能应用程序 – Amazon Bedrock – AWS

若没有注册过亚马逊云(AWS),会要求注册。

注意:注册后的用户默认是root用户,但除了root 用户,还需要添加IAM user/role,不然在创建Bedrock Knowledge Base配置完成后会遇到如下错误:

添加IAM用户:

以root用户登录后,左上角搜索框中输入 IAM,点击出现的services里的“IAM” services进入:

右侧“users”->“create user”,进入后按下图配置:

这里要选中“access to the AWS Management Console”,并设置密码,因为之后切换为IAM user登录时需要。如果读者已创建了IAM账户,增加密码方法见后面【附录】1。

“next”进入权限配置:

权限按用户组管理,新建用户组时,赋予的policies选红框的名称即可。

按指示点击“next”,最后创建成功IAM用户。

二、配置并创建知识库

点击右上角用户名称,复制“account id”,然后登出root用户,以IAM用户登录,登录时要求的账户id填刚才复制的,用户名和密码填上面设置的。

访问https://us-east-1.console.aws.amazon.com/bedrock/home?region=us-east-1#/knowledge-bases,点击“create”,如下图选择

点击“Knowledge base with vector store”,进入如下步骤的配置:

Step1配置页:

按页面说明填每一项,有默认值用默认值就行,“数据源”选择web crawler(如下图):准备抓取一个在线网站的文档建立知识库。

“next”进入step2。

Step2配置页:

抓取网站的url我这里还是用了之前的dify文档中文网站:

其他按默认值就可,也可以根据页面说明适当修改。

Step3 配置页:

embedding模型选择:

其他按默认。

然后按提示点“next”,最后“save and create”就开化进行向量化存储、创建data source、创建service role了,最后完成知识库的创建。

service role完成最慢,过程中如果你离开了,之后查看完成情况的方法参考【附录】2。

【附录】

1、

root用户登录,按如下步骤进行:

  • 根账户有IAM权限的管理员账户登录AWS管理控制台。

  • 导航到 IAM 服务

  • 在左侧菜单中点击 用户 (Users)

  • 在用户列表中找到你的 asw 用户名,点击进入该用户详情页。

  • 切换到 安全凭证 (Security credentials) 标签页。

  • 向下滚动到 控制台密码 (Console password) 部分。

  • 点击 管理 (Manage) 或 分配密码 (Assign password)

  • 选择:

    • 自动生成密码:AWS会生成一个新密码。管理员必须将此密码安全地发送给你(比如通过安全的消息通道,切勿明文发邮件或聊天软件)。你首次登录时必须修改它

    • 自定义密码:管理员可以直接设置一个新密码并告知你。同样需要安全传递。

  • 点击 保存更改 (Save changes)

2、

查看方法

  • root用户登录

  • 导航到IAM服务: 在顶部搜索栏输入 IAM 并选择进入。

  • 查看角色列表

    • 在左侧导航菜单中,点击 Roles

    • 在角色列表上方的搜索框中,输入你的角色名称的一部分,例如 AmazonBedrockExecutionRoleForKnowledgeBase 或更精确的完整名称 AmazonBedrockExecutionRoleForKnowledgeBase_1vq65

  • 检查角色状态

    • 如果创建成功: 你会在列表中看到这个角色。点击角色名称可以查看其详细信息,包括信任关系(Trust relationships)和权限策略(Permissions policies)。

    • 如果创建失败: 这个角色不会出现在列表中(或者可能在状态栏显示为Failed)。创建失败是导致知识库创建过程卡在“Creating role...”提示的最常见原因。

    • 如果仍在创建中: 在IAM控制台的角色列表中可能还看不到它,或者状态可能显示为Creating(但通常这个过程应该比较快)。长时间卡住通常意味着最终会失败。

角色作用

这个自动创建的IAM角色 service role(AmazonBedrockExecutionRoleForKnowledgeBase_xxx) 是知识库的执行角色。它的核心作用是授予AWS Bedrock服务必要的权限,使其能够代表你执行与知识库相关的特定操作,主要是:

  • 访问你的数据源: 读取你配置在知识库中的源数据(通常是S3存储桶中的文件)。

  • 与向量存储交互:

    • 写入向量数据: 将知识库从源数据生成的向量嵌入(embeddings)写入你指定的向量数据库(如OpenSearch Serverless, Pinecone, Redis等)。

    • 读取向量数据: 在执行查询时,从向量数据库中检索相关信息。

  • 可能的基础模型调用权限: 在查询知识库时,Bedrock可能需要调用基础模型(如Titan Embeddings模型生成向量,或Claude模型处理查询结果),该角色可能包含执行这些bedrock:InvokeModel调用的权限(如果知识库配置需要的话)。

  • 日志记录权限: 将知识库的操作日志写入CloudWatch Logs。


网站公告

今日签到

点亮在社区的每一天
去签到