随着DeepSeek在全球的爆火,无论是企业还是个人,都纷纷借助DeepSeek来搭建属于自己的知识库服务,这个过程是非常有意义的。目前很多服务商都支持本地服务+DeepSeek搭建知识库服务,本文就以亚马逊云科技为例,为大家介绍一下借助亚马逊Amazon Bedrock+DeepSeek轻松搭建知识库的教程,仅供参考。
本文涉及的亚马逊云服务:
1、Amazon Bedrock
Amazon Bedrock是一项完全托管的服务,因此用户无需管理任何基础设施,并且可以使用已经熟悉的AWS服务将生成式人工智能功能安全地集成和部署到用户的应用程序中,目前提供免费试用服务。
2、Amazon S3
Amazon S3是一种对象存储服务,提供行业领先的可扩展性、数据可用性、安全性和性能。免费套餐提供了5GB的免费云存储空间、99.999999999%的持久性、20000个Get请求、2000个Put请求,使用时长达12个月。
3、Amazon Lambda
Amazon Lambda是一种无服务器计算服务,无需管理服务器。免费套餐提供了每月免费提供100万个请求,永久免费使用。
新用户注册亚马逊云科技账户,在控制台中试用免费套餐产品。
点击获取:亚马逊免费云服务
相关推荐:《如何注册亚马逊AWS账号》
一、创建和配置Amazon S3
1、登录亚马逊云科技官网,进入控制台。
2、在控制台顶部搜索栏中输入“S3”,点击进入Amazon S3控制台。
3、点击【Create bucket】(创建存储桶),输入存储桶名称。
4、填写存储桶名字,其他设置保持默认,再次点击【Create bucket】(创建存储桶)。
5、创建完成后,点击进入该bucket。
6、点击【Upload】(上传)
上传用户的知识文档,例如PDF、DOCX、TXT、HTML等格式的文件。
例如,将一份txt格式的“2025年公司考勤管理制度”上传到S3存储桶(其中做了一些自定义设置,以便于验证知识库调用)
二、开通Amazon Bedrock和DeepSeek模型权限
1、在AWS控制台的搜索框中输入“Bedrock”,然后点击Amazon Bedrock。
2、进入Amazon Bedrock页面后,找到页面中的“Model access”(模型访问)设置板块,仔细检查自身账号是否已具备DeepSeek的使用权限。
3、如果没有DeepSeek模型的使用权限,点击页面上的“申请”按钮。
4、在模型选择页面中,勾选本次教程所需的DeepSeek模型。
5、完成模型勾选后,点击“提交”按钮完成模型申请操作。
6、通常提交申请后,系统会在短时间内审核并授予权限,待权限获取成功,就可以开始使用DeepSeek模型了。
三、创建企业知识库
1、返回亚马逊云科技Bedrock控制台,点击左侧【Knowledge Base】(知识库),进入知识库管理页面。
2、点击【Create】(创建),根据准备的数据类型,选择开始创建流程。
3、自定义知识库名称Knowledge Base Name:如company-kb。
4、设置知识库数据来源:选择S3,因为要连接到我们刚才上传的S3存储桶。
5、设置完成,点击【next】(下一步)。
6、选择S3数据源
选择需要上传文档的S3 Bucket。
继续点击【next】(下一步)。
7、设置嵌入模型:
建议选择Amazon Titan Embeddings(Bedrock原生)。
设置向量存储:这里可以保留默认(Amazon OpenSearch Serverless)。
点击【next】(下一步)后,确认设置,点击【Create knowledge base】(创建知识库)。
8、等待几分钟,知识库文档会自动进行解析、嵌入并构建索引。
9、在Amazon Bedrock的操作界面中,进入Knowledge Bases,勾选新建的knowledge base,请点击【Sync】(同步)来同步知识库。
10、选择测试知识库的生产模型,目前在控制台内只能测试部分大模型。
11、在右侧对话框中,用户可以使用选择的大模型对刚刚上传的公司考勤制度进行测试。这里可以看到大模型根据知识库中的信息对我们的问题进行了回答: