超长上下文模型知识库实战-软件玩家

admin管理员组
文章数量:1436995

超长上下文模型知识库实战

承接上一篇《数据库接入大模型实战》，除了上述优化方案，还有一种更直接的方法：使用超长上下文的模型，将资料直接拖入对话框，让AI自动检索。

模型窗口进化与测试

如上图所示，过去两年内，模型的上下文窗口长度大幅提升。例如Gemini 2.0 Pro已支持2000万token的上下文，足以容纳四大名著。下面以Gemini为例进行测试。

API密钥获取与模型配置

首先，访问谷歌的AI Studio[1]（需科学上网）。

在右上角找到“Get API Key”。

点击创建API密钥。

选择任意项目，点击创建。

复制生成的API密钥。

回到 Cherry Studio，在设置中选择模型服务商为Gemini，并填写API密钥。

接着添加模型，点击“添加”，模型ID可在AI Studio中选择。本文以Gemini 2.0 Flash模型为例，支持100万token上下文，并有免费额度。

复制Gemini 2.0 Flash 模型ID。

回到 Cherry Studio，填写模型ID并添加。

切换聊天模型为Gemini 2.0 Flash。

记得将助手的默认Prompt清空。

知识库检索实战

接下来测试知识库能力。以全本《三国演义》为例，用VSCode打开，将张飞打造的武器改为“丈九棒棒糖”，保存。

将全本《三国演义》拖入对话框，并提问：“张飞造了什么兵器，请找到原文位置并据此回答。”

AI成功检索到答案，在第一回中张飞造“丈九棒棒糖”。本次任务消耗551266 token。

整个《三国演义》仅消耗了约一半上下文窗口。利用Gemini超大上下文进行知识库检索，是一种高效方案。

总结与展望

AI知识库常被称为“demo五分钟，上线一年”。目前AI知识库仍是复杂的系统工程，没有通用银弹，项目落地需多工具协作。当前公认效果较好的方案是自适应RAG，根据查询类型自动选择最合适的检索策略，结合多种检索方式提升精度。本文到此结束.

引用链接

[1] AI Studio:

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。原始发表：2025-05-03，如有侵权请联系 cloudcommunity@tencent 删除工具模型配置优化测试

本文标签：超长上下文模型知识库实战

版权声明：本文标题：超长上下文模型知识库实战内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.betaflare.com/biancheng/1747396146a2693327.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

超长上下文模型知识库实战

编程

17小时前

承接上一篇《数据库接入大模型实战》，除了上述优化方案，还有一种更直接的方法：使用超长上下文的模型，将资料直接拖入对话框，让AI自动检索。模型窗口进化与测试如上图所示，过去两年内，模型的上下文窗口长度大幅提升。例如Gemini 2.0 Pro

编程频道|软件玩家 - 软件改变生活！

超长上下文模型知识库实战

超长上下文模型知识库实战

模型窗口进化与测试

API密钥获取与模型配置

知识库检索实战

总结与展望

引用链接

更多相关文章

超长上下文模型知识库实战

发表评论

推荐文章

javascript - Nextjs Fetch data when reloading the page - Stack Overflow

javascript - How to embed pdf.js in a fancybox - Stack Overflow

Wordpress Error blank page In section website

filters - Why in archive page doesn&#180;t show read more button with excerpt?

css - How to keep theme layout the same when admin gray bar is present?

热门文章

dom - Fade InOut and createhide &lt;DIV&gt; with javascript - Stack Overflow

php - Move blogs but with applied filters

javascript - How to toggle an animation in Jquery - Stack Overflow

javascript - jQuery attr does not seem to return string? - Stack Overflow

c# - How to ignore light source on main camera in urp? - Stack Overflow

Convert pdf file to html file in JavaScriptjquery on client side? - Stack Overflow

next.js - How can I access request headers in my custom 404 page (with the pages router)? - Stack Overflow

外星人Alienware M16 R2 Ultra9 185H16GB512GBRTX4060参数报价

CNCF 接收 Kubescape 为孵化项目

开源公告｜Kuikly 跨平台开发框架

最新文章

AI 入侵编程界，此次 “大变革”下，程序员的焦虑与突围之路

Mysql之存储过程（下）

【Linux】基于环形队列的生产消费者模型

【C++】C++成为大神的登神长阶【入门篇（2100）】

AI 时代下，普通人不能错过的五大变现机会

javascript - Type &#39;undefined&#39; is not assignable to type &#39;menuItemProps[]&#39; - Stack Overflow

javascript - VS 2015 Angular 2 import modules cannot be resolved - Stack Overflow

javascript - Get the JSON objects that are not present in another array - Stack Overflow

javascript - How to dismiss a phonegap notification programmatically - Stack Overflow

c - Solaris 10 make Error code 1 Fatal Error when trying to build python 2.7.16 - Stack Overflow

ThinkPad 翼465 20翼X000PCD 参数报价

ThinkPad X1 隐士 20MFA01ECD 参数报价

华硕F8H575Sp-SL参数报价

HUWI HW02 11代酷睿版 i5 11300H12GB512GB集显 参数报价

HUWI HW02 11代酷睿版 i5 11300H16GB128GB集显 参数报价

filters - Why in archive page doesn´t show read more button with excerpt?

dom - Fade InOut and createhide <DIV> with javascript - Stack Overflow

javascript - Type 'undefined' is not assignable to type 'menuItemProps[]' - Stack Overflow

HUWI HW02 11代酷睿版 i5 11300H12GB512GB集显参数报价

HUWI HW02 11代酷睿版 i5 11300H16GB128GB集显参数报价