基流,比之前消耗大好多

Viewed 109

基流Qwen/Qwen3-Reranker-8B

新卡没玩几回合,没有进行过向量化
聊两条掉了0.0008,之前我聊好久才会掉一点。

补充,AI输入完后先掉0.0003,过5,6秒刷新页面又掉0.0003

补充
开启忆识检索之权 开着的

启用 Rerank 开着的

超级排序 开着的

独立聊天记忆 没开

再次补充
我今天重装酒馆了,之前玩好几百楼的消耗,都没有今天的高

3 Answers

Reranker模型仅在Embedding模型工作后才会工作,如果在未向量化内容的情况下出现了费率消耗,建议是移除当前API秘钥并重新生成新的秘钥检查是否是该秘钥的问题或是否该秘钥出现过风险泄露。理论上未进行向量化的话Embedding模型是不会工作的。或者检查一下全局向量块内容是否存在数据。

密钥应该没有,泄密风险,我刚才换密钥试了还是这样,我看了密折司奏报,没有向量化内容,(如果有向量化内容,面是不是有一个小图标,这个没有任何一个图标)

忆识总数也没有
书库编纂的准许凝识以前是开着的的,能和这个有关系吗?
上下文关联度 (Overlap):之前是50
和这个有关系吗?
我实在是不懂,求大佬帮助

没有向量化内容的情况下应该连Embedding模型都不会调用的……可以补充一下配置截图和具体向量化页面信息以进行更准确的判断。

建议研究一下正文优化和总结功能,这两个功能现在也能平替向量功能了。虽然说加上向量没准效果更好,但是这两个功能现在效果也很不错了

搞错了,是记忆管理会让总结功能

CloudFlare Protection DDoS Protection WAF Enabled