使用记忆管理插件的回复时间问题

Viewed 90

插件也就是使用ds3.2那一部分做输入那边没有问题。问题出在使用主api,也就是Gemini3.0这里。直接按流程走,3.0写剧情输出,回复时间会在120s左右。但是你要是截断它,就是在完成过去记忆碎片这一部分后停止,重新生成,就会在60s左右完成。 就是,正常流程是1.输入指令2.剧情优化搞定进入输入栏3.主api接收指令然后直接输出。如果把2和3手动断正文输出就会很快。1000004850.jpg

1 Answers

目前判断是有两种可能:
第一种是命中缓存所以生成速度更快,这个目前有待确认。
第二种是过去记忆碎片部分和生成正文内容时间被合并所以时间超长,也就是实际上这个时间是两次的时间,所以需要两分钟甚至更多。这是合理的情况。

我明白了,其实那100多秒有40s是记忆管理的时间

Related
CloudFlare Protection DDoS Protection WAF Enabled