3 Answers

此类问题目前遇到最多的反馈,是由于凝识总数过大导致。

尽量控制自己的凝识总数在1000及以下,不要向量化正文,如有玩小说的需求,使用插件内的术语表单解决。

还有几种情况就是模型不匹配或者参数异常

即,你在需要Embedding模型的位置配置了Chat模型,这样肯定是不行的。

或者参数异常——模型最大上下文为128k(128*1024=131072),但是你设置最大Token数量为200000,这种情况肯定会报错的。

Related
CloudFlare Protection DDoS Protection WAF Enabled