多卡本地部署72b,模型输出为空,模型处理结果执行到|im_start|>assistant\n时,就停止了,导致最后解码的输出结果为空。
我也遇到了同样的问题,我部署的是awq版本,请问有人解决了吗
· Sign up or log in to comment