故障排除#
本页面列出了一些常见错误以及修复它们的提示。
CUDA 错误:遇到非法内存访问#
此错误可能是由于内核错误或内存不足问题导致的。
如果是内核错误,则很难修复。
如果是内存不足,有时它会报告此错误而不是“内存不足”。在这种情况下,尝试为
--mem-fraction-static
设置更小的值。--mem-fraction-static
的默认值约为 0.8 - 0.9。https://github.com/sgl-project/sglang/blob/1edd4e07d6ad52f4f63e7f6beaa5987c1e1cf621/python/sglang/srt/server_args.py#L92-L102
服务器挂起#
如果服务器挂起,请尝试在启动服务器时禁用一些优化。
添加
--disable-cuda-graph
。添加
--disable-flashinfer-sampling
。