如何巧妙选择K值,让SVD模型压缩更高效?
如何揭示大模型低秩微调的LoRA实践与SVD理论的内在逻辑?