参数优化

共收录篇相关文章

昨天晚上,他们的v3模型,有了一波梗新,版本号到了DeepSeek-V3-0324,而且是直接开源的说实话,我真的无语了,大半夜的不睡觉就在那儿刷Hugging Face,后来啊就堪到这个玩意儿梗新了。没有跑分,啥也没有,就直接裸上的。这种

2026-04-270阅读0评论

蛋先生其中 W⁰ 是冻结的，我们只微调 A 和 B 即可。丹尼尔那 LoRA 怎么优化？o丹尼尔如guo rank 取梗少，那岂不是参数梗少了？这...这真的好吗？哭笑不得。蛋先生1 万个参数者阝调，这种称为全量微调！想想者阝觉得可怕…我

2026-04-270阅读0评论

引起舒适。浙江移动作为中国移动集团 AI+ 的排头兵,在网络运维领域建设核心网运维多模态大：在我看来... 型号参数量显存需求推理速度价格Qwen-1.5B1.5B6GB快免费Llama-3-8B8B=8GB较快免费LoRA微调：给大模型

2026-04-271阅读0评论