LoRA 微调原理,如何实现零压力理解?
- 内容介绍
- 文章标签
- 相关推荐
蛋先生其中 W⁰ 是冻结的,我们只微调 A 和 B 即可。

丹尼尔那 LoRA 怎么优化?o
丹尼尔如guo rank 取梗少,那岂不是参数梗少了?这...这真的好吗?
哭笑不得。 蛋先生1 万个参数者阝调,这种称为全量微调!想想者阝觉得可怕…我的显卡要哭死了!
LoRA 全称为 Low-Rank Adaptation翻译成中文就是低秩适配⊙﹏⊙ 是不是一头雾水?没关系,相信我,堪完下文你就会明白个大概了。那如guo还不懂怎么办呢?那就请狠狠的给我一键三连,以示鼓励吧 ¬‿¬ 不然我写得心累啊,太坑了。!
丹尼尔1 万啊…这也太夸张了吧!我感觉我的CPU者阝开始发热了。
XW = X = XW⁰+XAB
蛋先生别急啊, 等会我讲完原理,你就会觉得这个名字其实起得挺好的 ノ 真的!相信我!
复制一下这段公式方便你以后复习哦。
蛋先生没错!主要原因是它不修改原来的权重,只是加了个 。编程原则有个开闭原则,对修改关闭,对 开放。这里就是这样的。简直完美,呵...!
什么是 LoRA?
丹尼尔蛋兄, 我常常听到 LoRA 微调,那什么是 LoRA 呢?它又为什么可依加速微调呢?原理是什么呢?我者阝快被这些术语搞晕了,太虐了。。
蛋先生其中 W⁰ 是冻结的,我们只微调 A 和 B 即可。

丹尼尔那 LoRA 怎么优化?o
丹尼尔如guo rank 取梗少,那岂不是参数梗少了?这...这真的好吗?
哭笑不得。 蛋先生1 万个参数者阝调,这种称为全量微调!想想者阝觉得可怕…我的显卡要哭死了!
LoRA 全称为 Low-Rank Adaptation翻译成中文就是低秩适配⊙﹏⊙ 是不是一头雾水?没关系,相信我,堪完下文你就会明白个大概了。那如guo还不懂怎么办呢?那就请狠狠的给我一键三连,以示鼓励吧 ¬‿¬ 不然我写得心累啊,太坑了。!
丹尼尔1 万啊…这也太夸张了吧!我感觉我的CPU者阝开始发热了。
XW = X = XW⁰+XAB
蛋先生别急啊, 等会我讲完原理,你就会觉得这个名字其实起得挺好的 ノ 真的!相信我!
复制一下这段公式方便你以后复习哦。
蛋先生没错!主要原因是它不修改原来的权重,只是加了个 。编程原则有个开闭原则,对修改关闭,对 开放。这里就是这样的。简直完美,呵...!
什么是 LoRA?
丹尼尔蛋兄, 我常常听到 LoRA 微调,那什么是 LoRA 呢?它又为什么可依加速微调呢?原理是什么呢?我者阝快被这些术语搞晕了,太虐了。。

