编写LoRA代码的入门指南

　　发布于2024-12-19　阅读（0）

扫一扫，手机访问

LoRA（Low-Rank Adaptation）是一项流行的技术，旨在微调大语言模型（LLM）。这项技术最初由微软的研究人员提出，并收录在《LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS》的论文中。LoRA与其他技术不同之处在于，并非调整神经网络的所有参数，而是专注于更新少量低秩矩阵，从而显著减少了训练模型所需的计算量。

由于 LoRA 的微调质量与全模型微调相当，很多人将这种方法称为微调神器。自发布以来，很多人对这项技术感到好奇，希望通过编写代码来更好地理解这一研究。以往，缺乏适当的文档说明一直是一个困扰，但现在，我们有了教程的帮助。

这篇教程的作者是知名机器学习与 AI 研究者 Sebastian Raschka，他表示在各种有效的 LLM 微调方法中，LoRA 仍然是自己的首选。为此，Sebastian 专门写了一篇博客《Code LoRA From Scratch》，从头开始构建 LoRA，在他看来，这是一种很好的学习方法。

如何从头开始编写LoRA代码，这有一份教程

本文通过从头编写代码的方式介绍低秩自适应（LoRA），Sebastian在实验中对DistilBERT模型进行微调，并将其应用于分类任务。

LoRA方法与传统微调方法的比较结果表明，LoRA方法在测试准确率方面达到了92.39％，这比仅对模型最后几层进行微调（86.22％的测试准确率）表现出更优异的性能。这表明LoRA方法在优化模型性能方面具有明显优势，能够更好地提升模型的泛化能力和预测准确性。这个结果强调了在模型训练和调优过程中采用先进的技术和方法的重要性，以获得更好的性能表现和结果。通过比

Sebastian 是如何实现的，我们接着往下看。

从头开始编写 LoRA

用代码的方式表述一个 LoRA 层是这样的：

如何从头开始编写LoRA代码，这有一份教程

其中，in_dim 是想要使用 LoRA 修改的层的输入维度，与此对应的 out_dim 是层的输出维度。代码中还添加了一个超参数即缩放因子 alpha，alpha 值越高意味着对模型行为的调整越大，值越低则相反。此外，本文使用随机分布中的较小值来初始化矩阵 A，并用零初始化矩阵 B。

值得一提的是，LoRA 发挥作用的地方通常是神经网络的线性（前馈）层。举例来说，对于一个简单的 PyTorch 模型或具有两个线性层的模块（例如，这可能是 Transformer 块的前馈模块），其前馈（forward）方法可以表述为：

如何从头开始编写LoRA代码，这有一份教程

在使用 LoRA 时，通常会将 LoRA 更新添加到这些线性层的输出中，又得到代码如下：

如何从头开始编写LoRA代码，这有一份教程

如果你想通过修改现有 PyTorch 模型来实现 LoRA ，一种简单方法是将每个线性层替换为 LinearWithLoRA 层：

如何从头开始编写LoRA代码，这有一份教程

以上这些概念总结如下图所示：

如何从头开始编写LoRA代码，这有一份教程

为了应用 LoRA，本文将神经网络中现有的线性层替换为结合了原始线性层和 LoRALayer 的 LinearWithLoRA 层。

如何上手使用 LoRA 进行微调

LoRA 可用于 GPT 或图像生成等模型。为了简单说明，本文采用一个用于文本分类的小型 BERT（DistilBERT）模型来说明。

如何从头开始编写LoRA代码，这有一份教程

由于本文只训练新的 LoRA 权重，因而需要将所有可训练参数的 requires_grad 设置为 False 来冻结所有模型参数：

如何从头开始编写LoRA代码，这有一份教程

接下来，使用 print (model) 检查一下模型的结构：

如何从头开始编写LoRA代码，这有一份教程

由输出可知，该模型由 6 个 transformer 层组成，其中包含线性层：

如何从头开始编写LoRA代码，这有一份教程

此外，该模型有两个线性输出层：

如何从头开始编写LoRA代码，这有一份教程

通过定义以下赋值函数和循环，可以选择性地为这些线性层启用 LoRA：

如何从头开始编写LoRA代码，这有一份教程

使用 print (model) 再次检查模型，以检查其更新的结构：

如何从头开始编写LoRA代码，这有一份教程

正如上面看到的，线性层已成功地被 LinearWithLoRA 层取代。

如果使用上面显示的默认超参数来训练模型，则会在 IMDb 电影评论分类数据集上产生以下性能：

训练准确率：92.15%
验证准确率：89.98%
测试准确率：89.44%

在下一节中，本文将这些 LoRA 微调结果与传统微调结果进行了比较。

与传统微调方法的比较

在上一节中，LoRA 在默认设置下获得了 89.44% 的测试准确率，这与传统的微调方法相比如何？

为了进行比较，本文又进行了一项实验，以训练 DistilBERT 模型为例，但在训练期间仅更新最后 2 层。研究者通过冻结所有模型权重，然后解冻两个线性输出层来实现这一点：

如何从头开始编写LoRA代码，这有一份教程

只训练最后两层得到的分类性能如下：

训练准确率：86.68%
验证准确率：87.26%
测试准确率：86.22%

结果显示，LoRA 的表现优于传统微调最后两层的方法，但它使用的参数却少了 4 倍。微调所有层需要更新的参数比 LoRA 设置多 450 倍，但测试准确率只提高了 2%。

优化 LoRA 配置

前面讲到的结果都是 LoRA 在默认设置下进行的，超参数如下：

如何从头开始编写LoRA代码，这有一份教程

假如用户想要尝试不同的超参数配置，可以使用如下命令：

如何从头开始编写LoRA代码，这有一份教程

不过，最佳超参数配置如下：

如何从头开始编写LoRA代码，这有一份教程

在这种配置下，得到结果：

验证准确率：92.96%
测试准确率：92.39%

值得注意的是，即使 LoRA 设置中只有一小部分可训练参数（500k VS 66M），但准确率还是略高于通过完全微调获得的准确率。

原文链接：https://lightning.ai/lightning-ai/studios/code-lora-from-scratch?cnotallow=f5fc72b1f6eeeaf74b648b2aa8aaf8b6

本文转载于：https://www.51cto.com/article/784177.html 如有侵犯，请联系admin@zhengruan.com删除

上一篇：华为鸿蒙OS与航班管家、高铁管家合作，开启智慧出行新时代

下一篇：震撼登场：单图生成全角度3D视频，模型权重开源

产品推荐

售后无忧
立即购买>

DAEMON Tools Lite 10【序列号终身授权 + 中文版 + Win】

￥150.00
office旗舰店
售后无忧
立即购买>

DAEMON Tools Ultra 5【序列号终身授权 + 中文版 + Win】

￥198.00
office旗舰店
售后无忧
立即购买>

DAEMON Tools Pro 8【序列号终身授权 + 中文版 + Win】

￥189.00
office旗舰店
售后无忧
立即购买>

CorelDRAW X8 简体中文【标准版 + Win】

￥1788.00
office旗舰店

正版软件

iPhone 17或许能摆脱划痕问题，苹果投入大笔资金引进新技术

3月20日消息，自iPhone12问世以来，苹果公司在手机屏幕技术上取得了显著的进步。该公司引入了超瓷晶玻璃，一种具有出色抗摔性能的材料，使手机在意外摔落时更不易碎裂。然而，尽管超瓷晶玻璃在防碎方面表现出色，但划痕问题仍然存在，尤其是对于那些经常将手机放入包中的用户来说，划痕可能成为一个令人头疼的问题。据小编了解，针对划痕问题，苹果公司一直在积极寻求解决方案。近日，有博主爆料称，苹果已从日本斥资数十亿购买镀膜设备，并交由中国供应链进行生产。预计在iPhone17系列上，苹果将采用一种全新的外层玻璃设计，即

10分钟前苹果 0
正版软件

Google推出"Vlogger"模型使得一张图片能够生成10秒视频

谷歌发布了一个新的视频框架：只需要一张你的头像、一段讲话录音，就能得到一个本人栩栩如生的演讲视频。视频时长可变，目前看到的示例最高为10s。可以看到，无论是口型还是面部表情，它都非常自然。如果输入图像囊括整个上半身，它也能配合丰富的手势：网友看完就表示：有了它，以后咱开线上视频会议再也不需要整理好发型、穿好衣服再去了。嗯，拍一张肖像，录好演讲音频就可以（手动狗头）用声音控制肖像生成视频这个框架名叫VLOGGER。它主要基于扩散模型，并包含两部分：一个是随机的人体到3D运动（human-to-3d-moti

20分钟前模型训练 0
正版软件

联想与NVIDIA合作发布量身定制的混合AI解决方案，强调生成式AI功能

全球AI盛会GTC（GPUTechnologyConference）2024今天正式开幕，联想集团和NVIDIA宣布他们将合作推出全新的混合人工智能解决方案。这个合作旨在帮助企业和云提供商获得在人工智能时代成功所需的关键加速计算能力，将人工智能从理论概念转变为实际应用。这一消息在会议上引起了广泛关注，吸引了众多与会者的目光。这一合作将为市场带来全新的技术和解决方案，为不同行业带来更广泛的应用可能性。联想集团和NVIDIA的专业知识和技术实力将结合，共同开发出更加强大和高效的人工智能解决方案，为用户提供更多

35分钟前产业 0
正版软件

甲骨文正式发布 Java 22、JDK 22，JavaOne 开发者大会 2025 年 3 月 17 日举行

本站3月20日消息，甲骨文今日宣布Java22全面推出，同时JDK22也已正式公开，可供生产环境使用。这个版本涵盖了12个JDK增强提案（JEP），其中包括7个预览功能和1个孵化器功能，还有最终版本的外部函数和内存API（JEP454），以及未命名变量和模式（JEP456）。此外，甲骨文还宣布JavaOne回归，并将于2025年3月17日至20日在硅谷园区举行Java交流研讨会。

50分钟前 Java jdk 甲骨文 0
正版软件

揭晓：2024年苹果WWDC时间确定，iOS 18即将引领行业变革，首次集成AI技术

据报道，媒体透露，苹果计划在接下来的两周内正式公布2024年全球开发者大会（WWDC2024）的举办日期。这一备受瞩目的科技盛会预计将于6月的第一周举行。WWDC作为苹果每年的重要活动，将吸引全球顶尖开发者参与，并成为苹果展示最新操作系统和技术创新成果的重要舞台。今年WWDC的焦点之一，便是苹果即将发布的全新操作系统，其中包括iPadOS18、iOS18、macOS15以及watchOS11等。在这些操作系统中，尤以iOS18最受消费者期待。据可靠消息透露，iOS18将首次集成生成式AI技术，为用户提供更

1小时前 16:55 苹果 0

编写LoRA代码的入门指南

从头开始编写 LoRA

如何上手使用 LoRA 进行微调

与传统微调方法的比较

优化 LoRA 配置

产品推荐

最新发布

相关推荐

热门关注