在DAYU200上，将2GB大语言模型部署到本地

　　发布于2024-11-30　阅读（0）

扫一扫，手机访问

在2GB DAYU200上本地部署大语言模型

实现思路和步骤

将轻量级LLM模型推理框架InferLLM移植到OpenHarmony标准系统，并编译出可以在OpenHarmony上运行的二进制文件。这个推理框架是一个简单高效的LLM CPU推理框架，可以在本地部署LLM中的量化模型。

使用OpenHarmony NDK来编译OpenHarmony上的InferLLM可执行文件（具体使用OpenHarmony lycium 交叉编译框架,然后编写一些脚本。然后把其存放在tpc_c_cplusplusSIG仓库。)

在DAYU200上本地部署大语言模型

编译获取InferLLM三方库编译产物

下载OpenHarmony sdk,下载地址：

http://ci.openharmony.cn/workbench/cicd/dailybuild/dailyList

下载本仓库

git clone https://gitee.com/openharmony-sig/tpc_c_cplusplus.git --depth=1

# 设置环境变量export OHOS_SDK=解压目录/ohos-sdk/linux# 请替换为你自己的解压目录 cd lycium./build.sh InferLLM

获取InferLLM三方库头文件及生成的库

在tpc_c_cplusplus/thirdparty/InferLLM/目录下会生成InferLLM-405d866e4c11b884a8072b4b30659c63555be41d目录，该目录下存在已编译完成的32位和64位三方库。（相关编译结果不会被打包进入lycium目录下的usr目录）。

InferLLM-405d866e4c11b884a8072b4b30659c63555be41d/arm64-v8a-buildInferLLM-405d866e4c11b884a8072b4b30659c63555be41d/armeabi-v7a-build

将编译产物和模型文件推送至开发板运行

下载模型文件：https://huggingface.co/kewin4933/InferLLM-Model/tree/main
将编译InferLLM生成的llama可执行文件、OpenHarmony sdk中的libc++_shared.so、下载好的模型文件chinese-alpaca-7b-q4.bin 打包成文件夹 llama_file

# 将llama_file文件夹发送到开发板data目录hdc file send llama_file /data

# hdc shell 进入开发板执行cd data/llama_file# 在2GB的dayu200上加swap交换空间# 新建一个空的ram_ohos文件touch ram_ohos# 创建一个用于交换空间的文件（8GB大小的交换文件）fallocate -l 8G /data/ram_ohos# 设置文件权限，以确保所有用户可以读写该文件：chmod 777 /data/ram_ohos# 将文件设置为交换空间：mkswap /data/ram_ohos# 启用交换空间：swapon /data/ram_ohos# 设置库搜索路径export LD_LIBRARY_PATH=/data/llama_file:$LD_LIBRARY_PATH# 提升rk3568cpu频率# 查看 CPU 频率cat /sys/devices/system/cpu/cpu*/cpufreq/cpuinfo_cur_freq# 查看 CPU 可用频率（不同平台显示的可用频率会有所不同）cat /sys/devices/system/cpu/cpufreq/policy0/scaling_available_frequencies# 将 CPU 调频模式切换为用户空间模式，这意味着用户程序可以手动控制 CPU 的工作频率，而不是由系统自动管理。这样可以提供更大的灵活性和定制性，但需要注意合理调整频率以保持系统稳定性和性能。echo userspace > /sys/devices/system/cpu/cpufreq/policy0/scaling_governor# 设置rk3568 CPU 频率为1.9GHzecho 1992000 > /sys/devices/system/cpu/cpufreq/policy0/scaling_setspeed# 执行大语言模型chmod 777 llama./llama -m chinese-alpaca-7b-q4.bin -t 4

移植InferLLM三方库在OpenHarmmony设备rk3568上部署大语言模型实现人机对话。最后运行效果有些慢，跳出人机对话框也有些慢，请耐心等待。

在2GB DAYU200上本地部署大语言模型

本文转载于：https://www.51cto.com/article/781270.html 如有侵犯，请联系admin@zhengruan.com删除

上一篇：北大团队提出新的对齐范式，无需使用RLHF即可显著提升GPT-4/Llama2性能

下一篇：如何关闭iPhone 15手机的快门声音？

产品推荐

售后无忧
立即购买>

DAEMON Tools Lite 10【序列号终身授权 + 中文版 + Win】

￥150.00
office旗舰店
售后无忧
立即购买>

DAEMON Tools Ultra 5【序列号终身授权 + 中文版 + Win】

￥198.00
office旗舰店
售后无忧
立即购买>

DAEMON Tools Pro 8【序列号终身授权 + 中文版 + Win】

￥189.00
office旗舰店
售后无忧
立即购买>

CorelDRAW X8 简体中文【标准版 + Win】

￥1788.00
office旗舰店

正版软件

奈飞市值增长 700 亿美金，如何实现这一成就？

持续数年的流媒体平台之争，即将迎来大结局。作者|连冉编辑|郑玄传统娱乐巨头与奈飞的流媒体战争中，他们正在逐渐失去优势。而AI技术导致的好莱坞编剧罢工，则成为2023年的致命打击。近日，据《金融时报》等媒体报道，因为花费了大量资金内容在内容制作上，迪士尼、华纳兄弟探索频道、康卡斯特和派拉蒙等传统娱乐巨头的流媒体服务在2023年的损失达50亿美元以上。投资者们对这些巨头的流媒体业务的态度发生了180度转弯，从之前的看好已经转为期待后者尽快缩减规模或者将其剥离。奈飞推出流媒体视频服务时，与传统美国影视巨头之间曾

3分钟前流媒体网飞 0
正版软件

高合汽车就薪资延迟支付和高管自愿减薪事件回应：情况属实

本站2月8日消息，日前，有网友称高合汽车在2月7日召开了员工大会并作出通知：1月的工资无法按时发放、2023年年终奖取消、建议员工自寻出路等。据新浪财经报道，针对此事，高合汽车在接受媒体采访时表示：针对公司公告里的信息确有其事。根据生产经营的实际情况，公司正在采取比如高管主动降薪、缓发工资等调整措施面对内外部的挑战。但是，网传全员居家办公是不实信息，春节前有些同事休假提前回家。在去年10月，部分职场类App就有高合员工声称公司开始进行20%比例的裁员，有的部门裁了50%。对于“比例高达20%的大规模裁员”

8分钟前高合汽车 0
正版软件

丹麦隐私审查机构限制与谷歌分享学生数据，或许需要禁用Chromebook

据BleepingComputer报道，丹麦隐私监管机构Datatilsynet最近做出裁决，要求丹麦各城市在使用可能泄露儿童数据的谷歌服务之前，必须获得更加充分的隐私保障。监管机构发现，谷歌将来自Chromebook和GoogleWorkspaceforEducation的学生数据用于其自身目的，违反了欧洲隐私法。这一裁决意味着，丹麦城市必须确保使用谷歌服务不会给儿童数据的隐私带来风险，并采取适当的措施来保护这些数据的安全。这也是欧洲各国在保护儿童隐私方面越来越重视的一个例子。根据本站的了解，据Data

23分钟前谷歌 0
正版软件

特斯拉或有裁员计划，要求经理确定重要团队成员

据彭博社报道，特斯拉近日似乎计划进行新一轮裁员，要求经理们确定其团队中的“关键”成员。据知情人士透露，最近几天，特斯拉的美国经理受到要求对其下属进行“二元评估”，以确定员工在岗位上的重要性。消息人士称，特斯拉之前取消了部分员工的半年绩效评估。特斯拉最近的裁员举动引发了外界对其未来的担忧。虽然特斯拉裁员并不罕见，但这次裁员可能意味着公司正面临一些挑战。过去，特斯拉一直以迅猛的人员扩张而闻名，但近年来，招聘速度已经放缓。2022年，特斯拉新增员工2.9万人，而2023年仅新增1.2万人。这一数字反映了公司在扩

1小时前 23:00 特斯拉裁员 0
正版软件

德国法院禁止英特尔在该国销售部分处理器，裁定其侵犯了R2半导体专利

德国杜塞尔多夫地区法院裁定英特尔侵犯了R2半导体的专利，并颁布了禁令，禁止在德国销售部分英特尔前代处理器。报道指出，戴尔和惠普设备也可能受到此禁令的影响。图源Pexels德国法院禁止销售某些英特尔处理器及相关设备，英特尔则主张其产品不侵犯R2半导体的专利，并要求法院宣告该专利无效。本站注意到，涉案的欧洲专利涉及电压调节技术。根据R2半导体的声称，英特尔的酷睿系列处理器，包括IceLake、TigerLake、AlderLake和Xeon可扩展"IceLake服务器"处理器，以及搭载这些处理器的消费类笔记本

1小时前 22:45 半导体英特尔专利 0