模型合并就进化，直接拿下SOTA！Transformer作者创业新成果火了

　　发布于2024-12-21　阅读（0）

扫一扫，手机访问

把Huggingface上的现成模型拿来“攒一攒”——

直接就能组合出新的强大模型？！

日本大模型公司sakana.ai脑洞大开（正是“Transformer八子”之一所创办的公司），想出了这么一个进化合并模型的妙招。

模型合并就进化，直接拿下SOTA！Transformer作者创业新成果火了

该方法不仅能自动生成新的基础模型，而且性能绝不赖：

他们利用一个包含70亿个参数的日语数学大型模型，在相关基准测试中取得了最先进的结果，超越了700亿参数的Llama-2等先前模型。

最重要的是，得出这样的模型不需要任何梯度训练，因此需要的计算资源大大减少。

英伟达科学家Jim Fan看完大赞：

这是我最近读过的最有想象力的论文之一。

模型合并就进化，直接拿下SOTA！Transformer作者创业新成果火了

合并进化，自动生成新基础模型

从开源大模型排行榜上表现最好的模型，大多不再是LLaMA或Mistral这种“原始”模型，而是一些微调或合并模型之后，我们就能看出：

一种新的趋势出现了。

Sakana.ai介绍，开源基础模型很容易在数百个不同的方向上进行扩展和微调，然后产生在新的领域表现出色的新模型。

而在这之中，模型合并显现出了巨大前景。

模型合并就进化，直接拿下SOTA！Transformer作者创业新成果火了

但，它可能是一种“黑魔法”，严重依赖直觉和专业知识。

因此，我们需要更为系统性的方法。

受自然界的自然选择启发，Sakana.ai盯上了进化算法，引入“进化模型合并”（Evolutionary Model Merge）的概念，提出一种可以发现最佳模型组合的通用方法。

该方法结合了两种不同的思路：

（1）合并数据流空间（层）中的模型，以及（2）合并参数空间（权重）中的模型。

具体而言，第一种数据流空间方法是通过进化来发现不同模型层的最佳组合，以此形成新模型。

在社区以往的做法中，都是靠直觉来确定如何以及模型哪些层可以与另一个模型的层结合。

但其实，Sakana.ai介绍，这个问题有一个组合数量巨大的搜索空间，最适合由优化算法如进化算法来搜索。

其操作示例如下：

模型合并就进化，直接拿下SOTA！Transformer作者创业新成果火了

至于第二个参数空间方法则混合多个模型权重来形成新模型。

这种方法其实很无数种实现，再加上混合的每一层原则上可以使用不同的混合比例，就更多了。

而这，利用进化方法就可以有效地找出更为新颖的混合策略。

以下是将两个不同模型的权重进行混合得到新模型的操作示例：

模型合并就进化，直接拿下SOTA！Transformer作者创业新成果火了

将以上这两种方法合并，就是这样的：

模型合并就进化，直接拿下SOTA！Transformer作者创业新成果火了

作者介绍，他们希望在相距较远的领域，例如数学和非英语语言、视觉和非英语语言，来组成之前大家不曾探索过的新兴组合。

结果，还真有点让人惊喜。

新模型轻松拿下SOTA

用以上进化合并方法，团队得到了3个基础模型：

大语言模型EvoLLM-JP

由日语大模型Shisa-Gamma和数学大模型WizardMath/Abel合并而成，擅长解决日语数学问题，进化了100-150代。

视觉语言模型EvoVLM-JP

日语大模型Shisa Gamma 7B v1+LLaVa-1.6-Mistral-7B，是具有日语能力的VLM。

图像生成模型EvoSDXL-JP

支持日语的SDXL扩散模型。

前两个已在Hugging Face和GitHub上发布，最后一个也即将推出。

具体来看。

1、EvoLLM-JP

它在GSM8K数据集的多语言版本——MGSM的日语评估集上取得成绩如下：

模型合并就进化，直接拿下SOTA！Transformer作者创业新成果火了

可以看到，EvoLLM-JP用日语解决数学问题的表现超过了它们的原始模型，也超过了Llama-2、GPT-3.5等高性能模型。

其中模型4是仅在参数空间进行了优化，模型6是使用模型4在数据流空间中进一步优化的结果。

在既评估数据能力也评估一般日语能力的日语lm-evaluation-harness基准上，EvoLLM-JP则在9个任务上的平均得分最高达到了70.5——只用70亿参数，它就打败了700亿的Llama-2等模型。

模型合并就进化，直接拿下SOTA！Transformer作者创业新成果火了

团队表示，EvoLLM-JP已经足够优秀，可以作为通用日语大模型，并解决一些有趣的例子：

比如需要特定日本文化知识的数学问题，或者用关西方言讲日本笑话。

2、EvoVLM-JP

在以下两个图像问答的基准数据集上，分数越高，代表模型用日语回答的描述越准确。

结果，它不仅比其所基于的英语VLM LLaVa-1.6-Mistral-7B更出色，也比现有的日语VLM更厉害。

模型合并就进化，直接拿下SOTA！Transformer作者创业新成果火了

如下图所示，在回答图中的信号灯为什么颜色之时，只有EvoVLM-JP答对：蓝色。

模型合并就进化，直接拿下SOTA！Transformer作者创业新成果火了

3、EvoSDXL-JP

这个支持日语的SDXL模型只需4个扩散模型即可执行推理，生成速度相当快。

具体跑分还没出来，但团队透露也是“相当有希望的”。

可以欣赏一些示例：

提示词包括：味噌ラーメン、最高品質の浮世絵、葛飾北斎、江戸時代。

模型合并就进化，直接拿下SOTA！Transformer作者创业新成果火了

对于以上3个新模型，团队指出：

原则上，我们可以采用基于梯度的反向传播来进一步提高以上这些模型的性能。

但我们不用，因为现在的目的就是表明，即使没有反向传播，我们仍然可以得到足够先进的基础模型，挑战当前的“昂贵范式”。

对此，网友们纷纷点赞。

Jim Fan也补充：

在基础模型领域，目前社区几乎完全专注于让模型去学习，而不太重视搜索，但后者在训练（也就是本文提出的进化算法）和推理阶段其实都有巨大的潜力。

△马斯克点赞

所以，如网友所说：

我们现在已经处于模型的寒武纪大爆发时代了吗？

模型合并就进化，直接拿下SOTA！Transformer作者创业新成果火了

论文地址：https://arxiv.org/abs/2403.13187

本文转载于：https://www.51cto.com/article/784481.html 如有侵犯，请联系admin@zhengruan.com删除

上一篇：女神异闻录夜幕魅影预抽卡角色选哪个好

下一篇：钉钉怎么修改账号密码_钉钉更改登录密码步骤

产品推荐

售后无忧
立即购买>

DAEMON Tools Lite 10【序列号终身授权 + 中文版 + Win】

￥150.00
office旗舰店
售后无忧
立即购买>

DAEMON Tools Ultra 5【序列号终身授权 + 中文版 + Win】

￥198.00
office旗舰店
售后无忧
立即购买>

DAEMON Tools Pro 8【序列号终身授权 + 中文版 + Win】

￥189.00
office旗舰店
售后无忧
立即购买>

CorelDRAW X8 简体中文【标准版 + Win】

￥1788.00
office旗舰店

正版软件

全新设计语言演绎时尚风潮！奇瑞2023款欧萌达震撼上市！

6月15日消息，奇瑞汽车于今日正式发布了2023款欧萌达。新车系奇瑞年度改款车型，以全新的设计语言展现出时尚年轻的特点。据小编了解，新车共推出了新潮版、新潮PLUS版、新潮PRO版和新潮MAX版四款车型，涵盖了1.5T和1.6T两种不同动力版本，售价区间为7.99万-10.79万元。2023款奇瑞欧萌达的外观设计与现款车型基本保持一致，但采用了全新的家族式设计风格，更加年轻时尚。车身侧面呈现出溜背造型，搭配动感运动尾翼，营造出一种运动氛围。此外，新车提供了多种新配色组合可供选择，如雪梨银、青柠绿、晚莓黑、

6分钟前上市设计语言欧萌达 0
正版软件

新功能揭秘：苹果visionOS Beta版发布"旅行模式"

6月23日消息，苹果公司昨日针对开发者推出了visionOSBeta的最新版本更新。据国外网友的深入挖掘，这一系统更新引入了全新的功能——"旅行模式"，旨在增强佩戴者在飞机上使用苹果VisionPro头显时的体验。据小编了解，visionOSBeta的开发者预览版推出后，用户们纷纷发现了内置的"旅行模式"功能，并对其进行了详细研究。根据在visionOSSDK代码中发现的文本字符串描述，苹果的"旅行模式"要求用户在飞机上开启该模式才能继续使用VisionPro头显。此模式下，用户需要尽量保持静止状态，并会

16分钟前苹果 0
正版软件

爆料揭秘：realme真我GT Neo6或继承觉醒光环系统，更有创意设计

7月5日消息，realme旗下手机系列真我GTNeo5于今年2月推出，引人注目。该系列在外观、屏幕和快充等方面均达到顶级规格，尤其是全球首次搭载了量产的240W秒充技术，成为目前Type-C接口支持的最高充电功率。然而，近期有消息称该系列将推出新机型真我GTNeo6，并已有相关爆料流出。最新消息显示，知名海外爆料达人@OnLeaks近日发布了一张所谓真我GTNeo6的渲染图。从渲染图来看，真我GTNeo6的机身背部设计与传统手机不同，采用了环绕式相机模组，有点类似之前发布的小米13Ultra。整个相机模组

31分钟前 0
正版软件

泰坦GE78 HX享优惠：顶配游戏本酷睿i9+满血版RTX4090超值推荐！

6月15日消息，对于众多游戏玩家而言，618购物节是一个理想的换机时机，尤其是一些高性能游戏本。在618期间，各大厂商纷纷推出优惠活动。作为知名游戏本品牌，微星也在此次618购物节中推出了大幅度的优惠，多款热门游戏本享受1000-5000元不等的直降优惠。部分高端系列甚至全系列产品直降4000-5000元，对于消费者而言，现在购买可以省下可观的金额。据小编了解，在这次618购物节中，微星推出了多款优惠的游戏本。其中，泰坦GE78HX是一款备受瞩目的高端游戏本，继承了泰坦GT77HX的极致性能表现。这款游戏

46分钟前 0
正版软件

荣耀全场景新品发布会今晚举行揭秘最新大片

7月12日消息，荣耀将于今天19:30举行荣耀MagicV2暨全场景新品发布会。据小编了解，荣耀官方公布了发布会的直播平台以及本次发布会的看点，为用户带来了期待已久的新品。荣耀MagicV2暨全场景新品发布会将引人瞩目的亮点包括：全新折叠旗舰荣耀MagicV2的亮相、定位为大屏旗舰的荣耀平板MagicPad13、具备超长续航能力的荣耀手表4，以及刷新视觉体验的越级高刷荣耀智慧屏5。据了解，荣耀MagicV2将以直板形态的折叠屏机型出现，打破了行业对折叠屏的传统认知。采用了盾构级新材料，该材料强韧耐用，解决

1小时前 19:05 0