岩芯数智发布离线端侧部署的非Attention机制大型模型

　　发布于2024-11-23　阅读（0）

扫一扫，手机访问

1月24日，上海岩芯数智人工智能科技有限公司对外推出了一个非Attention机制的通用自然语言大模型——Yan模型。岩芯数智发布会上称，Yan模型使用了全新自研的“Yan架构”代替Transformer架构，相较于Transformer，Yan架构的记忆能力提升3倍、速度提升7倍的同时，实现推理吞吐量的5倍提升。岩芯数智推出非Attention机制大模型，支持离线端侧部署

岩芯数智CEO刘凡平认为，以大规模著称的Transformer，在实际应用中的高算力和高成本，让不少中小型企业望而却步。其内部架构的复杂性，让决策过程难以解释；长序列处理困难和无法控制的幻觉问题也限制了大模型在某些关键领域和特殊场景的广泛应用。随着云计算和边缘计算的普及，行业对于高效能、低能耗AI大模型的需求正不断增长。
“在全球范围内，一直以来都有不少优秀的研究者试图从根本上解决对 Transformer架构的过度依赖，寻求更优的办法替代 Transformer。就连Transformer 的论文作者之一Llion Jones也在探索‘Transformer 之后的可能’，试图用一种基于进化原理的自然启发智能方法，从不同角度创造对AI框架的再定义。”
在发布会上，岩芯数智称，在同等资源条件下，Yan架构的模型，训练效率和推理吞吐量分别是Transformer架构的7倍及5倍，并使记忆能力得到3倍提升。Yan架构的设计，使得Yan模型在推理时的空间复杂度为常量，因此针对Transformer面临的长序列难题，Yan模型同样表现优异。对比数据表明，在单张4090 24G显卡上，当模型输出token的长度超出2600时，Transformer的模型会出现显存不足，而Yan模型的显存使用始终稳定在14G左右，理论上能够实现无限长度的推理。

岩芯数智推出非Attention机制大模型，支持离线端侧部署

另外，研究团队首创了一种合理的关联特征函数和记忆算子，结合线性计算的方式，降低模型内部结构的复杂度。全新架构下的Yan模型，将打开以往自然语言处理的“不可解释黑盒”，充分发掘决策过程的透明度和可解释性，从而助力大模型在医疗、金融、法律等高风险领域的广泛运用。

岩芯数智推出非Attention机制大模型，支持离线端侧部署

刘凡平表示，Yan模型100%支持私有化部署应用，能够不经裁剪和压缩即可在主流消费级CPU等端侧设备上无损运行，达到其他模型在GPU上的运行效果。发布会上，Yan展示了其离线后在笔记本上运行的实时片段，刘凡平称之后离线端侧部署将成为岩芯智能的重要商业化方向。

本文转载于：https://www.jiqizhixin.com/articles/2024-01-25-13 如有侵犯，请联系admin@zhengruan.com删除

上一篇：语言模型解耦的方法及介绍

下一篇：比亚迪元UP内饰谍照曝光，即将推出小型电动SUV

产品推荐

售后无忧
立即购买>

DAEMON Tools Lite 10【序列号终身授权 + 中文版 + Win】

￥150.00
office旗舰店
售后无忧
立即购买>

DAEMON Tools Ultra 5【序列号终身授权 + 中文版 + Win】

￥198.00
office旗舰店
售后无忧
立即购买>

DAEMON Tools Pro 8【序列号终身授权 + 中文版 + Win】

￥189.00
office旗舰店
售后无忧
立即购买>

CorelDRAW X8 简体中文【标准版 + Win】

￥1788.00
office旗舰店

正版软件

介绍集成学习的概念和方法

集成学习是一种机器学习方法，通过组合多个分类器来提高分类性能。它利用多个分类器的智慧，对它们的分类结果进行加权或投票，得到更准确的分类结果。集成学习能够有效提高分类模型的准确性、泛化能力和稳定性。集成学习的方法可以分为两大类：基于样本的方法和基于模型的方法。基于样本的方法Bagging（自举汇聚法）是一种通过随机有放回地重复抽样数据集的方法。通过训练多个分类器，并将它们的结果进行平均或投票，以提高分类的准确性和稳定性。Boosting（提升法）是一种通过对样本进行加权的方法，其目的是重点关注分类错误的样本

37分钟前机器学习 0
正版软件

利用知识图和向量嵌入提升LLM模型的精确度

语言模型在自然语言处理领域扮演着关键的角色，有助于理解和生成自然语言文本。然而，传统的语言模型存在一些问题，如无法处理复杂的长句、缺乏上下文信息和知识理解的局限性。为了解决这些问题，我们可以利用向量嵌入和知识图结合，提高语言模型的准确性。向量嵌入技术可以将单词或短语映射到高维空间中的向量表示，从而更好地捕捉语义信息。知识图则提供了丰富的语义关系和实体之间的联系，可以在语言模型中引入更多的背景知识。通过将向量嵌入和知识图与语言模型结合起来，我们可以改善模型对复杂句子的处理能力，更好地利用上下文信息，并扩展模

47分钟前 0
正版软件

华为副董事长余承东将出席北汽智选车项目供应商大会，预计新车将亮相北京车展

1月27日消息，华为与北汽智选车项目供应商大会于1月26日在北京的栖湖饭店成功举行。华为常务董事、终端业务CEO、智能汽车解决方案BU董事长余承东亲临现场，与宁德时代、博世等重要合作伙伴共同探讨未来合作方向。这次会议汇聚了华为与北汽智选车项目的关键合作伙伴，强调了双方合作的重要性和未来发展的潜力。据报道，去年11月，华为智能汽车解决方案BU董事长余承东曾透露，华为将与北汽和江淮展开合作，打造更多智能汽车系列。这一战略构想正在逐步实现。北汽新能源与华为的合作备受瞩目。据了解，他们正在联合研发一款高端智能纯电

1小时前 22:35 华为北汽智选车 0
正版软件

揭秘小米平板7系列：闪充120W+澎湃OS，打造无缝移动生态体验

近日，关于小米平板7系列的参数细节在网络上引起了广泛关注。据数码闲聊站透露，小米平板7系列将得到重大升级，成为小米史上性能最强的平板电脑。这个消息让人期待不已。小米平板7系列预计采用一块12.45英寸的LCD屏幕，具备16:10的屏幕纵横比和高达144Hz的刷新率，为用户提供更加流畅的视觉体验。在性能方面，该系列平板搭载高通骁龙8Gen2移动平台，保证了平板在各种应用场景下的出色表现。另外，小米平板7系列还支持120W有线闪充，大大缩短了充电时间，提高了用户的使用效率。小米平板7系列将预装澎湃OS系统，该

1小时前 22:25 小米平板7系列 120W闪充 0
正版软件

深度Q网络的定义是什么

深度Q网络（DQN）是基于深度学习技术的一种强化学习算法，专门用于解决离散动作空间的问题。该算法由DeepMind在2013年提出，被广泛视为深度强化学习领域的重要里程碑。在传统的Q-learning算法中，我们使用一个Q表来存储每个状态下每个动作的价值，以便通过查找Q表选择最优动作。然而，当状态空间和动作空间非常大时，Q表的存储和更新变得困难，这就是所谓的“维度灾难”问题。为了解决这个问题，DQN采用了深度神经网络来近似Q函数。通过训练神经网络，我们可以将状态作为输入，输出每个动作的对应Q值。这样，我们

1小时前 22:10 深度学习机器学习算法的概念 0

岩芯数智发布离线端侧部署的非Attention机制大型模型

产品推荐

最新发布

相关推荐

热门关注