让AI快速吸收大量物理知识的方法：EIT和北大团队提出新概念「规则重要性」

　　发布于2024-12-16　阅读（0）

扫一扫，手机访问

如何把大量物理知识塞给AI？EIT和北大团队提出「规则重要性」概念

编辑 | ScienceAI

深度学习模型由于其可以从海量数据中学习潜在关系的能力而在科学研究领域产生了深远影响。然而，纯粹依赖数据的模型逐渐显露出其局限性，包括对数据的过度依赖、泛化能力的限制以及与现实物理世界的一致性问题。这些问题推动着研究者探索更具解释性和可解释性的模型，以弥补数据驱动模型的不足。因此，结合领域知识和数据驱动方法，构建更具可解释性和泛化能力的模型成为当前科学研究的重要方向。这种

例如，美国OpenAI公司开发的文本到视频模型Sora因其出色的图像生成能力而备受赞誉，被认为是人工智能领域的重要进展。尽管能够生成逼真的图像和视频，Sora在处理物理定律方面仍存在一些挑战，比如重力和物体碎裂等。虽然Sora在模拟现实场景方面取得了显著进展，但在理解和准确模拟物理规律方面还有改进的空间。AI技术的发展仍需要不断努力，以提高模型的全面性和准确性，从而更好地适应各种现实世界的情境。

解决这一问题的一个潜在途径是将人类知识融入深度学习模型中。通过结合先验知识和数据，可以增强模型的泛化能力，从而产生能够理解物理规律的「知情机器学习」（Informed machine learning）模型。这种方法有望提高模型的性能和准确性，使其能够更好地应对现实世界中的复杂问题。通过将人类专家的经验和洞察力融入机器学习算法，我们可以建立更加智能和高效的系统，从而推动人工智能技术的发展和应用。

目前，对深度学习中知识的确切价值仍然缺乏深入探讨。在确定哪些先验知识可以有效地整合到模型中以进行“预学习”方面，存在着一个急需解决的难题。同时，盲目地融合多项规则可能导致模型的失效，这一点也是需要引起重视的。这些限制给数据与知识关系的深入探索带来了挑战。

针对这一问题，东方理工（EIT）和北京大学的研究团队提出了「规则重要性」的概念，并开发了一套框架，能精确计算每个规则对模型预测精度的贡献。该框架不仅揭示了数据和知识之间的复杂相互作用关系，为知识嵌入提供了理论性指导，还有助于在训练过程中平衡知识和数据的影响。此外，该方法还可用于识别不恰当的先验规则，为交叉学科领域的研究与应用提供广阔前景。

这项研究题为“Prior Knowledge's Impact on Deep Learning”，已于2024年3月8日在 Cell 出版社旗下的跨学科期刊《Nexus》上发表。该研究受到了 AAAS（美国科学促进会）和 EurekAlert! 的关注报道。

如何把大量物理知识塞给AI？EIT和北大团队提出「规则重要性」概念

在教授孩子拼图时，既可以让他们通过反复试验来找出答案，也可以用一些基本的规则和技巧来引导他们。同样地，将规则和技巧——比如物理定律——融入到人工智能训练中能让它们更贴近现实，运作更高效。然而，如何评估这些规则在人工智能中的价值，一直是困扰研究者的难题。

鉴于先验知识的丰富多样性，将先验知识融入深度学习模型是一个复杂的多目标优化任务。研究团队创新性地提出了一个框架，以量化不同先验知识在提高深度学习模型方面的作用。他们将此过程视为充满合作与竞争的博弈，通过评估规则对模型预测的边际贡献来界定其重要性。首先生成所有可能的规则组合（即「联盟」），并对每个组合构建模型，并计算均方误差。

为降低计算成本，他们采用了一种基于扰动的高效算法：先训练一个完全基于数据的神经网络作为基线模型，然后逐一加入各个规则组合进行额外训练，最后在测试数据上评估模型表现。通过比较模型在包含和不包含某个规则的所有联盟中的表现，可以计算出该规则的边际贡献，进而得出其重要性。

如何把大量物理知识塞给AI？EIT和北大团队提出「规则重要性」概念

图示：规则重要性的计算流程（来源：论文）

通过流体力学的算例，研究人员探讨了数据与规则间的复杂关系。他们发现，在不同任务中，数据和先验规则的作用完全不同。当测试数据与训练数据分布相近时（即 In-distribution），数据量的增加会削弱规则的作用。

然而，当测试数据与训练数据分布相似度较低时（即 Out-of-distribution），全局规则的重要性被凸显出来，而局部规则的影响则被削弱。这两类规则的区别在于：全局规则（如控制方程）影响整个域，而局部规则（如边界条件）仅作用于特定区域。

如何把大量物理知识塞给AI？EIT和北大团队提出「规则重要性」概念

图示：规则重要性与数据量之间的关系（来源：论文）

研究团队经数值实验发现，在知识嵌入中，规则间存在三种相互作用效应：依赖效应、协同效应和替代效应。

依赖效应指某些规则需依赖其他规则才能有效；协同效应表明多条规则共同作用的效果超越各自独立作用时的总和；替代效应则显示一条规则的功能可能被数据或其他规则替代。

这三种效应同时存在，并受到数据量的影响。通过计算规则重要性，可清晰展示这些效应，为知识嵌入提供重要指导。

在应用层面，研究团队试图解决知识嵌入过程中的一个核心问题：如何平衡数据与规则的作用，以提升嵌入效率并筛选出不适宜的先验知识。在模型的训练过程中，该团队提出了一种动态调整规则权重的策略。

具体而言，随着训练迭代步的增加，逐渐增大正重要性规则的权重，同时减小负重要性规则的权重。这种策略能够根据优化过程的需求，实时调整模型对不同规则的关注度，从而实现更加高效和准确的知识嵌入。

此外，向 AI 模型传授物理定律可以使它们「更加贴近现实世界，从而在科学和工程领域发挥更大作用」。因此，该框架在工程、物理和化学领域具有广泛的实际应用。研究人员不仅优化了机器学习模型来求解多元方程，还准确识别出对薄层色谱分析预测模型性能有提升效果的规则。

实验结果显示，通过融入这些有效规则，模型的性能得到了显著提升，测试数据集上的均方误差从 0.052 降低至 0.036（减少了 30.8%）。这意味着该框架可以将经验性见解转化为结构化知识，从而显著提升模型性能。

总体而言，准确评估知识的价值有助于构建更契合现实的AI模型，提高安全性和可靠性，对深度学习发展具有重要意义。

如何把大量物理知识塞给AI？EIT和北大团队提出「规则重要性」概念

图示：通过规则重要性以识别有效的规则（来源：论文）

接下来，研究团队计划将他们的框架开发成可供人工智能开发人员使用的插件工具。他们的最终目标是开发出能够直接从数据中提取知识和规则，进而自我完善的模型，从而打造一个从知识发现到知识嵌入的闭环系统，使模型成为真正的人工智能科学家。

论文链接：https://www.cell.com/nexus/fulltext/S2950-1601(24)00001-9

AAAS 报道链接：https://www.eurekalert.org/news-releases/1036117

本文转载于：https://www.jiqizhixin.com/articles/2024-03-13-6 如有侵犯，请联系admin@zhengruan.com删除

上一篇：如何在两台电脑上共享文件夹

下一篇：电脑显示屏闪烁的原因是什么？

产品推荐

售后无忧
立即购买>

DAEMON Tools Lite 10【序列号终身授权 + 中文版 + Win】

￥150.00
office旗舰店
售后无忧
立即购买>

DAEMON Tools Ultra 5【序列号终身授权 + 中文版 + Win】

￥198.00
office旗舰店
售后无忧
立即购买>

DAEMON Tools Pro 8【序列号终身授权 + 中文版 + Win】

￥189.00
office旗舰店
售后无忧
立即购买>

CorelDRAW X8 简体中文【标准版 + Win】

￥1788.00
office旗舰店

正版软件

AI在体育运动中的环境与气候信息支持方面的应用

从对手分析、战术洞察、规划判罚到提高运动员表现，AI与机器学习已经融入到各项体育运动当中。NBA就在使用生成式AI来提供个性化的球迷观看内容；两届奥运会马拉松运动员DesLinden则拥有一套数字孪生心脏模型，能够模拟她的心率、血流量与血氧水平，据此微调训练强度以提高比赛成绩；亚特兰大猎鹰橄榄球队的主场梅赛德斯-奔驰体育场也已经部署了人脸识别检票系统。尽管体育产业出现了许多引人瞩目的AI应用，但一份报告指出，它对全球AI市场的贡献并不突出。从2020年6月至2023年6月，全球体育领域获得了363项与人工

2分钟前 AI 体育运动 0
正版软件

中国石化与宁德时代建立战略合作框架协议

3月14日消息显示，全球领先的动力电池制造商宁德时代于3月13日宣布与中国石化在北京签署了战略合作框架协议。官方指出，中石化集团公司董事长、党组书记马永生在总部会见宁德时代董事长兼总经理曾毓群一行，并一同见证签约，双方就进一步加强新能源、化工新材料、科技创新等领域合作深入交换意见。值得一提的是，中国石化3月9日还与吉利控股集团在北京签署战略合作框架协议，马永生在总部会见了吉利控股集团董事长李书福、副董事长杨健一行，此前，中国石化已与华为、万帮数字能源股份有限公司在充电桩领域展开合作。北京石油首座采用华为液

7分钟前新能源宁德时代中国石化 0
正版软件

EMS 解释“次日达”只是参考时效，不代表承诺时效

本站3月14日消息，据澎湃新闻报道，近日，来自广州的消费者林先生爆料称，自己在政务中心办理了更新护照业务，并选择了中国邮政EMS特快邮递取件服务。但护照寄出后他发现，同一个城市的快递显示最多要4天才能送达，导致自己的出国计划受到影响。然而，EMS中国邮政速递物流小程序里的《运费时效查询》显示，其服务特性为“在指定服务范围和时间内，提供今天寄明天到的次日递承诺服务”。针对上述情况，中国邮政速递物流相关人员回应称，大部分情况下“特快”快递都是可以次日达的，如果没有次日达，会有工作人员联系收件人。对于《运费时效

22分钟前快递 ems 0
正版软件

科技昨夜今晨 0314：小米汽车 SU7 顶配版或将定价超过 30 万；北汽 x 华为合作享界 S9 汽车新型曝光；蔚来或将推出乐道汽车作为第二品牌

“科技昨夜今晨”时间，大家好，现在是2024年3月14日星期四，今天的重要科技资讯有：1、8.98万元起，比亚迪e2荣耀版车型上市比亚迪汽车宣布再推一款“荣耀版”车型，比亚迪e2荣耀版定价8.98万元起。该车尺寸4260×1760×1530mm，轴距2610mm，搭载70kW电机、43.2kWh电池，CLTC续航405km，基本参数和2023款一致。>>查看详情2、华为领跑2023年国际专利体系申请量，连续7年蝉联第一根据联合国官方公众号发布的数据，世界知识产权组织最新统计显示，到了2023年

37分钟前科技昨夜今晨 0
正版软件

（最新消息）美国众议院通过“TikTok法案”，等待参议院和总统批准生效

TikTok发表声明指出：“这一进程并不透明，法案之所以被强行通过，是因为它是一项禁令。我们希望参议院能够审慎考虑事实，倾听选民的声音，并认识到这对经济、700万家小型企业以及1.7亿使用我们服务的美国人将产生的影响。”本站3月13日消息，当地时间13（今）日上午，美国众议院投票通过了要求字节跳动剥离对旗下短视频平台TikTok的控制权的法案。据悉，该法案距离成为法律仍需两步走：在美国参议院讨论并投票，通过后再提交给总统批准。本站附事件经过：3月6日：美国两党议员小组周二提出立法提案，给字节跳动165天的

52分钟前 TikTok 字节跳动 0

让AI快速吸收大量物理知识的方法：EIT和北大团队提出新概念「规则重要性」

产品推荐

最新发布

相关推荐

热门关注