用 preg_match('/<[\w]1*>/i', $item) 可快速识别含 HTML 标签的数组元素,需先 is_string() 过滤非字符串项,并配合 array_filter 批量筛选,注意处理 < 实体编码及避免跨标签误匹配。> ↩

php数组如何筛选含HTML标签项_phpHTML标签数组筛选【技巧】

如何用 preg_match 快速识别含 HTML 标签的数组元素

PHP 数组里混入带 HTML 标签的字符串很常见,比如从富文本编辑器或 CMS 导出的数据。直接用 strip_tags() 会删内容,而筛选需求是「只留下有标签的项」——这时别想复杂,正则最直接。

核心逻辑:匹配任意成对或自闭合的 HTML 标签(如 <div><br/><p class="x">),只要字符串中出现一次就算命中。

array_filter + 匿名函数批量筛选

一次性处理整个数组,推荐用 array_filter 配合内联判断,代码干净且可读性强。

$htmlItems = array_filter($data, function($item) {
    return is_string($item) && preg_match('/<[a-zA-Z][^>]*>/i', $item);
});

几个关键点:

遇到 &lt; 实体编码怎么办?

有些数据里 HTML 标签被转义成 &lt;div&gt;,此时 preg_match 默认无法识别。不能盲目 html_entity_decode(),因为可能把本意就是显示符号的 &lt; 错解成标签。

性能敏感场景下避免重复正则编译

如果这个筛选逻辑高频调用(比如在循环中处理上千条记录),每次 preg_match 都会重新编译正则,开销可测。

真正麻烦的不是怎么写,而是数据来源是否可信:用户输入、第三方 API、旧系统导出……每种场景下「什么是合法 HTML 标签」的定义都不同,得按实际边界来调正则,而不是套一个万能表达式。

本文转载于:互联网 如有侵犯,请联系zhengruancom@outlook.com删除。
免责声明:正软商城发布此文仅为传递信息,不代表正软商城认同其观点或证实其描述。