安全小课堂第123期【富文本存储型XSS漏洞挖掘】

Web安全京东SRC

2018-12-18 10,163

邮件、论坛、日志发布等UGC类（用户产生内容）业务构成在线生活的重要部分。作为供用户创造内容的“生产力工具”，其背后隐藏着巨大的攻击面。其中，最易产生的问题是XSS。

XSS(Cross-site scripting)是一种常见的web漏洞，借助XSS攻击者可以窃取隐私敏感数据，甚至产生蠕虫对业务带来灾难性影响。

JSRC 安全小课堂第123期，邀请到Martin作为讲师就如何通过模糊测试手段，挖掘UGC类业务中潜藏的富文本存储型XSS为大家进行分享。同时感谢小伙伴们的精彩讨论。

京安小妹：富文本存储型XSS和普通XSS有什么区别？

Martin：

核心区别在于业务场景。

普通反射/存储型XSS通常可以使用编程语言提供的函数（例如，PHP中的htmlspecialchars函数），将包括但不限于<、>、’、”、&等特殊符号转义为HTML实体解决。

但在许多UGC（User Generated Content）业务场景下，并不能“一刀切”。业务需要引入“富文本”，允许用户实现各类文字、图片效果。相关场景场景包括但不限于博客文章、邮件、论坛等编辑展示。

以Gmail为例，就需要允许用户使用<span>标签，配合style属性，实现一个邮件内容高亮效果。

此场景下，将特殊符号转义为HTML实体的“一刀切”方法就行不通了。所以，这时一般业务后端会维护一个基于 “黑名单”/“白名单”思路的“富文本过滤器”。

“富文本过滤器”的任务就是根据内置的正则表达式和一系列规则，自动分析过滤用户提交的内容，从中分离出合法和被允许的 HTML标签、属性，然后经过层层删除过滤和解析，保留可接受的HTML内容，最终展示到网页前端用户。

如此复杂的场景下，就存在不少隐藏的“攻击面”。由于能注入未被转义的HTML标签，一旦能绕过，就会产生XSS问题。

我们称之为“富文本存储型XSS”。

Ps. XSS类漏洞危害在此不做赘述，只要找到XSS无论是反射、存储，结合业务特性，往往能形成比较大的危害。

京安小妹：富文本中的“边界”

Martin：

“边界” 这一概念是针对HTML内容、以及富文本过滤处理逻辑讲的。

以一段普通的HTML代码为例：

假设我们要DIY一个“富文本过滤器”，遇到上述 HTML 文本，应该如何解析和过滤？也许是这样的：首先匹配到<span，发现span是一个可信的HTML标签名。所以，接着进入其属性值过滤的逻辑。首先是否含有高危的 on 开头的事件属性，发现存在 onmouseover 但被”,”包裹，作为 class属性的属性值，所以并不存在危险，于是放行。然后分析 style 属性，其中有高危关键词”expression()”。综合分析下来，进行清除过滤。

上述只是富文本过滤思路的简单阐释。这段逻辑，根本上依赖于正则或语法树的 HTML“边界”分析。通过对“边界”的判定，类似 class=”yyyyonmouserover=11111” 的属性及其值才会被放行，因为虽然 onmouserover=11111 虽然是高危事件属性（定义参考：http://www.w3school.com.cn/jsref/dom_obj_event.asp），但存在于=””中，没有独立成一个 HTML 属性，也就不存在风险。

所以在上面的例子中，=””就是边界，<span 中的尖括号也是边界，空格也可以说成一种边界。

所以，我们可以用如下方式，标注出上面一段HTML文本中“边界”的位置：

综上，简单总结了HTML文本中“边界”位置出现的符号/内容。

京安小妹：富文本存储型XSS的模糊测试挖掘

Martin：

通过上一部分，我们已了解了HTML文本中“边界”的概念。其实，富文本存储型XSS产生的原因，根本原因就是：过滤器在处理特殊符号、进制编码过程中，解析“边界”不当，导致恶意HTML标签、属性能“躲避”过滤器的“围追堵截”，产生“富文本存储型XSS”。

富文本存储型XSS的挖掘，成败可能往往在一个“字符串”之间。因此，这里介绍一种常用的手法“模糊测试”。其本质是一种黑盒测试手段，谈到“黑盒测试”，核心就是要生成大量“测试用例（Payload）”并发送，观察业务回吐的处理结果，发现漏洞。

到这里，富文本存储型XSS的模糊测试方式，就呼之欲出了。无论是使用Python、PHP，还是Node.js、Java，通过字符串拼接，随机生成大量“富文本XSS Payload”，发送给业务后端处理，然后观察响应。

核心代码逻辑，一言以概之，就是通过字符串拼接，生成含能执行JS代码的“畸形HTML富文本Payload”。如下

例如：

当然，真实场景下，逐条Payload生成、发送进行测试是不行的。可以写个简单的循环，批量生成中：

示例效果如下：

Ps. 受篇幅限制，更多技术问题后续可做深入交流。

京安小妹：富文本存储型XSS案例分享

Martin：

听完了上面简单的介绍，不知小伙伴们是否已经Get到今天要讲的“富文本存储型XSS”相关的知识了呢？

为了帮助伙伴们更好的理解，这里分享一些公开的真实案例。

[1] WordPress < 4.1.2 存储型XSS分析与稳定POC

https://www.leavesongs.com/HTML/wordpress-4-1-stored-xss.html

[2] WordPress 4.2 Stored XSS

https://klikki.fi/adv/wordpress2.html

[3] WordPress < 4.2.3 Stored XSS

https://klikki.fi/adv/wordpress3.html

京安小妹：富文本存储型XSS的规避方式

Martin：

1) 从产生源头解决，引入稳定可靠的“富文本过滤器（模块）”。产生富文本存储型XSS的根本原因是“富文本过滤器（模块）”存在缺陷，导致恶意标签、属性漏过过滤。

因此，在项目中使用稳定可靠的富文本过滤模块，可从源头上源头上彻底解决问题。

这里按不同语言推荐两款：

a. Node.js https://github.com/cure53/DOMPurify

b. PHP http://phith0n.github.io/XssHtml/

2) 提高攻击门槛，阻断带恶意HTML内容的请求提交/执行，引入WAF和CSP。针对这两种方案，此处不做赘述，CSP后续希望能有机会单独和各位交流分享。

本文作者：京东SRC

本文为安全脉搏专栏作者发布，转载请注明：https://www.secpulse.com/archives/93377.html

Tags: CSP、HTML、HTML内容、html标签、js代码、Payload生成、style 属性、XSS、交流分享、分析过滤、危险、字符串、富文本过滤器、属性、循环、特殊符号、稳定POC、结合业务特性、绕过、网页前端、解析、边界、过滤、过滤模块、逻辑、黑盒测试

点赞： 15 评论：2 收藏： 1

积分 2

快来写下你的想法吧！

水墨江南 2018-12-18 22:15:40

<script src=XSS payload></script>

回复 0 0
- SecPulse 2018-12-18 22:52:48
  
  @水墨江南厉害 xss打到一群人了
  
  回复 0 0

	京东SRC
	文章数：72	积分： 129
	京东安全应急响应中心

安全问答社区

脉搏官方公众号

活动日程

2022-06-17

Gdevops 全球敏捷运维峰会

2022-05-12

Mastering the Challenge！——来自The 3rd AutoCS 2022智能汽车信息安全大会的邀请函

2021-11-18

AutoSW 2021智能汽车软件开发大会

2021-06-27

2021中国国际网络安全博览会暨高峰论坛

2021-05-27

The 2nd AutoCS 2021智能汽车信息安全大会

2020-12-18

贝壳找房2020 ICS安全技术峰会

2020-12-11

全球敏捷运维峰会（Gdevops2020）

2020-12-04

2020京麒网络安全大会

2020-11-29

OPPO技术开放日第六期|聚焦应用与数据安全防护

2020-11-27

EISS-2020企业信息安全峰会之上海站 11.27

2020-09-24

CSDI summit中国软件研发管理行业技术峰会

2020-09-23

2020中国国际智慧能源暨能源数据中心与网络信息安全装备展览会

2020-07-31

EISS-2020企业信息安全峰会之北京站 | 7.31（周五线上）

2020-04-15

看雪.安恒 2020 KCTF 春季赛

2020-01-09

相约本地生活安全沙龙暨白帽子颁奖典礼

安全小课堂第123期【富文本存储型XSS漏洞挖掘】

相关文章

安全问答社区

脉搏官方公众号

活动日程

2022-06-17

2022-05-12

2021-11-18

2021-06-27

2021-05-27

2020-12-18

2020-12-11

2020-12-04

2020-11-29

2020-11-27

2020-09-24

2020-09-23

2020-07-31

2020-04-15

2020-01-09

安全问答社区

脉搏官方公众号

友情链接

关注我们

SecPluse

合作伙伴

品牌归属

关于我们

脉搏文库

安全建设

其他

安全小课堂第123期【富文本存储型XSS漏洞挖掘】

相关文章

安全问答社区

脉搏官方公众号

活动日程

2022-06-17

2022-05-12

2021-11-18

2021-06-27

2021-05-27

2020-12-18

2020-12-11

2020-12-04

2020-11-29

2020-11-27

2020-09-24

2020-09-23

2020-07-31

2020-04-15

2020-01-09

安全问答社区

脉搏官方公众号

友情链接

关注我们

SecPluse

合作伙伴

品牌归属

关于我们