NAKAMURA Minoru's Diary (2006年2月)

2/27 (月)

[Prog] Linux のシグナル処理の速度

訳あって Linux のシグナルの処理速度の測定に入る。こんな感じのプログラムでヘコヘコ速度測定。

/*
 *  segvtest.c
 */
#include <setjmp.h>
#include <signal.h>
#include <stdio.h>

static sigjmp_buf return_point;

static volatile int counter0 = 0;
static volatile int counter1 = 0;
 
static void signal_handler(int sig, siginfo_t* sig_info, void* sig_data) {
  counter1++;
  siglongjmp(return_point, 1);
}
 
int main(int argc, char **argv) {
  char* p = 0;
  int i;
  /* シグナルハンドラの設定 */
  struct sigaction newAct, oldAct;
 
  sigemptyset(&(newAct.sa_mask));
  sigaddset(&(newAct.sa_mask), SIGSEGV);
  newAct.sa_sigaction = signal_handler;
  newAct.sa_flags = SA_SIGINFO|SA_RESTART|SA_ONSTACK; 
 
  if (sigaction(SIGSEGV, &newAct, &oldAct)) {
    perror("sigaction error"), exit(1);
  }
 
  /* わざとスタックオーバーフローを発生させてハンドルする */
  for (i = 0; i<1000 * 1000 * 10 ; i++) {
    if (sigsetjmp(return_point, 1) == 0) {
      counter0++;
      *p = 0; /* null pointer exception */
    }
  }

  printf("counter0=%d counter1=%d\n", counter0, counter1);
  return 0;
}

10 * 1000 * 1000 回メモリフォールトを起こして sigsetjmp → SEGV シグナル → siglongjmp を繰り返す。経過秒数を 10 で割ると 1試技のμ秒数。

予想通り IA-64 は結構シグナル処理が高速。
ただ GCC の問題なのかメモリオーダリングなの問題なのか、 GCC 3.2.? の -O2 までは正常に動くのだが、 -O3 からは最後の出力が counter0=0 counter1=5000000 になる。

	Xeon MP (2.0GHz)	Itanium2 (1.3GHz)
Pthreadなし	6.0μ秒	1.9μ秒
Pthreadアタッチ	6.0μ秒	2.3μ秒

もう少しプログラムに工夫がいるかしら。

追記：3/1

IA-64 でコンパイラの最適化レベルを上げた時に、 10,000,000 回実行したつもりが counter0 が 0、 counter1 が半分の 5,000,000 回としか表示されないのは、やはりメモリオーダリングが原因だった。

POINT1 の位置にメモリバリアを置くと、 counter1 の書き込みは順序化されるのでシグナルの発生した本当の回数が分かるようになる。この時の printf の出力は counter0=0 counter1=5000000 となる。やはり半分しか SEGV シグナルは発生していない。解釈としては、ループ誘導変数 i が書き込まれるタイミングの 2回に1回は null pointer exception が追い越していくようだ。 counter0 に至っては1度もメモリに実際の書き込みが発生していないので、 null pointer exception に必ず追い越されるということになる。

期待したようにプログラムを動かすには、 POINT2 の位置にメモリバリアを立てるのが正解のようだ。 counter0 も counter1 も 10,000,000 回となった。

#define membar()  asm volatile("mf":::"memory")
 
static void signal_handler(int sig, siginfo_t* sig_info, void* sig_data) {
  counter1++;
  /* POINT1: membar(); */   
  siglongjmp(return_point, 1);
}

  for (i = 0; i<1000 * 1000 * 10 ; i++) {
    if (sigsetjmp(return_point, 1) == 0) {
      counter0++;
      /* POINT2 membar(); */
      *p = 0;
    }
  }

VMware ESX Server のメモリ管理

Memory Resource Management in VMware ESX Server という論文を見つけて読み読み。 USENIX の OSDI'02 の論文みたいね。 ESX Server は下の 1. の Disco という方式を基にしているようだ。 ESX Server 側で page fault を拾って、 machine address space (本当の物理ページ) を physical address space (ゲストOSから見たときの物理ページ) として割り当てているようだね。ゲストOS側のマシンの TLB はどうなっているのか不明。

ついでに以下の本を購入。
一夜漬けの知識でどこまで通じるか？

詳細Linuxカーネル第2版 (Daniel P. Bovet、Marco Cestati 著、高橋浩和ら訳、オライリー・ジャパン): 説明は不要？

覚え書き

家賃を払ったよ。

検索語	検索結果
"ガベージコレクション"	約 58,500 件
"ガーベージコレクション"	約 29,100 件
"ガーベッジコレクション"	約 16,200 件
"ガーベジコレクション"	約 238 件
"ガベジコレクション"	約 81 件
"ガッベージコレクション"	約 14 件
"ガッベッジコレクション"	さすがに0件

OS	API	インクルードファイル
Linux	pthread_getattr_np	pthread.h
FreeBSD	pthread_attr_get_np	pthread_np.h
OpenBSD	pthread_stackseg_np(3)	pthread_np.h & sys/signal.h
MacOS X	pthread_get_stacksize_np pthread_get_stackaddr_np	pthread.h
Solaris	thr_stksegment(3thr)	thread.h & sys/signal.h

刺身の盛り合わせ	タラバガニのスープ	七輪焼き	に・く
あんこう唐揚げうま～	小芋のあんかけこれもうま～	米沢牛下駄カルビカットステーキ(ガーリック)	トマトの浅漬け
山芋いそべ揚げ	ごぼうの唐揚げ	鯵の押し寿司・ねぎとろ巻・等	お味噌汁

お店の前
五種前菜盛り合わせ (クラゲ、チャーシュー、ピータン、蒸しどり、ユバ巻)	車海老のチリソース	牛肉のXO醤炒め	生ガニの卵炒め
北京ダック		豚肉の角煮	挟んだところ
カニ肉とダイコンの煮付け	フカヒレの煮込みスープ	アンニンドーフ

NAKAMURA Minoru の日記 (2006年2月)

[Prog] Linux のシグナル処理の速度

追記：3/1

VMware ESX Server のメモリ管理

覚え書き

[Prog] 2進化10進数 (BCD) の計算アルゴリズム

追記：3/5

追記：4/18

深遠なる Garbage Collection の謎

知らない間に WinCDR の開発・販売元が Aplix から Ulead に

Para-virtualization についての雑考

ファイル復活はまだまだ続く

追記：2/27

[Prog] スレッドのスタック領域のアドレスとサイズを取得するには

[MyWeb] 「スタックオーバーフローのハンドリング (Stack Overflow Handling)」のページを修正

更新

龍上海＠新横浜ラーメン博物館 (ラー博)

九十厨＠沼津 (公式)

久しぶりに秋葉原に出る

今日見つけた理不尽を感じる画像

[Java][Prog] VTune で苦労する

A. Linux 2.6 系カーネルの NPTL 対策

B. Java 用の Pause/Resume API がない

C. バッファイサイズが大きすぎると駄目みたい

松下電器より心からのお願いです

オライリーの本

ドナドナドナ

UC CARDの Web 明細サービスキャッシュバックの終了

寒い…

TODO

iTMS で購入した楽曲の DRM なし版をダウンロード

[Prog][Unix][Windows] 穴空きファイル

P.S.

[Bench] SPEC CPU2000 スコア

更新

新年会％旧暦仕様 兼 節分会 兼 N404号室解散会

時事

原稿書き書き

浮動小数点演算の実装

新年会％旧暦仕様兼節分会兼 N404号室解散会