Bug #2603: NetBSD 5.0以降でpthreadの処理に由来する不具合
http://redmine.ruby-lang.org/issues/show/2603

起票者: Takahiro Kambe
ステータス: Open, 優先度: High
カテゴリ: core
ruby -v: ruby 1.8.7 (2010-01-10 patchlevel 249) [i486-netbsdelf]

Ruby 1.8.7 patchlevel 249はNetBSD 5.0以降では、pthreadの処理に由来する問題に
より、そのままでは実用に絶えません。

* Rubyでthreadを使用したプログラム
* systemやバッククォートで子プロセスを呼び出したプログラム

これらではRuby内部のpthreadによるthread_timer内で待ち続ける状態になって、
プロセスが SIGKILL でないと殺せない状態に陥る場合があります。

再現するには、インストール後に make test-all を行うと途中でテストが止まって、
先に進まなくなります。

[ruby-dev:38996]と本質的な問題は同じと思いますが、症状の出方やNetBSD上での
影響が大きいため別のチケットを作成しました。

pthreadを使用したプログラムには以下の制約があります。

(1) fork(2)した子プロセスは非同期シグナルに対して安全な関数だけを使用でき、
    pthread_*()な関数も使用できません(非同期シグナルに対して安全でない)。
(2) fork(2)を呼び出したスレッドだけが子プロセスでは動作し続けます。これは
    NetBSDのfork(2)に書かれていますが、要は他のスレッドはいなくなるという
    ことです。

[ruby-dev:40051]にて対策が提案されていますが、これを適用しても上記の状況は
解消されないため、先に挙げた問題は発生しなくなるケースもありましたが、完全
には解決しませんでした。

添付のファイルはNetBSD current (5.99.23)で、問題が解消していることを確認し
たものです。

patch-1
    子プロセスの方で pthread関係の関数の呼び出しを止めるようにしたもの

patch-2
   patch-1に加えてRubyでexec()を実行する場合は、fork(2)前にpthread関係の
   処理を従来通りに行うようにしたもの

修正箇所はpatch-2の方が多いですが、patch-1ではexec()を実行する前のpthread
関係の処理(process.cのbefore_exec()によるrb_thread_stop_timre()の呼び出し)も
省いてしまうことになるので、何か副作用があるかもしれません。


----------------------------------------
http://redmine.ruby-lang.org