2009-08-22 26 views
1

私はLinux上でデーモンを作成しています。シグナルSIGHUP、SIGTERM、SIGINT、およびSIGQUITをトラップし、syslogを使用してシグナルを記録して終了します。 SIGSEGVを受け取った場合、コアダンプが発生します。これらが起こると、すべてが予想どおりに起こりますが、しばらくしてから終了します...正常に終了せず、信号を記録せず、コアダンプを残しません。私は困惑しており、どのように問題をデバッグするか分からない。これらの信号以外にどのような方法で終了できますか?明白な答え、私が紛失しているものはありますか?デーモンプロセスでこのような一見散発的な問題をデバッグするには、他にどのようなデバッグ方法をお勧めしますか?予期せず終了するデーモンのデバッグ

答えて

3

デーモンがネットワークソケットで作業している場合は、SIGPIPEとなる可能性が非常に高いです。相手側が閉じているソケット(またはパイプ)に書き込もうとすると、これが表示されます。ソケットに書き込む前に書き込み可能かどうかをチェックしていても(例えばselect()の場合)、そのチェックと書き込み自体の間でいつでも閉じることができます。

+0

ああ!私はソケットを使用しているし、SIGPIPEをトラップしない、それを考えなかった、私はそれであると賭ける。現在、私のselect()呼び出しは中断されてもブレークするループにありますが、SIGPIPEの場合はループに留まりたいです。あなたのコメントから、select()コールがSIGPIPEによって中断されることはなく、read()/ write()コールだけが中断されることはないということは、本当ですか? – user19745

+1

あなたのプロセスは 'select()'から 'SIGPIPE 'によってシグナルが送られることはありませんが、読み込み可能とマークされたファイルディスクリプタと共に返されます(クローズされていることが分かります)。 'SIGPIPE'は' write() 'によってのみ呼び出されます。 'SIGPIPE'を無視または処理すると、' write() 'は' EPIPE'を返します。 – caf

2

デーモンの親を持っておき、それを待ってから、親のログにデーモンが終了する理由(シグナルが送られたか、終了したか)を記録させることができます。

+0

これは優れた解決策です。子供がいったん亡くなられたら、親からこの情報をどのように入手できますか? – user19745

+0

親では、wait waitを呼び出し、WIFEXITED/WIFSIGNALEDを使用して何が起こったかを判断し、syslogに適切なログメッセージを呼び出します。 manページで待ち合わせを確認してください。 –

1

まあ、それはあなたが何もすることはできませんもちろん、SIGKILLを含めて、それを終了させる原因となる多くの他の信号があります。基本的には(後者は、少なくともコア・ダンプを残すだろうが)ActionTermCoreあるman 7 signalから、次の内容で何か:

First the signals described in the original POSIX.1-1990 standard. 

    Signal  Value  Action Comment 
    ------------------------------------------------------------------------- 
    SIGHUP  1  Term Hangup detected on controlling terminal 
           or death of controlling process 
    SIGINT  2  Term Interrupt from keyboard 
    SIGQUIT  3  Core Quit from keyboard 
    SIGILL  4  Core Illegal Instruction 

    SIGABRT  6  Core Abort signal from abort(3) 
    SIGFPE  8  Core Floating point exception 
    SIGKILL  9  Term Kill signal 
    SIGSEGV  11  Core Invalid memory reference 
    SIGPIPE  13  Term Broken pipe: write to pipe with no readers 
    SIGALRM  14  Term Timer signal from alarm(2) 
    SIGTERM  15  Term Termination signal 
    SIGUSR1 30,10,16 Term User-defined signal 1 
    SIGUSR2 31,12,17 Term User-defined signal 2 
    SIGCHLD 20,17,18 Ign  Child stopped or terminated 
    SIGCONT 19,18,25 Cont Continue if stopped 
    SIGSTOP 17,19,23 Stop Stop process 
    SIGTSTP 18,20,24 Stop Stop typed at tty 
    SIGTTIN 21,21,26 Stop tty input for background process 
    SIGTTOU 22,22,27 Stop tty output for background process 

    The signals SIGKILL and SIGSTOP cannot be caught, blocked, or ignored. 

    Next the signals not in the POSIX.1-1990 standard but described in SUSv2 and POSIX.1-2001. 

    Signal  Value  Action Comment 
    ------------------------------------------------------------------------- 
    SIGBUS  10,7,10  Core Bus error (bad memory access) 
    SIGPOLL     Term Pollable event (Sys V). Synonym of SIGIO 
    SIGPROF  27,27,29 Term Profiling timer expired 
    SIGSYS  12,-,12  Core Bad argument to routine (SVr4) 
    SIGTRAP  5  Core Trace/breakpoint trap 
    SIGURG  16,23,21 Ign  Urgent condition on socket (4.2BSD) 
    SIGVTALRM 26,26,28 Term Virtual alarm clock (4.2BSD) 
    SIGXCPU  24,24,30 Core CPU time limit exceeded (4.2BSD) 
    SIGXFSZ  25,25,31 Core File size limit exceeded (4.2BSD) 

    Up to and including Linux 2.2, the default behaviour for SIGSYS, SIGXCPU, SIGXFSZ, and (on architectures other than SPARC 
    and MIPS) SIGBUS was to terminate the process (without a core dump). (On some other Unices the default action for SIGX- 
    CPU and SIGXFSZ is to terminate the process without a core dump.) Linux 2.4 conforms to the POSIX.1-2001 requirements 
    for these signals, terminating the process with a core dump. 

    Next various other signals. 

    Signal  Value  Action Comment 
    -------------------------------------------------------------------- 
    SIGIOT   6  Core IOT trap. A synonym for SIGABRT 
    SIGEMT  7,-,7  Term 
    SIGSTKFLT -,16,-  Term Stack fault on coprocessor (unused) 
    SIGIO  23,29,22 Term I/O now possible (4.2BSD) 
    SIGCLD  -,-,18  Ign  A synonym for SIGCHLD 
    SIGPWR  29,30,19 Term Power failure (System V) 
    SIGINFO  29,-,-    A synonym for SIGPWR 
    SIGLOST  -,-,-  Term File lock lost 
    SIGWINCH 28,28,20 Ign  Window resize signal (4.3BSD, Sun) 
    SIGUNUSED -,31,-  Term Unused signal (will be SIGSYS) 
2

gdb -p <pid>
でそれにGDBをアタッチあなたは-gフラグ付きでコンパイルされていることを確認しますそれが終了するとすぐにバックトレースを取る。 幸運を祈る!

+0

私はあなたがそれをすることができるか分からなかった!デーモンが物理的にアクセスできないサーバー上で実行されているため、これは素晴らしいことです。私は定期的に私のラップトップで移動中であり、移動中に私が開いている端末を監視し続けることができません。このようにすれば、デーモンをシャットダウンすることなく、必要なときにgdbをアタッチ/デタッチすることができます。優れた! – user19745

1

シェルラッパーは、デーモンの終了ステータスをキャッチできます。

$ ./waitstatus true 
pid 1512: exit status 0 (success) 

$ ./waitstatus false 
pid 1514: exit status 1 (abnormal) 

$ ./waitstatus perl -e 'exit 21' 
pid 1518: exit status 21 (abnormal) 

$ ./waitstatus perl -e 'kill TERM => $$' 
pid 1520: terminated on signal 15 

$ ./waitstatus no-such-command 
pid 1522: command not found: no-such-command 

$ ./waitstatus /sbin/EACCES.contrived 
pid 1524: command not executable: /sbin/EACCES.contrived 

...と、ここでそれが実現しています方法は次のとおりです:ここではそれがどのように動作するかだ

$ cat ./waitstatus 
#! /bin/bash 

"[email protected]" & 
PID=$! 

wait $PID 
STATUS=$? 

if [ $STATUS -gt 128 ]; then 
    MSG="terminated on signal $(($STATUS - 128))"; 
else 
    case $STATUS in 
    0) 
     MSG="exit status 0 (success)" 
     ;; 
    127) 
     MSG="command not found: $1" 
     ;; 
    126) 
     MSG="command not executable: $1" 
     ;; 
    *) 
     MSG="exit status $STATUS (abnormal)" 
     ;; 
    esac 
fi 

echo "pid $PID: $MSG" 
exit $STATUS 

次の例のように、あなたのシステムのloggerコマンドの呼び出しに最後のecho行を変更する場合があります、ステータスメッセージをsyslogに転送してください。

関連する問題