Документ взят из кэша поисковой машины. Адрес оригинального документа : http://theory.sinp.msu.ru/pipermail/ru-ngi/2011q1/000120.html
Дата изменения: Tue Mar 29 10:25:35 2011
Дата индексирования: Tue Oct 2 02:44:30 2012
Кодировка:
[RU-NGI] Fw: Nagios tests of CE

[RU-NGI] Fw: Nagios tests of CE

Y.Lyublev lublev at itep.ru
Tue Mar 29 09:28:39 MSD 2011


Добрый день коллеги.
Надеюсь на вашу помощь, советы.
С уважением. Евгений.

> Добрый день, Лев.
> Очень нужна ваша помощь.
> Пытаюсь разобраться, но пока практически безрезультатно,
> с проблемами Nagios тестов для одного из СЕ, запускаемые под
> вашим DN.
> Кстати, тесты вашего коллеги
> ("/DC=ch/DC=cern/OU=Organic Units/OU=Users/CN=wlapka/CN=623537/CN=Wojciech
> Lapka")
> проходят без проблем.
> Проблемы, похоже, появились после того, как на нем остались
> только 32-битные узлы под Glite 3.1.
> Задание стартует, но после 7-8 секунд замирает, после чего
> завершается по истечению отпущенного на него времени.
> (WARNING: [1/2] [Running->Cancelled [timeout/dropped]] ).
> На узле ее следы -
> [root at wn46 ~]# ps -aef | grep opssgm003
> 44503    22091 22087  0 05:20 ?        00:00:00 /usr/bin/perl -w
> /tmp/bootstrap.I22088 /home/opssgm003/ ceitep.itep.ru
> /home/opssgm003/.globus/job/ceitep.itep.ru/9185.1301275185/x509_up
> X509GPG:globus-cache-export.A10031.gpg /dev/null
> /home/opssgm003/.globus/job/ceitep.itep.ru/9185.1301275185/stdout
stdoutftp
> /home/opssgm003/.globus/job/ceitep.itep.ru/9185.1301275185/stderr
stderrftp
> /home/opssgm003/.lcgjm/globus-cache-export.A10031
> https://ceitep.itep.ru:47998/9185/1301275185/ /home/opssgm003/ NONE
>
/home/opssgm003/.globus/.gass_cache/local/md5/19/c32fd8d917273c52916508a0c5c
> 65f/md5/0a/ab7bada1ef03cc69ac732dfda03e9a/data
>
'UI=000000:NS=0000000004:WM=000004:BH=0000000000:JSS=000003:LM=000000:LRMS=0
> 00000:APP=000000:LBS=000000'
> 44503    22111 22091  0 05:20 ?        00:00:00 /usr/bin/perl -w
> /tmp/bootstrap.I22088 /home/opssgm003/ ceitep.itep.ru
> /home/opssgm003/.globus/job/ceitep.itep.ru/9185.1301275185/x509_up
> X509GPG:globus-cache-export.A10031.gpg /dev/null
> /home/opssgm003/.globus/job/ceitep.itep.ru/9185.1301275185/stdout
stdoutftp
> /home/opssgm003/.globus/job/ceitep.itep.ru/9185.1301275185/stderr
stderrftp
> /home/opssgm003/.lcgjm/globus-cache-export.A10031
> https://ceitep.itep.ru:47998/9185/1301275185/ /home/opssgm003/ NONE
>
/home/opssgm003/.globus/.gass_cache/local/md5/19/c32fd8d917273c52916508a0c5c
> 65f/md5/0a/ab7bada1ef03cc69ac732dfda03e9a/data
>
'UI=000000:NS=0000000004:WM=000004:BH=0000000000:JSS=000003:LM=000000:LRMS=0
> 00000:APP=000000:LBS=000000'
> 44503    22190 22091  0 05:20 ?        00:00:00 /usr/bin/perl -w
> /tmp/bootstrap.I22088 /home/opssgm003/ ceitep.itep.ru
> /home/opssgm003/.globus/job/ceitep.itep.ru/9185.1301275185/x509_up
> X509GPG:globus-cache-export.A10031.gpg /dev/null
> /home/opssgm003/.globus/job/ceitep.itep.ru/9185.1301275185/stdout
stdoutftp
> /home/opssgm003/.globus/job/ceitep.itep.ru/9185.1301275185/stderr
stderrftp
> /home/opssgm003/.lcgjm/globus-cache-export.A10031
> https://ceitep.itep.ru:47998/9185/1301275185/ /home/opssgm003/ NONE
>
/home/opssgm003/.globus/.gass_cache/local/md5/19/c32fd8d917273c52916508a0c5c
> 65f/md5/0a/ab7bada1ef03cc69ac732dfda03e9a/data
>
'UI=000000:NS=0000000004:WM=000004:BH=0000000000:JSS=000003:LM=000000:LRMS=0
> 00000:APP=000000:LBS=000000'
> 44503    22212 22091  0 05:20 ?        00:00:00 sh -c if [ -x
> ${LCG_LOCATION:-/opt/lcg}/libexec/jobwrapper ]; then
> ${LCG_LOCATION:-/opt/lcg}/libexec/jobwrapper
> /home/opssgm003/globus-tmp.wn46.22091.0/globus-tmp.wn46.22091.2
>
'UI=000000:NS=0000000004:WM=000004:BH=0000000000:JSS=000003:LM=000000:LRMS=0
> 00000:APP=000000:LBS=000000'; else
> /home/opssgm003/globus-tmp.wn46.22091.0/globus-tmp.wn46.22091.2
>
'UI=000000:NS=0000000004:WM=000004:BH=0000000000:JSS=000003:LM=000000:LRMS=0
> 00000:APP=000000:LBS=000000'; fi
> 44503    22213 22212  0 05:20 ?        00:00:00 /bin/sh
> /opt/lcg/libexec/jobwrapper
> /home/opssgm003/globus-tmp.wn46.22091.0/globus-tmp.wn46.22091.2
>
UI=000000:NS=0000000004:WM=000004:BH=0000000000:JSS=000003:LM=000000:LRMS=00
> 0000:APP=000000:LBS=000000
> 44503    22256 22213  0 05:20 ?        00:00:00 /bin/sh
> /home/opssgm003/globus-tmp.wn46.22091.0/globus-tmp.wn46.22091.2
>
UI=000000:NS=0000000004:WM=000004:BH=0000000000:JSS=000003:LM=000000:LRMS=00
> 0000:APP=000000:LBS=000000
> 44503    22361 22256  0 05:21 ?        00:00:00 /bin/sh
> /home/opssgm003/globus-tmp.wn46.22091.0/globus-tmp.wn46.22091.2
>
UI=000000:NS=0000000004:WM=000004:BH=0000000000:JSS=000003:LM=000000:LRMS=00
> 0000:APP=000000:LBS=000000
> 44503    22362 22361  0 05:21 ?        00:00:00 /bin/sh
> /home/opssgm003/globus-tmp.wn46.22091.0/globus-tmp.wn46.22091.2
>
UI=000000:NS=0000000004:WM=000004:BH=0000000000:JSS=000003:LM=000000:LRMS=00
> 0000:APP=000000:LBS=000000
> 44503    22364 22361  0 05:21 ?        00:00:00 /bin/sh
> /home/opssgm003/globus-tmp.wn46.22091.0/globus-tmp.wn46.22091.2
>
UI=000000:NS=0000000004:WM=000004:BH=0000000000:JSS=000003:LM=000000:LRMS=00
> 0000:APP=000000:LBS=000000
> 44503    22387 22367  0 05:21 ?        00:00:00 python
>
/home/opssgm003/globus-tmp.wn46.22091.0/https_3a_2f_2fwms204.cern.ch_3a9000_
> 2fkl1ZVl9GBOxqfhgzMwz4xQ/nagios/bin/mta-simple --dirq
> /tmp/sam.22367.26551/msg-outgoing --destination
> /queue/grid.probe.metricOutput.EGEE.lcg05_sinp_msu_ru --broker-network
> PROD --pidfiledir
>
/home/opssgm003/globus-tmp.wn46.22091.0/https_3a_2f_2fwms204.cern.ch_3a9000_
> 2fkl1ZVl9GBOxqfhgzMwz4xQ/nagios/var/ -v info --bdii-uri
> lcg15.sinp.msu.ru:2170
> root     27555 27496  0 10:11 pts/0    00:00:00 grep opssgm003
>
> Чтобы исключить "дырявость" в узле, перенаправлял задачи на другие,
> даже для чистоты эксперимента добавил 64 битный узел,
> но не помогало.
> Можете подсказать выход или направление поиска причины проблемы?
> С уважением. Егений.
>


__________ Information from ESET NOD32 Antivirus, version of virus signature database 5995 (20110329) __________

The message was checked by ESET NOD32 Antivirus.

http://www.esetnod32.ru/.ml





More information about the RU-NGI mailing list