Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://theory.sinp.msu.ru/pipermail/ru-ngi/2011q1/000120.html
Дата изменения: Tue Mar 29 10:25:35 2011 Дата индексирования: Tue Oct 2 02:44:30 2012 Кодировка: |
Добрый день коллеги. Надеюсь на вашу помощь, советы. С уважением. Евгений. > Добрый день, Лев. > Очень нужна ваша помощь. > Пытаюсь разобраться, но пока практически безрезультатно, > с проблемами Nagios тестов для одного из СЕ, запускаемые под > вашим DN. > Кстати, тесты вашего коллеги > ("/DC=ch/DC=cern/OU=Organic Units/OU=Users/CN=wlapka/CN=623537/CN=Wojciech > Lapka") > проходят без проблем. > Проблемы, похоже, появились после того, как на нем остались > только 32-битные узлы под Glite 3.1. > Задание стартует, но после 7-8 секунд замирает, после чего > завершается по истечению отпущенного на него времени. > (WARNING: [1/2] [Running->Cancelled [timeout/dropped]] ). > На узле ее следы - > [root at wn46 ~]# ps -aef | grep opssgm003 > 44503 22091 22087 0 05:20 ? 00:00:00 /usr/bin/perl -w > /tmp/bootstrap.I22088 /home/opssgm003/ ceitep.itep.ru > /home/opssgm003/.globus/job/ceitep.itep.ru/9185.1301275185/x509_up > X509GPG:globus-cache-export.A10031.gpg /dev/null > /home/opssgm003/.globus/job/ceitep.itep.ru/9185.1301275185/stdout stdoutftp > /home/opssgm003/.globus/job/ceitep.itep.ru/9185.1301275185/stderr stderrftp > /home/opssgm003/.lcgjm/globus-cache-export.A10031 > https://ceitep.itep.ru:47998/9185/1301275185/ /home/opssgm003/ NONE > /home/opssgm003/.globus/.gass_cache/local/md5/19/c32fd8d917273c52916508a0c5c > 65f/md5/0a/ab7bada1ef03cc69ac732dfda03e9a/data > 'UI=000000:NS=0000000004:WM=000004:BH=0000000000:JSS=000003:LM=000000:LRMS=0 > 00000:APP=000000:LBS=000000' > 44503 22111 22091 0 05:20 ? 00:00:00 /usr/bin/perl -w > /tmp/bootstrap.I22088 /home/opssgm003/ ceitep.itep.ru > /home/opssgm003/.globus/job/ceitep.itep.ru/9185.1301275185/x509_up > X509GPG:globus-cache-export.A10031.gpg /dev/null > /home/opssgm003/.globus/job/ceitep.itep.ru/9185.1301275185/stdout stdoutftp > /home/opssgm003/.globus/job/ceitep.itep.ru/9185.1301275185/stderr stderrftp > /home/opssgm003/.lcgjm/globus-cache-export.A10031 > https://ceitep.itep.ru:47998/9185/1301275185/ /home/opssgm003/ NONE > /home/opssgm003/.globus/.gass_cache/local/md5/19/c32fd8d917273c52916508a0c5c > 65f/md5/0a/ab7bada1ef03cc69ac732dfda03e9a/data > 'UI=000000:NS=0000000004:WM=000004:BH=0000000000:JSS=000003:LM=000000:LRMS=0 > 00000:APP=000000:LBS=000000' > 44503 22190 22091 0 05:20 ? 00:00:00 /usr/bin/perl -w > /tmp/bootstrap.I22088 /home/opssgm003/ ceitep.itep.ru > /home/opssgm003/.globus/job/ceitep.itep.ru/9185.1301275185/x509_up > X509GPG:globus-cache-export.A10031.gpg /dev/null > /home/opssgm003/.globus/job/ceitep.itep.ru/9185.1301275185/stdout stdoutftp > /home/opssgm003/.globus/job/ceitep.itep.ru/9185.1301275185/stderr stderrftp > /home/opssgm003/.lcgjm/globus-cache-export.A10031 > https://ceitep.itep.ru:47998/9185/1301275185/ /home/opssgm003/ NONE > /home/opssgm003/.globus/.gass_cache/local/md5/19/c32fd8d917273c52916508a0c5c > 65f/md5/0a/ab7bada1ef03cc69ac732dfda03e9a/data > 'UI=000000:NS=0000000004:WM=000004:BH=0000000000:JSS=000003:LM=000000:LRMS=0 > 00000:APP=000000:LBS=000000' > 44503 22212 22091 0 05:20 ? 00:00:00 sh -c if [ -x > ${LCG_LOCATION:-/opt/lcg}/libexec/jobwrapper ]; then > ${LCG_LOCATION:-/opt/lcg}/libexec/jobwrapper > /home/opssgm003/globus-tmp.wn46.22091.0/globus-tmp.wn46.22091.2 > 'UI=000000:NS=0000000004:WM=000004:BH=0000000000:JSS=000003:LM=000000:LRMS=0 > 00000:APP=000000:LBS=000000'; else > /home/opssgm003/globus-tmp.wn46.22091.0/globus-tmp.wn46.22091.2 > 'UI=000000:NS=0000000004:WM=000004:BH=0000000000:JSS=000003:LM=000000:LRMS=0 > 00000:APP=000000:LBS=000000'; fi > 44503 22213 22212 0 05:20 ? 00:00:00 /bin/sh > /opt/lcg/libexec/jobwrapper > /home/opssgm003/globus-tmp.wn46.22091.0/globus-tmp.wn46.22091.2 > UI=000000:NS=0000000004:WM=000004:BH=0000000000:JSS=000003:LM=000000:LRMS=00 > 0000:APP=000000:LBS=000000 > 44503 22256 22213 0 05:20 ? 00:00:00 /bin/sh > /home/opssgm003/globus-tmp.wn46.22091.0/globus-tmp.wn46.22091.2 > UI=000000:NS=0000000004:WM=000004:BH=0000000000:JSS=000003:LM=000000:LRMS=00 > 0000:APP=000000:LBS=000000 > 44503 22361 22256 0 05:21 ? 00:00:00 /bin/sh > /home/opssgm003/globus-tmp.wn46.22091.0/globus-tmp.wn46.22091.2 > UI=000000:NS=0000000004:WM=000004:BH=0000000000:JSS=000003:LM=000000:LRMS=00 > 0000:APP=000000:LBS=000000 > 44503 22362 22361 0 05:21 ? 00:00:00 /bin/sh > /home/opssgm003/globus-tmp.wn46.22091.0/globus-tmp.wn46.22091.2 > UI=000000:NS=0000000004:WM=000004:BH=0000000000:JSS=000003:LM=000000:LRMS=00 > 0000:APP=000000:LBS=000000 > 44503 22364 22361 0 05:21 ? 00:00:00 /bin/sh > /home/opssgm003/globus-tmp.wn46.22091.0/globus-tmp.wn46.22091.2 > UI=000000:NS=0000000004:WM=000004:BH=0000000000:JSS=000003:LM=000000:LRMS=00 > 0000:APP=000000:LBS=000000 > 44503 22387 22367 0 05:21 ? 00:00:00 python > /home/opssgm003/globus-tmp.wn46.22091.0/https_3a_2f_2fwms204.cern.ch_3a9000_ > 2fkl1ZVl9GBOxqfhgzMwz4xQ/nagios/bin/mta-simple --dirq > /tmp/sam.22367.26551/msg-outgoing --destination > /queue/grid.probe.metricOutput.EGEE.lcg05_sinp_msu_ru --broker-network > PROD --pidfiledir > /home/opssgm003/globus-tmp.wn46.22091.0/https_3a_2f_2fwms204.cern.ch_3a9000_ > 2fkl1ZVl9GBOxqfhgzMwz4xQ/nagios/var/ -v info --bdii-uri > lcg15.sinp.msu.ru:2170 > root 27555 27496 0 10:11 pts/0 00:00:00 grep opssgm003 > > Чтобы исключить "дырявость" в узле, перенаправлял задачи на другие, > даже для чистоты эксперимента добавил 64 битный узел, > но не помогало. > Можете подсказать выход или направление поиска причины проблемы? > С уважением. Егений. > __________ Information from ESET NOD32 Antivirus, version of virus signature database 5995 (20110329) __________ The message was checked by ESET NOD32 Antivirus. http://www.esetnod32.ru/.ml