Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://theory.sinp.msu.ru/pipermail/ru-ngi/2011q1/000121.html
Дата изменения: Tue Mar 29 14:25:09 2011 Дата индексирования: Tue Oct 2 02:44:38 2012 Кодировка: |
День добрый! У меня с 25-го такая же беда, причем как на cream-CE, так и на lcg-CE - и только с тестами opssgm. Просто ops, как и все остальные VO считаются без проблем. Всех благ, Сергей Quoting "Y.Lyublev" <lublev at itep.ru>: > Добрый день коллеги. > Надеюсь на вашу помощь, советы. > С уважением. Евгений. > >> Добрый день, Лев. >> Очень нужна ваша помощь. >> Пытаюсь разобраться, но пока практически безрезультатно, >> с проблемами Nagios тестов для одного из СЕ, запускаемые под >> вашим DN. >> Кстати, тесты вашего коллеги >> ("/DC=ch/DC=cern/OU=Organic Units/OU=Users/CN=wlapka/CN=623537/CN=Wojciech >> Lapka") >> проходят без проблем. >> Проблемы, похоже, появились после того, как на нем остались >> только 32-битные узлы под Glite 3.1. >> Задание стартует, но после 7-8 секунд замирает, после чего >> завершается по истечению отпущенного на него времени. >> (WARNING: [1/2] [Running->Cancelled [timeout/dropped]] ). >> На узле ее следы - >> [root at wn46 ~]# ps -aef | grep opssgm003 >> 44503 22091 22087 0 05:20 ? 00:00:00 /usr/bin/perl -w >> /tmp/bootstrap.I22088 /home/opssgm003/ ceitep.itep.ru >> /home/opssgm003/.globus/job/ceitep.itep.ru/9185.1301275185/x509_up >> X509GPG:globus-cache-export.A10031.gpg /dev/null >> /home/opssgm003/.globus/job/ceitep.itep.ru/9185.1301275185/stdout > stdoutftp >> /home/opssgm003/.globus/job/ceitep.itep.ru/9185.1301275185/stderr > stderrftp >> /home/opssgm003/.lcgjm/globus-cache-export.A10031 >> https://ceitep.itep.ru:47998/9185/1301275185/ /home/opssgm003/ NONE >> > /home/opssgm003/.globus/.gass_cache/local/md5/19/c32fd8d917273c52916508a0c5c >> 65f/md5/0a/ab7bada1ef03cc69ac732dfda03e9a/data >> > 'UI=000000:NS=0000000004:WM=000004:BH=0000000000:JSS=000003:LM=000000:LRMS=0 >> 00000:APP=000000:LBS=000000' >> 44503 22111 22091 0 05:20 ? 00:00:00 /usr/bin/perl -w >> /tmp/bootstrap.I22088 /home/opssgm003/ ceitep.itep.ru >> /home/opssgm003/.globus/job/ceitep.itep.ru/9185.1301275185/x509_up >> X509GPG:globus-cache-export.A10031.gpg /dev/null >> /home/opssgm003/.globus/job/ceitep.itep.ru/9185.1301275185/stdout > stdoutftp >> /home/opssgm003/.globus/job/ceitep.itep.ru/9185.1301275185/stderr > stderrftp >> /home/opssgm003/.lcgjm/globus-cache-export.A10031 >> https://ceitep.itep.ru:47998/9185/1301275185/ /home/opssgm003/ NONE >> > /home/opssgm003/.globus/.gass_cache/local/md5/19/c32fd8d917273c52916508a0c5c >> 65f/md5/0a/ab7bada1ef03cc69ac732dfda03e9a/data >> > 'UI=000000:NS=0000000004:WM=000004:BH=0000000000:JSS=000003:LM=000000:LRMS=0 >> 00000:APP=000000:LBS=000000' >> 44503 22190 22091 0 05:20 ? 00:00:00 /usr/bin/perl -w >> /tmp/bootstrap.I22088 /home/opssgm003/ ceitep.itep.ru >> /home/opssgm003/.globus/job/ceitep.itep.ru/9185.1301275185/x509_up >> X509GPG:globus-cache-export.A10031.gpg /dev/null >> /home/opssgm003/.globus/job/ceitep.itep.ru/9185.1301275185/stdout > stdoutftp >> /home/opssgm003/.globus/job/ceitep.itep.ru/9185.1301275185/stderr > stderrftp >> /home/opssgm003/.lcgjm/globus-cache-export.A10031 >> https://ceitep.itep.ru:47998/9185/1301275185/ /home/opssgm003/ NONE >> > /home/opssgm003/.globus/.gass_cache/local/md5/19/c32fd8d917273c52916508a0c5c >> 65f/md5/0a/ab7bada1ef03cc69ac732dfda03e9a/data >> > 'UI=000000:NS=0000000004:WM=000004:BH=0000000000:JSS=000003:LM=000000:LRMS=0 >> 00000:APP=000000:LBS=000000' >> 44503 22212 22091 0 05:20 ? 00:00:00 sh -c if [ -x >> ${LCG_LOCATION:-/opt/lcg}/libexec/jobwrapper ]; then >> ${LCG_LOCATION:-/opt/lcg}/libexec/jobwrapper >> /home/opssgm003/globus-tmp.wn46.22091.0/globus-tmp.wn46.22091.2 >> > 'UI=000000:NS=0000000004:WM=000004:BH=0000000000:JSS=000003:LM=000000:LRMS=0 >> 00000:APP=000000:LBS=000000'; else >> /home/opssgm003/globus-tmp.wn46.22091.0/globus-tmp.wn46.22091.2 >> > 'UI=000000:NS=0000000004:WM=000004:BH=0000000000:JSS=000003:LM=000000:LRMS=0 >> 00000:APP=000000:LBS=000000'; fi >> 44503 22213 22212 0 05:20 ? 00:00:00 /bin/sh >> /opt/lcg/libexec/jobwrapper >> /home/opssgm003/globus-tmp.wn46.22091.0/globus-tmp.wn46.22091.2 >> > UI=000000:NS=0000000004:WM=000004:BH=0000000000:JSS=000003:LM=000000:LRMS=00 >> 0000:APP=000000:LBS=000000 >> 44503 22256 22213 0 05:20 ? 00:00:00 /bin/sh >> /home/opssgm003/globus-tmp.wn46.22091.0/globus-tmp.wn46.22091.2 >> > UI=000000:NS=0000000004:WM=000004:BH=0000000000:JSS=000003:LM=000000:LRMS=00 >> 0000:APP=000000:LBS=000000 >> 44503 22361 22256 0 05:21 ? 00:00:00 /bin/sh >> /home/opssgm003/globus-tmp.wn46.22091.0/globus-tmp.wn46.22091.2 >> > UI=000000:NS=0000000004:WM=000004:BH=0000000000:JSS=000003:LM=000000:LRMS=00 >> 0000:APP=000000:LBS=000000 >> 44503 22362 22361 0 05:21 ? 00:00:00 /bin/sh >> /home/opssgm003/globus-tmp.wn46.22091.0/globus-tmp.wn46.22091.2 >> > UI=000000:NS=0000000004:WM=000004:BH=0000000000:JSS=000003:LM=000000:LRMS=00 >> 0000:APP=000000:LBS=000000 >> 44503 22364 22361 0 05:21 ? 00:00:00 /bin/sh >> /home/opssgm003/globus-tmp.wn46.22091.0/globus-tmp.wn46.22091.2 >> > UI=000000:NS=0000000004:WM=000004:BH=0000000000:JSS=000003:LM=000000:LRMS=00 >> 0000:APP=000000:LBS=000000 >> 44503 22387 22367 0 05:21 ? 00:00:00 python >> > /home/opssgm003/globus-tmp.wn46.22091.0/https_3a_2f_2fwms204.cern.ch_3a9000_ >> 2fkl1ZVl9GBOxqfhgzMwz4xQ/nagios/bin/mta-simple --dirq >> /tmp/sam.22367.26551/msg-outgoing --destination >> /queue/grid.probe.metricOutput.EGEE.lcg05_sinp_msu_ru --broker-network >> PROD --pidfiledir >> > /home/opssgm003/globus-tmp.wn46.22091.0/https_3a_2f_2fwms204.cern.ch_3a9000_ >> 2fkl1ZVl9GBOxqfhgzMwz4xQ/nagios/var/ -v info --bdii-uri >> lcg15.sinp.msu.ru:2170 >> root 27555 27496 0 10:11 pts/0 00:00:00 grep opssgm003 >> >> Чтобы исключить "дырявость" в узле, перенаправлял задачи на другие, >> даже для чистоты эксперимента добавил 64 битный узел, >> но не помогало. >> Можете подсказать выход или направление поиска причины проблемы? >> С уважением. Егений. >> > > > __________ Information from ESET NOD32 Antivirus, version of virus > signature database 5995 (20110329) __________ > > The message was checked by ESET NOD32 Antivirus. > > http://www.esetnod32.ru/.ml > > > > _______________________________________________ > RU-NGI mailing list > RU-NGI at theory.sinp.msu.ru > http://theory.sinp.msu.ru/mailman/listinfo/ru-ngi > ---------------------------------------------------------------- This message was sent using IMP, the Internet Messaging Program.