Документ взят из кэша поисковой машины. Адрес оригинального документа : http://theory.sinp.msu.ru/pipermail/ru-ngi/2011q1/000121.html
Дата изменения: Tue Mar 29 14:25:09 2011
Дата индексирования: Tue Oct 2 02:44:38 2012
Кодировка:
[RU-NGI] Fw: Nagios tests of CE

[RU-NGI] Fw: Nagios tests of CE

zotkin at sinp.msu.ru zotkin at sinp.msu.ru
Tue Mar 29 10:25:30 MSD 2011


День добрый!

У меня с 25-го такая же беда, причем как на cream-CE, так и на lcg-CE  
- и только с тестами opssgm. Просто ops, как и все остальные VO  
считаются без проблем.

Всех благ,
Сергей

Quoting "Y.Lyublev" <lublev at itep.ru>:

> Добрый день коллеги.
> Надеюсь на вашу помощь, советы.
> С уважением. Евгений.
>
>> Добрый день, Лев.
>> Очень нужна ваша помощь.
>> Пытаюсь разобраться, но пока практически безрезультатно,
>> с проблемами Nagios тестов для одного из СЕ, запускаемые под
>> вашим DN.
>> Кстати, тесты вашего коллеги
>> ("/DC=ch/DC=cern/OU=Organic Units/OU=Users/CN=wlapka/CN=623537/CN=Wojciech
>> Lapka")
>> проходят без проблем.
>> Проблемы, похоже, появились после того, как на нем остались
>> только 32-битные узлы под Glite 3.1.
>> Задание стартует, но после 7-8 секунд замирает, после чего
>> завершается по истечению отпущенного на него времени.
>> (WARNING: [1/2] [Running->Cancelled [timeout/dropped]] ).
>> На узле ее следы -
>> [root at wn46 ~]# ps -aef | grep opssgm003
>> 44503    22091 22087  0 05:20 ?        00:00:00 /usr/bin/perl -w
>> /tmp/bootstrap.I22088 /home/opssgm003/ ceitep.itep.ru
>> /home/opssgm003/.globus/job/ceitep.itep.ru/9185.1301275185/x509_up
>> X509GPG:globus-cache-export.A10031.gpg /dev/null
>> /home/opssgm003/.globus/job/ceitep.itep.ru/9185.1301275185/stdout
> stdoutftp
>> /home/opssgm003/.globus/job/ceitep.itep.ru/9185.1301275185/stderr
> stderrftp
>> /home/opssgm003/.lcgjm/globus-cache-export.A10031
>> https://ceitep.itep.ru:47998/9185/1301275185/ /home/opssgm003/ NONE
>>
> /home/opssgm003/.globus/.gass_cache/local/md5/19/c32fd8d917273c52916508a0c5c
>> 65f/md5/0a/ab7bada1ef03cc69ac732dfda03e9a/data
>>
> 'UI=000000:NS=0000000004:WM=000004:BH=0000000000:JSS=000003:LM=000000:LRMS=0
>> 00000:APP=000000:LBS=000000'
>> 44503    22111 22091  0 05:20 ?        00:00:00 /usr/bin/perl -w
>> /tmp/bootstrap.I22088 /home/opssgm003/ ceitep.itep.ru
>> /home/opssgm003/.globus/job/ceitep.itep.ru/9185.1301275185/x509_up
>> X509GPG:globus-cache-export.A10031.gpg /dev/null
>> /home/opssgm003/.globus/job/ceitep.itep.ru/9185.1301275185/stdout
> stdoutftp
>> /home/opssgm003/.globus/job/ceitep.itep.ru/9185.1301275185/stderr
> stderrftp
>> /home/opssgm003/.lcgjm/globus-cache-export.A10031
>> https://ceitep.itep.ru:47998/9185/1301275185/ /home/opssgm003/ NONE
>>
> /home/opssgm003/.globus/.gass_cache/local/md5/19/c32fd8d917273c52916508a0c5c
>> 65f/md5/0a/ab7bada1ef03cc69ac732dfda03e9a/data
>>
> 'UI=000000:NS=0000000004:WM=000004:BH=0000000000:JSS=000003:LM=000000:LRMS=0
>> 00000:APP=000000:LBS=000000'
>> 44503    22190 22091  0 05:20 ?        00:00:00 /usr/bin/perl -w
>> /tmp/bootstrap.I22088 /home/opssgm003/ ceitep.itep.ru
>> /home/opssgm003/.globus/job/ceitep.itep.ru/9185.1301275185/x509_up
>> X509GPG:globus-cache-export.A10031.gpg /dev/null
>> /home/opssgm003/.globus/job/ceitep.itep.ru/9185.1301275185/stdout
> stdoutftp
>> /home/opssgm003/.globus/job/ceitep.itep.ru/9185.1301275185/stderr
> stderrftp
>> /home/opssgm003/.lcgjm/globus-cache-export.A10031
>> https://ceitep.itep.ru:47998/9185/1301275185/ /home/opssgm003/ NONE
>>
> /home/opssgm003/.globus/.gass_cache/local/md5/19/c32fd8d917273c52916508a0c5c
>> 65f/md5/0a/ab7bada1ef03cc69ac732dfda03e9a/data
>>
> 'UI=000000:NS=0000000004:WM=000004:BH=0000000000:JSS=000003:LM=000000:LRMS=0
>> 00000:APP=000000:LBS=000000'
>> 44503    22212 22091  0 05:20 ?        00:00:00 sh -c if [ -x
>> ${LCG_LOCATION:-/opt/lcg}/libexec/jobwrapper ]; then
>> ${LCG_LOCATION:-/opt/lcg}/libexec/jobwrapper
>> /home/opssgm003/globus-tmp.wn46.22091.0/globus-tmp.wn46.22091.2
>>
> 'UI=000000:NS=0000000004:WM=000004:BH=0000000000:JSS=000003:LM=000000:LRMS=0
>> 00000:APP=000000:LBS=000000'; else
>> /home/opssgm003/globus-tmp.wn46.22091.0/globus-tmp.wn46.22091.2
>>
> 'UI=000000:NS=0000000004:WM=000004:BH=0000000000:JSS=000003:LM=000000:LRMS=0
>> 00000:APP=000000:LBS=000000'; fi
>> 44503    22213 22212  0 05:20 ?        00:00:00 /bin/sh
>> /opt/lcg/libexec/jobwrapper
>> /home/opssgm003/globus-tmp.wn46.22091.0/globus-tmp.wn46.22091.2
>>
> UI=000000:NS=0000000004:WM=000004:BH=0000000000:JSS=000003:LM=000000:LRMS=00
>> 0000:APP=000000:LBS=000000
>> 44503    22256 22213  0 05:20 ?        00:00:00 /bin/sh
>> /home/opssgm003/globus-tmp.wn46.22091.0/globus-tmp.wn46.22091.2
>>
> UI=000000:NS=0000000004:WM=000004:BH=0000000000:JSS=000003:LM=000000:LRMS=00
>> 0000:APP=000000:LBS=000000
>> 44503    22361 22256  0 05:21 ?        00:00:00 /bin/sh
>> /home/opssgm003/globus-tmp.wn46.22091.0/globus-tmp.wn46.22091.2
>>
> UI=000000:NS=0000000004:WM=000004:BH=0000000000:JSS=000003:LM=000000:LRMS=00
>> 0000:APP=000000:LBS=000000
>> 44503    22362 22361  0 05:21 ?        00:00:00 /bin/sh
>> /home/opssgm003/globus-tmp.wn46.22091.0/globus-tmp.wn46.22091.2
>>
> UI=000000:NS=0000000004:WM=000004:BH=0000000000:JSS=000003:LM=000000:LRMS=00
>> 0000:APP=000000:LBS=000000
>> 44503    22364 22361  0 05:21 ?        00:00:00 /bin/sh
>> /home/opssgm003/globus-tmp.wn46.22091.0/globus-tmp.wn46.22091.2
>>
> UI=000000:NS=0000000004:WM=000004:BH=0000000000:JSS=000003:LM=000000:LRMS=00
>> 0000:APP=000000:LBS=000000
>> 44503    22387 22367  0 05:21 ?        00:00:00 python
>>
> /home/opssgm003/globus-tmp.wn46.22091.0/https_3a_2f_2fwms204.cern.ch_3a9000_
>> 2fkl1ZVl9GBOxqfhgzMwz4xQ/nagios/bin/mta-simple --dirq
>> /tmp/sam.22367.26551/msg-outgoing --destination
>> /queue/grid.probe.metricOutput.EGEE.lcg05_sinp_msu_ru --broker-network
>> PROD --pidfiledir
>>
> /home/opssgm003/globus-tmp.wn46.22091.0/https_3a_2f_2fwms204.cern.ch_3a9000_
>> 2fkl1ZVl9GBOxqfhgzMwz4xQ/nagios/var/ -v info --bdii-uri
>> lcg15.sinp.msu.ru:2170
>> root     27555 27496  0 10:11 pts/0    00:00:00 grep opssgm003
>>
>> Чтобы исключить "дырявость" в узле, перенаправлял задачи на другие,
>> даже для чистоты эксперимента добавил 64 битный узел,
>> но не помогало.
>> Можете подсказать выход или направление поиска причины проблемы?
>> С уважением. Егений.
>>
>
>
> __________ Information from ESET NOD32 Antivirus, version of virus   
> signature database 5995 (20110329) __________
>
> The message was checked by ESET NOD32 Antivirus.
>
> http://www.esetnod32.ru/.ml
>
>
>
> _______________________________________________
> RU-NGI mailing list
> RU-NGI at theory.sinp.msu.ru
> http://theory.sinp.msu.ru/mailman/listinfo/ru-ngi
>



----------------------------------------------------------------
This message was sent using IMP, the Internet Messaging Program.




More information about the RU-NGI mailing list