Документ взят из кэша поисковой машины. Адрес оригинального документа : http://theory.sinp.msu.ru/pipermail/ru-ngi/2015q2/001544.html
Дата изменения: Sun Apr 26 16:42:26 2015
Дата индексирования: Sun Apr 10 18:17:15 2016
Кодировка:
[RU-NGI] torque-server-4.2.10

[RU-NGI] torque-server-4.2.10

Andrey Kiryanov globus at pnpi.nw.ru
Sun Apr 26 16:09:44 MSK 2015


Добрый день,

4-й Torque не совместим с предыдущими версиями. Об этом явно написано у 
них на сайте. Если решили переходить на 4-ю версию, то её нужно ставить 
везде.
И я могу подтвердить слова Валерия: пакеты из EPEL кривые, я тоже 
использую самостоятельно пропатченную, пересобранную и перезапакованную 
версию.

Y.Lyublev wrote:
> Добрый день.
> У меня ситуация почти как у Владимира.
> Обновление было только на одном ноде.
> На нем, учитывая все рекомендации, поднял pbs_mom,
> но на СЕ узел остается в
> rrc087.itep.ru down
> Похоже, что разные версии torque на СЕ и WN не понимают
> друг друга. Верно?
> Володя, вы не решили свою проблему?
> Удачи. Евгений.
>
>     ----- Original Message -----
>     *From:* Vladimir Tikhomirov <mailto:tikhomir at sci.lebedev.ru>
>     *To:* Valery Mitsyn <mailto:vvm at mammoth.jinr.ru>
>     *Cc:* ru-ngi <mailto:ru-ngi at theory.sinp.msu.ru>
>     *Sent:* Saturday, April 25, 2015 11:39 PM
>     *Subject:* Re: [RU-NGI] torque-server-4.2.10
>
>         Добрый день.
>       У меня сегодня возникла та же  проблема. Но еще сложнее: поскольку
>     на сервере
>     я давно запретил автоапдейты (а ручные, естественно, по лености не
>     делаю), то на
>     нем стоит очень старая torque - 2.5.7-9 и там никакого trqauthd
>     вообще нет. А вот
>     на WNs и UI автоапдейты не запретил и они сегодня ночью прошли. В
>     результате сервер
>     работает, но все задания стоят в состоянии Q. qstat и pbsnodes на СЕ
>     работают, а на UI
>     и WN дают ту же диагностику, что приводил Александр. Что посоветуете
>     - обновлять сервер
>     и далее - по списку?
>         Всего наилучшего,
>     Владимир.
>
>     25 апреля 2015 г., 21:31 пользователь Valery Mitsyn
>     <vvm at mammoth.jinr.ru <mailto:vvm at mammoth.jinr.ru>> написал:
>
>         On Sat, 25 Apr 2015, A.V. Berezhnoy wrote:
>
>
>             25.04.2015 18:12, Valery Mitsyn пишет:
>
>                 On Sat, 25 Apr 2015, A.V. Berezhnoy wrote:
>
>                     Добрый день.
>
>                     Там не заводится какой-то демон /usr/sbin/trqauthd
>
>                     Я на CE нажал  trqauthd, и он запустился.
>
>                     И yaim тогда тоже отработал без ошибок.
>
>                     Потом  мне пришлось сделать заново доступ к очередям
>                     (  qmgr -c "set queue ops acl_groups += opssgm" и т.д.)
>
>                     Задачи начали ставиться в очередь.
>                     Но все они имеют статус "Q", так как не попадають на WN.
>
>                     Там, похоже, тоже нужен  trqauthd, но на wn я его не
>                     нашёл.
>
>
>                 Да, нужен.
>                 Попробуйте на torque сервере:
>                 rpm -qf /etc/init.d/trqauthd
>                 и поставте этот rpm на WN'ы.
>
>             trqauthd  находится в
>             torque-server-4.2.10-1.el6.x86_64
>
>
>         Это явно ошибка в rpm'ам torque.
>         Из epel? Последнее время я на несколько ошибок в epel нарывался.
>         Я использую свой собранный torque, пока 4.2.9.
>
>
>             Это ничего, если его на wn поставить?
>
>
>         Наверное ничего страшного, только надо сделать:
>         chkconfig pbs_server off
>         /etc/init.d/pbs_server stop
>         после установки rpm на всех WN'ах.
>
>         БольшАя "засада" в том, что trqauthd должен запускаться на:
>         WN'ах
>         сервере torque
>         CE
>         UI, ели он есть.
>         И должен запускаться во время старта системы,
>         но старового файла для такого сервиса нет в rpm'ах
>         torque* в epel.
>         Похоже это очередной не проверенный и не работающий
>         пакет в epel.
>
>
>
>             Спасибо,
>             А. Бережной
>
>                     Если на wn нажать qstat, то получаю
>
>                     socket_connect_unix failed: 15137
>                     socket_connect_unix failed: 15137
>                     socket_connect_unix failed: 15137
>                     qstat: cannot connect to server (null) (errno=15137)
>                     could not connect to trqauthd
>
>
>                     Александр
>
>                     25.04.2015 15:40, Liudmila Stepanova пишет:
>
>                         Добрый день,
>                         после upgrade на creamce pbs_server не стартует
>                         rpm -aq |grep torque
>                         torque-server-4.2.10-1.el6.x86_64
>                         torque-client-4.2.10-1.el6.x86_64
>                         emi-torque-utils-2.0.2-2.el6.noarch
>                         glite-yaim-torque-utils-5.1.3-1.el6.noarch
>                         glite-yaim-torque-server-5.1.0-1.sl6.noarch
>                         torque-4.2.10-1.el6.x86_64
>                         emi-torque-server-1.0.0-2.sl6.x86_64
>                         torque-libs-4.2.10-1.el6.x86_64
>                         Не могу определить причину.
>                         С уважением,
>                         Людмила.
>

-- 
Cheers,
     Andrey Kiryanov.

-------------- next part --------------
A non-text attachment was scrubbed...
Name: smime.p7s
Type: application/pkcs7-signature
Size: 2068 bytes
Desc: S/MIME Cryptographic Signature
URL: <http://theory.sinp.msu.ru/pipermail/ru-ngi/attachments/20150426/1fb42eae/attachment-0001.p7s>


More information about the RU-NGI mailing list