|
Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://theory.sinp.msu.ru/pipermail/ru-ngi/2015q2/001544.html
Дата изменения: Sun Apr 26 16:42:26 2015 Дата индексирования: Sun Apr 10 18:17:15 2016 Кодировка: |
Добрый день,
4-й Torque не совместим с предыдущими версиями. Об этом явно написано у
них на сайте. Если решили переходить на 4-ю версию, то её нужно ставить
везде.
И я могу подтвердить слова Валерия: пакеты из EPEL кривые, я тоже
использую самостоятельно пропатченную, пересобранную и перезапакованную
версию.
Y.Lyublev wrote:
> Добрый день.
> У меня ситуация почти как у Владимира.
> Обновление было только на одном ноде.
> На нем, учитывая все рекомендации, поднял pbs_mom,
> но на СЕ узел остается в
> rrc087.itep.ru down
> Похоже, что разные версии torque на СЕ и WN не понимают
> друг друга. Верно?
> Володя, вы не решили свою проблему?
> Удачи. Евгений.
>
> ----- Original Message -----
> *From:* Vladimir Tikhomirov <mailto:tikhomir at sci.lebedev.ru>
> *To:* Valery Mitsyn <mailto:vvm at mammoth.jinr.ru>
> *Cc:* ru-ngi <mailto:ru-ngi at theory.sinp.msu.ru>
> *Sent:* Saturday, April 25, 2015 11:39 PM
> *Subject:* Re: [RU-NGI] torque-server-4.2.10
>
> Добрый день.
> У меня сегодня возникла та же проблема. Но еще сложнее: поскольку
> на сервере
> я давно запретил автоапдейты (а ручные, естественно, по лености не
> делаю), то на
> нем стоит очень старая torque - 2.5.7-9 и там никакого trqauthd
> вообще нет. А вот
> на WNs и UI автоапдейты не запретил и они сегодня ночью прошли. В
> результате сервер
> работает, но все задания стоят в состоянии Q. qstat и pbsnodes на СЕ
> работают, а на UI
> и WN дают ту же диагностику, что приводил Александр. Что посоветуете
> - обновлять сервер
> и далее - по списку?
> Всего наилучшего,
> Владимир.
>
> 25 апреля 2015 г., 21:31 пользователь Valery Mitsyn
> <vvm at mammoth.jinr.ru <mailto:vvm at mammoth.jinr.ru>> написал:
>
> On Sat, 25 Apr 2015, A.V. Berezhnoy wrote:
>
>
> 25.04.2015 18:12, Valery Mitsyn пишет:
>
> On Sat, 25 Apr 2015, A.V. Berezhnoy wrote:
>
> Добрый день.
>
> Там не заводится какой-то демон /usr/sbin/trqauthd
>
> Я на CE нажал trqauthd, и он запустился.
>
> И yaim тогда тоже отработал без ошибок.
>
> Потом мне пришлось сделать заново доступ к очередям
> ( qmgr -c "set queue ops acl_groups += opssgm" и т.д.)
>
> Задачи начали ставиться в очередь.
> Но все они имеют статус "Q", так как не попадають на WN.
>
> Там, похоже, тоже нужен trqauthd, но на wn я его не
> нашёл.
>
>
> Да, нужен.
> Попробуйте на torque сервере:
> rpm -qf /etc/init.d/trqauthd
> и поставте этот rpm на WN'ы.
>
> trqauthd находится в
> torque-server-4.2.10-1.el6.x86_64
>
>
> Это явно ошибка в rpm'ам torque.
> Из epel? Последнее время я на несколько ошибок в epel нарывался.
> Я использую свой собранный torque, пока 4.2.9.
>
>
> Это ничего, если его на wn поставить?
>
>
> Наверное ничего страшного, только надо сделать:
> chkconfig pbs_server off
> /etc/init.d/pbs_server stop
> после установки rpm на всех WN'ах.
>
> БольшАя "засада" в том, что trqauthd должен запускаться на:
> WN'ах
> сервере torque
> CE
> UI, ели он есть.
> И должен запускаться во время старта системы,
> но старового файла для такого сервиса нет в rpm'ах
> torque* в epel.
> Похоже это очередной не проверенный и не работающий
> пакет в epel.
>
>
>
> Спасибо,
> А. Бережной
>
> Если на wn нажать qstat, то получаю
>
> socket_connect_unix failed: 15137
> socket_connect_unix failed: 15137
> socket_connect_unix failed: 15137
> qstat: cannot connect to server (null) (errno=15137)
> could not connect to trqauthd
>
>
> Александр
>
> 25.04.2015 15:40, Liudmila Stepanova пишет:
>
> Добрый день,
> после upgrade на creamce pbs_server не стартует
> rpm -aq |grep torque
> torque-server-4.2.10-1.el6.x86_64
> torque-client-4.2.10-1.el6.x86_64
> emi-torque-utils-2.0.2-2.el6.noarch
> glite-yaim-torque-utils-5.1.3-1.el6.noarch
> glite-yaim-torque-server-5.1.0-1.sl6.noarch
> torque-4.2.10-1.el6.x86_64
> emi-torque-server-1.0.0-2.sl6.x86_64
> torque-libs-4.2.10-1.el6.x86_64
> Не могу определить причину.
> С уважением,
> Людмила.
>
--
Cheers,
Andrey Kiryanov.
-------------- next part --------------
A non-text attachment was scrubbed...
Name: smime.p7s
Type: application/pkcs7-signature
Size: 2068 bytes
Desc: S/MIME Cryptographic Signature
URL: <http://theory.sinp.msu.ru/pipermail/ru-ngi/attachments/20150426/1fb42eae/attachment-0001.p7s>