Документ взят из кэша поисковой машины. Адрес оригинального документа : http://theory.sinp.msu.ru/pipermail/ru-ngi/2015q2/001546.html
Дата изменения: Sun Apr 26 17:51:33 2015
Дата индексирования: Sun Apr 10 18:17:30 2016
Кодировка:
[RU-NGI] torque-server-4.2.10

[RU-NGI] torque-server-4.2.10

Valery Mitsyn vvm at mammoth.jinr.ru
Sun Apr 26 17:01:30 MSK 2015


On Sun, 26 Apr 2015, Alexander Kryukov wrote:

> Коллеги,
>
> Так может быть поделитесь пакетами?

У меня пока 4.2.9 на Tier1.
Он полностью рабочий, лежит на:
http://linux4u.jinr.ru/pub/SL.local/6x.t1/x86_64/RPMS.t1/
Боюсь, что просто так он не встанет вместо 4.10 из epel:
1) в epel'евских весрсиях странный состав rpm'ов, они раскидали
torque по разным rpm совсем не так, как в оригинале;
2) если стоит версия 4.10, то на 4.9 надо делать yum downgrade.

>
>             -- А.К.
>
> On 26/04/15 16:09, Andrey Kiryanov wrote:
>> Добрый день,
>> 
>> 4-й Torque не совместим с предыдущими версиями. Об этом явно написано у
>> них на сайте. Если решили переходить на 4-ю версию, то её нужно ставить
>> везде.
>> И я могу подтвердить слова Валерия: пакеты из EPEL кривые, я тоже
>> использую самостоятельно пропатченную, пересобранную и перезапакованную
>> версию.
>> 
>> Y.Lyublev wrote:
>>> Добрый день.
>>> У меня ситуация почти как у Владимира.
>>> Обновление было только на одном ноде.
>>> На нем, учитывая все рекомендации, поднял pbs_mom,
>>> но на СЕ узел остается в
>>> rrc087.itep.ru down
>>> Похоже, что разные версии torque на СЕ и WN не понимают
>>> друг друга. Верно?
>>> Володя, вы не решили свою проблему?
>>> Удачи. Евгений.
>>>
>>>     ----- Original Message -----
>>>     *From:* Vladimir Tikhomirov <mailto:tikhomir at sci.lebedev.ru>
>>>     *To:* Valery Mitsyn <mailto:vvm at mammoth.jinr.ru>
>>>     *Cc:* ru-ngi <mailto:ru-ngi at theory.sinp.msu.ru>
>>>     *Sent:* Saturday, April 25, 2015 11:39 PM
>>>     *Subject:* Re: [RU-NGI] torque-server-4.2.10
>>>
>>>         Добрый день.
>>>       У меня сегодня возникла та же  проблема. Но еще сложнее: поскольку
>>>     на сервере
>>>     я давно запретил автоапдейты (а ручные, естественно, по лености не
>>>     делаю), то на
>>>     нем стоит очень старая torque - 2.5.7-9 и там никакого trqauthd
>>>     вообще нет. А вот
>>>     на WNs и UI автоапдейты не запретил и они сегодня ночью прошли. В
>>>     результате сервер
>>>     работает, но все задания стоят в состоянии Q. qstat и pbsnodes на СЕ
>>>     работают, а на UI
>>>     и WN дают ту же диагностику, что приводил Александр. Что посоветуете
>>>     - обновлять сервер
>>>     и далее - по списку?
>>>         Всего наилучшего,
>>>     Владимир.
>>>
>>>     25 апреля 2015 г., 21:31 пользователь Valery Mitsyn
>>>     <vvm at mammoth.jinr.ru <mailto:vvm at mammoth.jinr.ru>> написал:
>>>
>>>         On Sat, 25 Apr 2015, A.V. Berezhnoy wrote:
>>> 
>>>
>>>             25.04.2015 18:12, Valery Mitsyn пишет:
>>>
>>>                 On Sat, 25 Apr 2015, A.V. Berezhnoy wrote:
>>>
>>>                     Добрый день.
>>>
>>>                     Там не заводится какой-то демон /usr/sbin/trqauthd
>>>
>>>                     Я на CE нажал  trqauthd, и он запустился.
>>>
>>>                     И yaim тогда тоже отработал без ошибок.
>>>
>>>                     Потом  мне пришлось сделать заново доступ к очередям
>>>                     (  qmgr -c "set queue ops acl_groups += opssgm" и
>>> т.д.)
>>>
>>>                     Задачи начали ставиться в очередь.
>>>                     Но все они имеют статус "Q", так как не попадають
>>> на WN.
>>>
>>>                     Там, похоже, тоже нужен  trqauthd, но на wn я его не
>>>                     нашёл.
>>> 
>>>
>>>                 Да, нужен.
>>>                 Попробуйте на torque сервере:
>>>                 rpm -qf /etc/init.d/trqauthd
>>>                 и поставте этот rpm на WN'ы.
>>>
>>>             trqauthd  находится в
>>>             torque-server-4.2.10-1.el6.x86_64
>>> 
>>>
>>>         Это явно ошибка в rpm'ам torque.
>>>         Из epel? Последнее время я на несколько ошибок в epel нарывался.
>>>         Я использую свой собранный torque, пока 4.2.9.
>>> 
>>>
>>>             Это ничего, если его на wn поставить?
>>> 
>>>
>>>         Наверное ничего страшного, только надо сделать:
>>>         chkconfig pbs_server off
>>>         /etc/init.d/pbs_server stop
>>>         после установки rpm на всех WN'ах.
>>>
>>>         БольшАя "засада" в том, что trqauthd должен запускаться на:
>>>         WN'ах
>>>         сервере torque
>>>         CE
>>>         UI, ели он есть.
>>>         И должен запускаться во время старта системы,
>>>         но старового файла для такого сервиса нет в rpm'ах
>>>         torque* в epel.
>>>         Похоже это очередной не проверенный и не работающий
>>>         пакет в epel.
>>> 
>>> 
>>>
>>>             Спасибо,
>>>             А. Бережной
>>>
>>>                     Если на wn нажать qstat, то получаю
>>>
>>>                     socket_connect_unix failed: 15137
>>>                     socket_connect_unix failed: 15137
>>>                     socket_connect_unix failed: 15137
>>>                     qstat: cannot connect to server (null) (errno=15137)
>>>                     could not connect to trqauthd
>>> 
>>>
>>>                     Александр
>>>
>>>                     25.04.2015 15:40, Liudmila Stepanova пишет:
>>>
>>>                         Добрый день,
>>>                         после upgrade на creamce pbs_server не стартует
>>>                         rpm -aq |grep torque
>>>                         torque-server-4.2.10-1.el6.x86_64
>>>                         torque-client-4.2.10-1.el6.x86_64
>>>                         emi-torque-utils-2.0.2-2.el6.noarch
>>>                         glite-yaim-torque-utils-5.1.3-1.el6.noarch
>>>                         glite-yaim-torque-server-5.1.0-1.sl6.noarch
>>>                         torque-4.2.10-1.el6.x86_64
>>>                         emi-torque-server-1.0.0-2.sl6.x86_64
>>>                         torque-libs-4.2.10-1.el6.x86_64
>>>                         Не могу определить причину.
>>>                         С уважением,
>>>                         Людмила.
>>> 
>> 
>> 
>> 
>> _______________________________________________
>> RU-NGI mailing list
>> RU-NGI at theory.sinp.msu.ru
>> http://theory.sinp.msu.ru/mailman/listinfo/ru-ngi
>> 
>
>

-- 
Best regards,
  Valery Mitsyn


More information about the RU-NGI mailing list