Документ взят из кэша поисковой машины. Адрес оригинального документа : http://theory.sinp.msu.ru/pipermail/ru-ngi/2012q3/000633.html
Дата изменения: Mon Sep 24 09:37:39 2012
Дата индексирования: Tue Oct 2 03:35:45 2012
Кодировка:
[RU-NGI] nagios alarms in Russia

[RU-NGI] nagios alarms in Russia

Lev Shamardin shamardin at theory.sinp.msu.ru
Fri Sep 21 20:35:58 MSK 2012


Привет всем,

On 21/09/2012 16:44, Valery Mitsyn wrote:
> On Fri, 21 Sep 2012, Eygene Ryabinkin wrote:
>
>> Thu, Sep 20, 2012 at 07:29:04PM +0400, Valery Mitsyn wrote:
>>> опять что-то было с питанием в SINP, или это что-то
>>> другое?
>>>   Сегодня практически все CREAM в России получили alarm
>>> на org.sam.CREAMCE-JobSubmit-/ops/Role=lcgadmin
>>> Этот alarm очень "вредный", так как обычно много
>>> времени проходит, пока он сбросится.
>>>   В результате, у всех наших сайтов пострадали A/R.
>
>   Хочу напомнить, что A/R продолжает снижаться для всех
> сайтов. Похоже это уже следствие того, что тесты на
> WN не публикуют результат в региональный nagios.
>   Может быть Лев в отпуске? А-у-у-у!

К сожалению, "наш" Nagios (если его можно так назвать с учетом того, что 
пишу далее) - это такая вещь в себе, которую конфигурировать снаружи 
практически невозможно...

Ситуация следующая: в какой-то момент, как обычно тихо и незаметно вышел 
Update 17.1 
(https://tomtools.cern.ch/confluence/display/SAMDOC/Update-17.1). 
Предыдущая release-версия Update-15 вскоре после этого перестала 
синхронизоваться с базами данных тестов и стала всячески равзваливаться, 
поэтому иного выхода чем обновиться не оставалось. Апдейт производился 
ночью 11 сентября, и занял какое-то бесконечное время, поскольку 
радикально и без особых предупреждений поменяли схему баз данных, и 
миграция, запущенная yaim, заняла часа 4 в общей сложности.

С тех пор все работает на Update-17.1. После апдейта на nagios повисли 
несколько новых алармов на самого себя, что с ними делать - из release 
notes и google понять пока не удается. В категорию known issues наши 
проблемы, насколько могу судить, не попадают.

Мест, которые можно было бы как-то настраивать "руками" чтобы подкрутить 
параметры тестов, в конфигурации практически нет, большая часть 
параметров "спускается" автоматически сверху. Если у нас есть эксперты, 
готовые помочь в настройке этого черного ящика, я с радостью приму любые 
советы и помощь.

--
Lev.


More information about the RU-NGI mailing list