Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://theory.sinp.msu.ru/pipermail/ru-ngi/2011q4/000279.html
Дата изменения: Mon Oct 10 14:23:50 2011 Дата индексирования: Tue Oct 2 02:48:19 2012 Кодировка: |
On Mon, 10 Oct 2011, Victor Kotlyar (IHEP) wrote: > В 2011 году по всему RDIG будет очень большой провал из-за регионального > Nagios по A/R. > > Я как-то спраливал это: какова ситуация, если проблема в мониторинге > Nagios, а не в сайтах. > Нельзя ли на это время считать A/R 100%. Но что-то ответа так и не услышал. > > Получаются все эти доступности и надёжности - пустой звук можно смело > выкидывать их на помойку. Это совсем не "пустой звук". По правилам на: https://wiki.egi.eu/wiki/Availability_and_reliability_monthly_statistics -------------------------------------------- Resource Centres not providing minimum monthly performance (70% availability, 75% reliability) MUST provide justification through a GGUS ticket. -------------------------------------------- и -------------------------------------------- Resource Centres which have an availability of less than 70% for three consecutive months will be suspended, i.e. removed from the production infrastructure. -------------------------------------------- > > Удачи, > Виктор > > > On 10/10/2011 11:31 AM, Valery Mitsyn wrote: >> On Thu, 6 Oct 2011, A.Kryukov wrote: >> >>> Коллеги! >>> >>> С точки зрения EGI, в настоящее время возглавляю ROC я, Крюков. Однако >>> курирование вопросов WLCG (планирование ресурсов, их распределение и >>> т.п.) относится к компетенции В.А.Ильина. >>> >>> Таким образом, вопрос о работе регионального Нагиоса в зоне моей >>> ответственности и мы его сегодня обсуждали на совещании. Не позднее >>> чем завтра этот вопрос будет решен. >> >> У вас "день сурка"? >> A/R упали до 72% даже у тех в ROC Russia, кто работает без проблем. >> >>> >>> С уважением, А.К. >>> >>> On 10/06/2011 07:43 PM, Victor Kotlyar (IHEP) wrote: >>>> Поддерживаю, заодно я бы хотел уточнить, кто сейчас наш ROC? >>>> >>>> Спасибо заранее. >>>> С уважением. >>>> Виктор Котляр >>>> >>>> >>>> >>>> On 10/06/2011 02:23 PM, Valery Mitsyn wrote: >>>>> Hi, >>>>> >>>>> сегодня весь наш регион получил critical в тесте nagios: >>>>> org.sam.WN-RepRep-/ops/Role=lcgadmin >>>>> Как и было ранее рекомендовано Львом Шамардиным, я вставил >>>>> тикет в GGUS с описанием проблемы: >>>>> https://ggus.eu/ws/ticket_info.php?ticket=74999 >>>>> Проблема оказалась в настройках нашего nagios, >>>>> как указал в коментарии Maarten Litmaath. >>>>> --------------------------------------- >>>>> your Nagios must _not_ refer to samdpm00x.cern.ch: >>>>> we will decommission those nodes very soon. >>>>> Instead you must define your own reference SE. >>>>> This was communicated multiple times by the SAM team >>>>> --------------------------------------- >>>>> >>>>> Прошу срочно заняться этой проблемой наш ROC и >>>>> ответсвенных за наш nagios. >>>>> >>>>> >>>>> >>>>> _______________________________________________ >>>>> RU-NGI mailing list >>>>> RU-NGI at theory.sinp.msu.ru >>>>> http://theory.sinp.msu.ru/mailman/listinfo/ru-ngi >>>> >>>> _______________________________________________ >>>> RU-NGI mailing list >>>> RU-NGI at theory.sinp.msu.ru >>>> http://theory.sinp.msu.ru/mailman/listinfo/ru-ngi >>> >>> >> >> >> >> _______________________________________________ >> RU-NGI mailing list >> RU-NGI at theory.sinp.msu.ru >> http://theory.sinp.msu.ru/mailman/listinfo/ru-ngi > -- Best regards, Valery Mitsyn