Документ взят из кэша поисковой машины. Адрес оригинального документа : http://theory.sinp.msu.ru/pipermail/ru-ngi/2012q4/000705.html
Дата изменения: Tue Nov 27 17:40:22 2012
Дата индексирования: Sun Feb 3 19:23:37 2013
Кодировка:
[RU-NGI] несколько cream-ce на один torque pbs

[RU-NGI] несколько cream-ce на один torque pbs

Eygene Ryabinkin rea at grid.kiae.ru
Fri Nov 9 11:07:04 MSK 2012


Витя, привет.

Fri, Nov 09, 2012 at 09:20:09AM +0400, Victor Kotlyar wrote:
> В связи с компанией по переходу на emi2 cream-ce, у меня возник такой 
> вопросик:
> кто-нибудь использует схемы двух и более cream-ce к одному torque pbs с 
> DNS round robin алиасами; или, может быть, что-то другое.

Насколько я в курсе, в Дубне несколько CREAM CE, но они просто стоят
себе как отдельные экземпляры.  Мы тоже собираемся себе добавить CREAM
CE и ходить они будут к одной LRMS, но round-robind и всего остального
не будет.

> Теоретически Tier1 прототипы должны быть заморочены на это.

Поскольку VO сами умеют делать round-robin submission на группу из
CREAM CE, то мы пока имеем в виду именно эту схему: несколько
независимых CREAM CE, на которые VO сами раздают задачи.  Если
какой-то CE подыхает, то, конечно, очень неприятно (особенно если
CREAM CE на сайте всего 2-3), но не шибко смертельно в плане
работоспособности всего сервиса.

Clustered CREAM CE пока не готов, поскольку он кроме MySQL, которую
можно кластеризовать, держит некоторое состояние в памяти, так что
round-robin DNS тут не очень получится.  Я где-то полгода назад у
разработчиков спрашивал, говорят "было бы круто, но нужно много
менять, поэтому быстро не будет совершенно точно".

> Интересны отзывы, как лучше это сделать. Есть понятие про glite-Cluster 
> какое-то.

glite-cluster -- это глючной пакет, который позволяет в информационной
системе создавать подкластеры.  К кластеризации сервисов он отношения,
насколько я в курсе, не имеет.

> Т.е. нужно распределение нагрузки и отказоустойчивость для cream-ce :)

Распределение -- есть (через VO submission frameworks), отказоустойчивость --
есть, не полная: задачи с подохшего CE -- пропадают (не совсем, конечно,
но через CREAM CE уже не удается получить их статус и результат выполнения),
но новые -- вполне попадают на другие CE.

> п.с. может устроить собрание админов, их давно не было.

Можно.  Но я -- в полной зашивке еще минимум недели на две :((
-- 
Eygene Ryabinkin, National Research Centre "Kurchatov Institute"

Always code as if the guy who ends up maintaining your code will be
a violent psychopath who knows where you live.


More information about the RU-NGI mailing list