LPS:Plán profylaxe

Z HelpDesk
Verze z 25. 8. 2015, 13:01, kterou vytvořil Majlen (diskuse | příspěvky) (opravit eris)

Tento dokument obsahuje orientační plán pro profylaxi, tak aby se jednotlive skupiny mohly synchronizovat, zkuste dodržovat tyto zásady:

  • být stručný a udržovat plán aktuální
  • do hranatých závorek psát odpovědnou osobu nebo spolupráci při provádění akce, tj. s kým je potřeba se domluvit na čase a harmonizovat prováděnou akci
  • používat přeškrtnutý font na věci, které jsou hotovy (html tag strike).

Plán pro letní odstávku hledejte v článku LPS:Letní odstávka.

Průběh profylaxe

Pro synchronizaci při provádění odstávky je zřízena jabber konference na lps@conference.jabber.zcu.cz. Pro přístup potřebujete mít zřízený libovolný účet v jabber systému (dione.zcu.cz, jabber.cz, talk.google.com, ...). Více informací podá List (jabber účet list@dione.zcu.cz). Tento kanál je určen výhradně pro domlouvání se pro pracovní potřeby (lze využít i mimo profylaxe), při jiném použití budete vykázáni.

Oznámení

  • Nejbližší vyhlašovaná odstávka je ohlášena ve výpadcích provozu a mail listem Kontakt. Středeční pravidelnou odstávku není nutné oznamovat.
  • Pokud se bude odstávka jakkoliv dotýkat Cesnetu (zvláště Datových úložišť v UL011 a MetaCentra v UL011 a UI420b), pak poslat mail na support@cesnet.cz

Plán profylaxe

KPS

ODS

  • stěhování FC polí/switchů
    • prestěhovat FC-P8/P9 do UI420R12 nekam nahoru, tak aby se uvolnil celý rack R11 pro FC-P1 a switche
    • posunout všechny zařízení (včetně hlavy), které jsou pod switchi co nejníže, výsledkem je uvolnit místo u switchů, tak aby se daly propojit interní sběrnicí (stříbrným kabelem)
    • přesunout switche z UL008 -> UI420, než budou provedeny přechozí body, stačí připojit přes FC
  • odpojit z AFS-FS serveru stare FC oddily
  • presun virtualu dle RT#210467
    • na polyxen dat vsechny oracle virtualni servery (viz seznam uvedeny v RT)
    • pokud nebude dostatek zdroju, tak ze serveru odmigrovat nejaky stag-*
  • upgrade virtualu na wheezy
  • opravit mdraid na eris (viz cat /proc/mdstat)
  • zmeny java hostingu na orcus/lavinia [Majlen]
  • preklicovani AFS [Lubos]
  • vyndani SSD disku z tantalos a vlozeni do polyxen, pokud nepujde, pak do hippod, zpristupnit pro olinux (presun na polyxen/hippod) a dat vedet Jirouchovi
  • hippod: odpojeni interni sitovky z OCFS podsite
  • presun rdkd1 na rdkd1-new
  • zen1.mng pripojit pres dedikovanou sitovku, na eth0 a eth1 nastavit bonding shodne s xen1-4, to same udelat s polyxen
  • phix - potíže s HW:
    • presadit pameti: DIMM0+1 prohodit s DIMM2+3, ted hlasi:
root@phix:~# edac-util 
mc0: csrow0: CPU_SrcID#0_Channel#1_DIMM#0: 2 Corrected Errors
mc0: csrow1: CPU_SrcID#0_Channel#1_DIMM#1: 5 Corrected Errors

Po přehození hlásí:

mc0: csrow0: CPU_SrcID#0_Channel#1_DIMM#0: 1 Corrected Errors
mc0: csrow2: CPU_SrcID#0_Channel#2_DIMM#0: 5 Corrected Errors

Dlouhodobé úkoly

  • zprovoznit na serveru gatek ip_conntrack_sip a ip_nat_sip (nove jadro?) [List]

Win

ISS

  • změna konfigurací na LDAPech (psyche, cupid) v souvislosti s RT #129646
    • ldap.zcu.cz by měl být bez výpadku, ldap1.zcu.cz, ldap2.zcu.cz, psyche.zcu.cz a cupid.zcu.cz na chvíli vypadne