LPS:Plán profylaxe

Z HelpDesk
Verze z 12. 11. 2014, 22:31, kterou vytvořil Svamberg (diskuse | příspěvky) (→‎ODS: aktualizace)

Tento dokument obsahuje orientační plán pro profylaxi, tak aby se jednotlive skupiny mohly synchronizovat, zkuste dodržovat tyto zásady:

  • být stručný a udržovat plán aktuální
  • do hranatých závorek psát odpovědnou osobu nebo spolupráci při provádění akce, tj. s kým je potřeba se domluvit na čase a harmonizovat prováděnou akci
  • používat přeškrtnutý font na věci, které jsou hotovy (html tag strike).

Plán pro letní odstávku hledejte v článku LPS:Letní odstávka.

Průběh profylaxe

Pro synchronizaci při provádění odstávky je zřízena jabber konference na lps@conference.jabber.zcu.cz. Pro přístup potřebujete mít zřízený libovolný účet v jabber systému (dione.zcu.cz, jabber.cz, talk.google.com, ...). Více informací podá List (jabber účet list@dione.zcu.cz). Tento kanál je určen výhradně pro domlouvání se pro pracovní potřeby (lze využít i mimo profylaxe), při jiném použití budete vykázáni.

Oznámení

  • Nejbližší vyhlašovaná odstávka je ohlášena ve výpadcích provozu a mail listem Kontakt. Středeční pravidelnou odstávku není nutné oznamovat.
  • Pokud se bude odstávka jakkoliv dotýkat Cesnetu (zvláště Datových úložišť v UL011 a MetaCentra v UL011 a UI420b), pak poslat mail na support@cesnet.cz

Plán profylaxe

KPS

ODS

  • reboot xen2, proc nekomunikuje radic disku, reklamace?
  • reboot xen3, nastaveni chybejiciho parametru v grubu
  • přesun riceproject z hippod na nejaky xen, overit u Turjanici, ze si odlogoval licencni server, tel. kontakt vytisten u Lista na stole
  • ori sviti oranzove, je treba vlezt do biosu (je tam vzdalena konzole pres KVM) a vytahnout SEL log z IPMI/DRAC, domluvit se s Indym zda tam dat novejsi jadro (s grsec? kdo jej bude kompilovat?)
  • prehodit nove virtualy na wheezym do xen1-3, tak aby se pouzival novy 3.2 kernel
  • upgrade virtualu na wheezy
  • presunout amphy na nove zelezo
  • phix - potíže s HW:
    • upgrade bios+firmware+idrac7
    • presadit pameti: DIMM0+1 prohodit s DIMM2+3, ted hlasi:
root@phix:~# edac-util 
mc0: csrow0: CPU_SrcID#0_Channel#1_DIMM#0: 2 Corrected Errors
mc0: csrow1: CPU_SrcID#0_Channel#1_DIMM#1: 5 Corrected Errors

Po přehození hlásí:

mc0: csrow0: CPU_SrcID#0_Channel#1_DIMM#0: 1 Corrected Errors
mc0: csrow2: CPU_SrcID#0_Channel#2_DIMM#0: 5 Corrected Errors
  • clotho: ma nejak rozhaseny dpkg, stary kernel a je nejak celkove divny, upgradnout na squeeze, sice se tak tvari, ale asi neni [Frantisek, List]
  • upgrade iDRAC6 firmware na vsech strojich, ktere v nconfu maji nastaveno 'not monitored', protoze management chcipnul, nutny reboot serveru pro jeho nastartovani, vhodne je upgradnout i BIOS vydrzelo to 1,5dne, resenim je pridat do cronu/CF3 pravidelny restart pres ipmitool, to ale pujde jen nekde

Dlouhodobé úkoly

  • zprovoznit na serveru gatek ip_conntrack_sip a ip_nat_sip (nove jadro?) [List]

Win

ISS

  • změna konfigurací na LDAPech (psyche, cupid) v souvislosti s RT #129646
    • ldap.zcu.cz by měl být bez výpadku, ldap1.zcu.cz, ldap2.zcu.cz, psyche.zcu.cz a cupid.zcu.cz na chvíli vypadne