LPS:Plán profylaxe
Z HelpDesk
Tento dokument obsahuje orientační plán pro profylaxi, tak aby se jednotlive skupiny mohly synchronizovat, zkuste dodržovat tyto zásady:
- být stručný a udržovat plán aktuální
- do hranatých závorek psát odpovědnou osobu nebo spolupráci při provádění akce, tj. s kým je potřeba se domluvit na čase a harmonizovat prováděnou akci
- používat
přeškrtnutýfont na věci, které jsou hotovy (html tag strike).
Plán pro letní odstávku hledejte v článku LPS:Letní odstávka.
Průběh profylaxe
Pro synchronizaci při provádění odstávky je zřízena jabber konference na lps@conference.jabber.zcu.cz. Pro přístup potřebujete mít zřízený libovolný účet v jabber systému (dione.zcu.cz, jabber.cz, talk.google.com, ...). Více informací podá List (jabber účet list@dione.zcu.cz). Tento kanál je určen výhradně pro domlouvání se pro pracovní potřeby (lze využít i mimo profylaxe), při jiném použití budete vykázáni.
Oznámení
- Nejbližší vyhlašovaná odstávka je ohlášena ve výpadcích provozu a mail listem Kontakt. Středeční pravidelnou odstávku není nutné oznamovat.
- Pokud se bude odstávka jakkoliv dotýkat Cesnetu (zvláště Datových úložišť v UL011 a MetaCentra v UL011 a UI420b), pak poslat mail na support@cesnet.cz
Plán profylaxe
KPS
ODS
reboot xen2, proc nekomunikuje radic disku, reklamace?reboot xen3, nastaveni chybejiciho parametru v grubu- přesun riceproject z hippod na nejaky xen, overit u Turjanici, ze si odlogoval licencni server, tel. kontakt vytisten u Lista na stole
- ori sviti oranzove, je treba vlezt do biosu (je tam vzdalena konzole pres KVM) a vytahnout SEL log z IPMI/DRAC, domluvit se s Indym zda tam dat novejsi jadro (s grsec? kdo jej bude kompilovat?)
- prehodit nove virtualy na wheezym do xen1-3, tak aby se pouzival novy 3.2 kernel
- upgrade virtualu na wheezy
- presunout amphy na nove zelezo
- phix - potíže s HW:
- upgrade bios+firmware+idrac7
presadit pameti: DIMM0+1 prohodit s DIMM2+3, ted hlasi:
root@phix:~# edac-util mc0: csrow0: CPU_SrcID#0_Channel#1_DIMM#0: 2 Corrected Errors mc0: csrow1: CPU_SrcID#0_Channel#1_DIMM#1: 5 Corrected Errors
Po přehození hlásí:
mc0: csrow0: CPU_SrcID#0_Channel#1_DIMM#0: 1 Corrected Errors mc0: csrow2: CPU_SrcID#0_Channel#2_DIMM#0: 5 Corrected Errors
- clotho: ma nejak rozhaseny dpkg, stary kernel a je nejak celkove divny, upgradnout na squeeze, sice se tak tvari, ale asi neni [Frantisek, List]
- upgrade iDRAC6 firmware na vsech strojich, ktere v nconfu maji nastaveno 'not monitored', protoze management chcipnul, nutny reboot serveru pro jeho nastartovani, vhodne je upgradnout i BIOS vydrzelo to 1,5dne, resenim je pridat do cronu/CF3 pravidelny restart pres ipmitool, to ale pujde jen nekde
Dlouhodobé úkoly
- zprovoznit na serveru gatek ip_conntrack_sip a ip_nat_sip (nove jadro?) [List]
Win
ISS
- změna konfigurací na LDAPech (psyche, cupid) v souvislosti s RT #129646
- ldap.zcu.cz by měl být bez výpadku, ldap1.zcu.cz, ldap2.zcu.cz, psyche.zcu.cz a cupid.zcu.cz na chvíli vypadne