LPS:Remote management zařízení/IBM

Z HelpDesk
< LPS:Remote management zařízení
Verze z 12. 8. 2014, 16:20, kterou vytvořil Svamberg (diskuse | příspěvky) (pridana kategorie)
(rozdíl) ← Starší verze | zobrazit aktuální verzi (rozdíl) | Novější verze → (rozdíl)

Po zapnutí vlézt do BIOSu pres klavesu <F1>

  • nastavit Integrated Management Module (IMM)
 -> shared
 -> Network, IP, MASK, GW
 -> vypnout ipv6
 -> VLAN
  • dobre je opsat si MAC adresu fyzickeho rozhrani (nikoliv managementu) pro voluptu (DHCP)
  • nabootovat PXE (klavesa F12) -> Servers -> +HW TEST, servery funguji na 3.2.0 jadre dobre, ale s kazdou sitovkou se ceka na timeout, takze tomu dejte cas

V tuto chvili by mel byt pristupny management, defaultni pristupove udaje

username: USERID
password: PASSW0RD

Pozor: heslo NEOBSAHUJE pismeno O ale cislo 0 (nula). Tyto udaje najdete snadno v google, takze rozhodne zmenit na nase oblibene co nejdrive!

Disky NEJSOU zarazeny v RAIDech, ale v NFSROOT je nainstalovano megacli, pokud to chceme, staci zadat pro kazdy disk:

megacli -CfgLdAdd -r0 \[32:0\] -a0

Cisla v hranatych zavorkach E:S (Encloser:Slot) ziskate z dokumentace prikazem

megacli -PDList -a0

A protoze je to cely nejaky opruzoidni, tak jsem pripravil parametr T175=hwtest do FAI. Parametr lze pouzit i pro ucebny, v $FAI/classes jsem vytvoril 05_param_t175.sh kde se tento parametr zpracovava samostatne misto drivejsiho 10_labs.sh Navic to umoznuje retezit parametry, takze muzete zadat T175=hwtest,both

Tim se spusti skript hwtest ($FAI/hooks/install.HWTEST), kde si muzete spustit shell nebo nejake svoje testy, po skonceni skriptu bude pokracovat instalace. tak jako by se nic nestalo. Do testu jsem zahrnul:

  • badblocks - nabidne vyber disku a na vyber testu (rw, ro, non-destructive rw)
  • burnP6 (1 jadro = 1 proces, na xen2 tedy 24x))
  • stress (1/3 jader zatez CPU, 1/3 jader na I/O, 1/3 jader na malloc()/free())
  • memtester na zbyte pameti: (volna_pamet - pocet_jader * 128MB)*0.95 spousti se se spozdenim, protoze je potreba pockat na nabehnuti ostatnich programu, navic je treba odpocitat prostor pro stress, ktery defaultne pouziva neco pres 256MB pro malloc/free (protoze pamet je obcas volna) a taky si nechat neco maleho pro sebe (5 procent). Mame tedy rezervu jako by pro 1/2 jader pro stress s VM. Docela dalo zabrat nez jsem to odladil tak, aby nebyl nervozni OOM Killer.

Navic zde jsou volby

  • monitor - 4 screeny pro:
    • iostat - disky
    • vmstat - vyuziti pameti
    • sensors - teplota jader
    • atop
  • shell - volny bash, mozno kdykoliv ve screenu <ctrl+a><c>

Vsechno co si navolite, se spusti PARALELNE ve screenu.

Screeny doporucuji prepinat pres <ctrl+a><"> kdy vam nabidne seznam nebo pres cisla terminalu: <ctrl+a><NUM>

Fakt dlouho jsem hledal problem s nefunkcnimi klavesami v programu dialog, protoze to cele bezi v tee (aby se logovalo), a tak je nutne presmerovat klavesy jeste jednou do console, tedy nezapomenout na

dialog ... 1>/dev/console

Je to uchylne, ale funguje to ;-)

Ocekavam od toho 2 vyhody:

  1. moznost pohrat si s diskem (nebo jinymi vecmi) jeste pred instalaci (pustit shell aniz prerusim instalaci a muset ji znova poustet)
  2. snadno spustit zatezove testy

Zaintegroval jsem to do PXE, takze to najdete v 'Others' a v 'Servers', jinde (ucebny, windows, ...) si to zadratujte nebo mi reknete. Pripadne pouzit editaci v grubu a doplnit T175=hwtest resp. T175=xxxx,hwtest

POZOR: aktualne je podpora (potrebne programy) pouze v techto wheezy nfsroot instalacich:

/var/lib/fai/nfsroot.amd64.wheezy
/var/lib/fai/nfsroot.i386.wheezy

Skript je napsany hodne modularne, takze pokud tam chcete nejakou dalsi volbu, tak se ozvete, pro zprovozneni dalsi featury je treba:

  1. nainstalovat programy do NFSROOT (a pridat do zahlavi skriptu)
  2. pridat do skriptu zaznam pro screen

Snazil jsem se preddefinovat parametry, tak aby to bylo co nejsnazsi, cilem neni nahradit prikazovou radku, ale snadno spustit vybrane (vsechny) testy. Zmeny parametru muzete nabidnout, priklady z xen2:

  • badblocks - jeden z:
    • badblocks -svwf -o /tmp/badblocks_sdb /dev/sdb
    • badblocks -svf -o /tmp/badblocks_sdb /dev/sdb
    • badblocks -svnf -o /tmp/badblocks_sdb /dev/sdb
  • memtester 123414496K
  • burnP6
  • stress --cpu 9 --io 9 --vm 9
  • monitor - vsechny:
    • atop -l 24
    • iostat -d -z 10
    • watch -n 5 -d "sensors"
    • vmstat 10
  • shell:
    • bash

Verim, ze nam to zjednodussi a zprijemni praci.

Vykriky (historky) z nataceni:

  • OOM Killer se trefil pokazde spravne, uz jej maji vyladeny
  • nejvyssi teplota CPU = 45
  • otacky chladicu nesly nikdy pres 50% (cca 8tis/min)
  • pri jedne chybe jsem mel load pres 2500 ;-)