Aktuality:Problémy s AFS
Z HelpDesk
V poslední době registrujeme potíže s souborovým systémem AFS. Zatím se nepodařilo zjistit přesný důvod, provoz AFS podrobně monitorujeme, na odstranění závady se pracuje. Omlouváme se uživatelům za způsobené potíže.
uvnitř článku stav a popis problému
Projevy u klientů
- prodlužuje se odezva od souborového systému
- nelze číst nebo ukládat do části AFS stromu
- systém hlásí, že požadovaná část AFS je nedostupná (Input/Output Error)
Projevy na serveru
- zůstanou pouze 2 volná vlákna pro příchozí požadavky (pravděpodobně servisní vlákna)
- po využití všech vláken narůstá počet procesů čekajících na vlákno (tzv. wprocs)
- při dosažení limitu (v konfiguraci -L serveru je limit wproc=300) se odešle VBUSY klientům, a wproc se vyčistí, avšak se neuvolní žádné vlákno pro zpracování dalších příchozích požadavků a cyklus se opakuje
- tento stav se nazývá meltdown
Postihované servery
- uživatelské (elektra1, elektra2, elektra3)
- projektové (eurynome1, eurynome2)
- repliky (harpia)
Hledání řešení (chronologicky)
- navýšení volných vláken (neuspěšné)
- navýšení počtu dostupných konexí (neúspěšné)
- hledání zdroje problémů v logách a dumpech, problematická se zdá být učebna TY110 (probíhá)
- na radu vývojářů upgrade souborových serverů (neúspěšné)
- konzultace s vývojáři: problém může nastat v případě nekorektně nastavených klientů, zjišťují se podrobnosti (probíhá)