Aktuality:Problémy s AFS

Z HelpDesk
Verze z 13. 10. 2006, 13:12, kterou vytvořil Phanousk (diskuse | příspěvky) (oprava překlepu)

V poslední době registrujeme potíže s souborovým systémem AFS. Zatím se nepodařilo zjistit přesný důvod, provoz AFS podrobně monitorujeme, na odstranění závady se pracuje. Omlouváme se uživatelům za způsobené potíže.

uvnitř článku stav a popis problému

Projevy u klientů

  • prodlužuje se odezva od souborového systému
  • nelze číst nebo ukládat do části AFS stromu
  • systém hlásí, že požadovaná část AFS je nedostupná (Input/Output Error)

Projevy na serveru

  • zůstanou pouze 2 volná vlákna pro příchozí požadavky (pravděpodobně servisní vlákna)
  • po využití všech vláken narůstá počet procesů čekajících na vlákno (tzv. wprocs)
  • při dosažení limitu (v konfiguraci -L serveru je limit wproc=300) se odešle VBUSY klientům, a wproc se vyčistí, avšak se neuvolní žádné vlákno pro zpracování dalších příchozích požadavků a cyklus se opakuje
  • tento stav se nazývá meltdown

Postihované servery

  • uživatelské (elektra1, elektra2, elektra3)
  • projektové (eurynome1, eurynome2)
  • repliky (harpia)

Hledání řešení (chronologicky)

  • navýšení volných vláken (neuspěšné)
  • navýšení počtu dostupných konexí (neúspěšné)
  • hledání zdroje problémů v logách a dumpech, problematická se zdá být učebna TY110 (probíhá)
  • na radu vývojářů upgrade souborových serverů (neúspěšné)
  • konzultace s vývojáři: problém může nastat v případě nekorektně nastavených klientů, zjišťují se podrobnosti (probíhá)