testovani

probiha na jessie.

peacemaker + corosync

musi se nabrat ze sid/stretch.
nefunguje clvm (mozna chyba nastaveni???) - zkusit znova
- problem s clvm locking_type=3 a lvm2-lvmetad (lvmetad)
- nejde ani po stahnutim zdrojaku (apt-get source), prekompilovani a opravy Makefile pro lvm2 (chybela nejaka knihovna)

cman

funguje z jessie
- baliky xen* 4.4.1-9+deb8u1
funguje i clvm (bez snapshotu)
problem pri migraci virtualu
- timeoutovani virsh obejdes: virsh -k10 -K10 migrate --live docker xen+ssh://nesoi1/
- pak stejne error

libxl: error: libxl.c:855:libxl_domain_unpause: unpausing domain 5: Invalid argument

cman + kvm

instalaci lze provest vymenovanim baliku cman, fence-agents ... nebo (asi lepsi reseni) instalaci baliku redhat-cluster-suite. vezme sebou sice vice zavislosti, ale stejne jsou v konecnym vysledku potreba.

apt-get install -y redhat-cluster-suite

Pro bootovani z partisny je treba vytvorit grub a dat jako kernel parametr k virtualu

grub-mkimage -O i386-pc -o grub.img --prefix="(hd0)/boot/grub" part_msdos ext2 xfs biosdisk

je potreba prehodit xvda za sda (pokud migruju virtual z xenu)

jessie libvirt ma problem s systemd.
- https://bugs.debian.org/cgi-bin/bugreport.cgi?bug=799922
- https://bugs.debian.org/cgi-bin/bugreport.cgi?bug=773313

# virsh start docker
error: Failed to start domain docker
error: error from service: CreateMachine: Activation of org.freedesktop.machine1 timed out

sysvinit funguje vcetne
- lvm, clvm
- kvm, live migrace
gfs2 hraje dobre

Konfigurace v clusteru v souboru /etc/cluster/cluster.conf

<?xml version="1.0"?>
<cluster name="nesoi" config_version="3">
    <clusternodes>
        <clusternode name="nesoi1" nodeid="1">
        </clusternode>
        <clusternode name="nesoi2" nodeid="2">
        </clusternode>
        <clusternode name="nesoi3" nodeid="3">
        </clusternode>
    </clusternodes>
    <logging debug="on"/>
    <dlm protocol="tcp" timewarn="500">
    </dlm>
    <fencedevices>
    </fencedevices>
</cluster>

libvirt

ovladani

https://libvirt.org/virshcmdref.html

virsh start
virsh stop
virsh list
virsh define
virsh undefine

web manager

mist.io - reseni pro velke cloudy, potreba registrovat ucet na mist.io
ovirt - na miru rhel, potrebuje ovirt agenta (neni pro debian), velke a slozite
ganeti
archipel - komunikuje pres xmpp, nevhodne

webvirtcloud

mala django aplikace pouzivajici libvirt/ssh. fork projektu s nasimi upravami jsou na https://github.com/honza801/webvirtcloud.

original pouziva nginx, takze musime vymyslet konfiguraci apache.

    <Directory /srv/webvirtcloud/static>
        Require all granted
    </Directory>
    Alias /static /srv/webvirtcloud/static
 
    SSLProxyEngine On
    ProxyRequests Off
    ProxyPreserveHost On
    RequestHeader set X-Forwarded-Proto "https"
    ProxyPass /static !
    ProxyPass / http://127.0.0.1:8000/
    ProxyPassReverse / http://127.0.0.1:8000/

linux

vyroba noveho template

spustit rescue s prazdnym diskem

qemu-img create -f qcow2 debian9-root.qcow2 10G
virt-rescue -a debian9-root.qcow2 --network -m 1024

uvnitr pustit sit a zalozit fs

dhclient eth0
mkfs.xfs /dev/sda
mount /dev/sda /sysroot

pripravit base system

debootstrap --include=apt-transport-https,acpid,bash-completion,ca-certificates,curl,grub2,less,ntp stretch /sysroot ftp://ftp.zcu.cz/pub/linux/debian
mount -t proc none /sysroot/proc
mount -t sysfs none /sysroot/sys
mount /dev /sysroot/dev --bind
chroot /sysroot bash

stahneme skript, ktery provede zakladni konfiguraci

wget home.zcu.cz/~honza801/cloud/prepare.sh
bash -xe prepare.sh
exit

odpojit partisny, syncovat a rebootovat

umount /sysroot/* /sysroot
sync
exit

widle

funguji standardni typy devicu, ale pro virtio musime pridat drivery do image

vyrobit virtual z image na afs
1. udelat image
2. udelat partisny
3. nalejt image na partisnu, resize
4. nalejt boot na loop
5. vyrobit virtual s ide imagem a jeste dalsim diskem (napartisnovanym, formatovanym)
6. pridat jeste virtio disk
7. pripojit cd s virtio driverama
pustit virtual
nainstalovat virtio drivery (viostor, vioser, NetKVM, baloon)
pustit sysprep, vypnout
vyrobit virtio-image
1. zkopirovat copy-sysprep-config
2. zkopirovat skripty pro roztahnuti filesystemu extend_disk.txt setupcomplete.cmd do /Windows/Setup/scripts
3. resize
4. dd
vyrobit virtual z virtio-image

namety

chceme fencing?
jak vyrabet stroje - rt/formular/pustit vsechny na cloud
jak davat vedet (a komu) ze byl vyroben nejaky stroj - viz problem zalohovani

sitovani

na porty hostu jsou povoleny vsechny vlan, ktere potrebuji virtualy
- nativni vlan je 1
- kdyby byla nativni vlan stejna jako stroje, znamenalo by to, ze virtualy v danem bridgi vidi vsechny vlan
na hostu je bond
- bond0 je defaulni, proto pouzivame bond1. abych nemusel psat konfigurace do modprobe.d
z bondu se vyrabi vlany
vlany se davaji do bridge
virtualy se davaji do bridgu

warningy

kdyz zmenis na switchi native vlan, nesestavi se znovu bonding. zkus to opravit

systemctl restart systemd-networkd

instalace

hodne toho udela cfengine, ale nektere kroky je vhodne?/nutne? udelat ruco.

nastavit sit
- podle nesoi1 nakonfigurovat br54 a br2996
- smazat 10-interfaces.network

scp nesoi1:/etc/systemd/network/* /etc/systemd/network/

pripojit sdilene fs
presunout konfiguraci libvirt na fs

systemctl stop libvirtd
mv /etc/libvirt /mnt/nfs30/nesoi_sas/libvirt/etc/${HOSTNAME%%.*}
ln -s /mnt/nfs30/nesoi_sas/libvirt/etc/${HOSTNAME%%.*} /etc/libvirt
systemctl start libvirtd

nakonfigurovat pooly

rmdir /var/lib/libvirt/images
ln -s /mnt/nfs30/nesoi_sata/libvirt/media/ /var/lib/libvirt/images
virsh pool-define-as nfs-sas dir --target /mnt/nfs30/nesoi_sas/libvirt/images/
virsh pool-start nfs-sas
virsh pool-autostart nfs-sas
virsh pool-define-as nfs-sata dir --target /mnt/nfs30/nesoi_sata/libvirt/images/
virsh pool-start nfs-sata
virsh pool-autostart nfs-sata

zkopirovat public ssh key cloudu

sprava

par dobrych rad :)

cluster

konfigurace v /etc/cluster/cluster.conf
service cman start
clustat

clvm

/etc/lvm/lvm.conf: locking_type = 3
service clvm start
vgs/lvs

gfs

service gfs2-cluster start
mkfs.gfs2 -t nesoi:gfs2-single -p lock_dlm -j 3 /dev/vg-single/gfs2
mount /dev/vg-single/gfs2 /mnt

libvirt

konfigurace v /gfs/libvirt/etc/nesoi?/
- virtualy /gfs/libvirt/etc/nesoi?/qemu/
- image /gfs/libvirt/storage/
service libvirtd start
virsh help
- start/stop
- destroy
- undefine
- virsh list [--all]

web

https://cloud.civ.zcu.cz je to virtual na nesoi clusteru.

virsh start cloud

uprava template

Templaty mame v qcow2, takze nejdou rovnou primountovat. Musime pouzit qemu-nbd.

modprobe nbd
qemu-nbd -c /dev/nbd0 template0.qcow
mount /dev/nbd0 /mnt/disk
# chroot/edit
umount /dev/nbd0
qemu-nbd -d /dev/nbd0

viz. mount_qcow.sh

pridani disku

virt-manager nedela qcow, i kdyz ho zvolim v menu, takze ruco

virsh vol-create-as gfs-single jmeno_virtualu-mnt.qcow2 100G --format qcow2
virsh attach-disk jmeno_virtualu /gfs-single/libvirt/storage/jmeno_virtualu-mnt.qcow2 vdb virtio qemu qcow2

problemy

nesestaveni cluster

muze se stat, ze pri spadnuti jednoho nodu se spravne nesestavi cluste. jak se to pozna? neni primountovane /gfs. clustat, virsh list --all nic neukazuje. cloud.civ neukazuje zadne virtualy na restartlem nodu. nutne rucne nahodit sluzby ve spravnem poradi. a restartnout libvirt, protoze konfigurace je ulozena na gfs.

service cman start
service clvm start
service gfs2-cluster start
service gfs2-utils start
service libvirtd restart

kontrola

virsh list --all

spadne web

jak to poznam? nekde se pripojit na web. reseni:

projedu vsechny nody a kouknu, jestli nahodou nebezi virtual cloud
kdyz jsem si jistej, ze nebezi, proste ho pustim na tom nodu, kde je definovan (nesoi3)
ssh nesoi3 virsh start cloud

kontrola:

https://cloud.civ.zcu.cz/

virtual se zablokuje

nezavisle na typu storage (lvm,gfs,local)
nezavisle na driveru (ide,sata,virtio)
projevuje se pri sync
nejspis problemy s cache
- mount sync na hostu nepomohlo, pomale pri lokalnich operacich
- mount sync na guestu nepomohlo
- qemu iocache directsync se zda funguje dobre

viz.

web console hlasi error 1006

nejspis je spatne certifikat v /srv/webvirtcloud/console/cert.pem

cat /etc/apache2/ssl/{cloud.civ.zcu.cz.rsa,cloud.civ.zcu.cz.crt,ca-chain.pem} > /srv/webvirtcloud/console/cert.pem

nahozeni inquorate cluster

Pokud mi spadne vetsina nodu a jsem fakt tak zoufalej, ze potrebuju pustit veci na inquorate cluster.

Rekneme, ze mam 3 node cluster a pustit muzu jen jeden node.

service cman start
cman_tool votes -v 2 # pocet hlasu musi odpovidat poctu Quorum v cman_tool status
service cman start # opravdu je to tu podruhy
fence_ack_manual node02
fence_ack_manual node03
service clvm start
service gfs2-cluster start
service gfs2-utils start

Kdyz uz muzu pustit dalsi nody, tak postaci nahodit servicy. Zkontrolovat cman_tool status na pocty hlasu a opravit.

Neregistrovaný

Hledat

Public:Honza801/debian cluster

testovani

peacemaker + corosync

cman

cman + kvm

libvirt

ovladani

web manager

webvirtcloud

linux

widle

namety

sitovani

warningy

instalace

sprava

cluster

clvm

gfs

libvirt

web

uprava template

pridani disku

problemy

nesestaveni cluster

spadne web

virtual se zablokuje

web console hlasi error 1006

nahozeni inquorate cluster

odkazy

Navigace

Wiki nástroje

Nástroje ke stránkám