====== LVM : commandes de base ======
===== Physical Volumes =====

====pvscan====

Recherche les PVs sur tous les disques.

  root@SpaceServer:/tmp> pvscan
  pvscan -- reading all physical volumes (this may take a while...)
  pvscan -- ACTIVE   PV "/dev/cciss/c0d0p2" of VG "rootvg" [67.32 GB / 49.32 GB free]
  pvscan -- total: 1 [67.33 GB] / in use: 1 [67.33 GB] / in no VG: 0 [0]

==== pvcreate ====

Initialise le disque pour pouvoir être utilisé avec LVM. Si un PV existe déjà on peut utiliser ''-ff'' mais dans ce cas il faut être certain de ne pas écraser un disque utilisé ailleurs.

  root@SpaceServer:/tmp> pvcreate /dev/emcpowerd
  pvcreate -- physical volume "/dev/emcpowerd" successfully created

==== pvdisplay ====

Affiche les informations sur un PV (VGs attachés, etc) :

  root@SpaceServer:/> pvdisplay /dev/emcpowerf
  --- Physical volume ---
  PV Name               /dev/emcpowerf
  VG Name               vg_col1
  PV Size               108.93 GB [228433792 secs] / NOT usable 32.19 MB [LVM: 141 KB]
  PV#                   1
  PV Status             available
  Allocatable           yes (but full)
  Cur LV                3
  PE Size (KByte)       32768
  Total PE              3484
  Free PE               0
  Allocated PE          3484
  PV UUID               pmTDba-3lWV-8WEV-riwI-WkLG-odm3-1QoBpM

===== Volume Groups =====

==== vgcreate ====

Permet de créer un VG sur un disque initialisé avec ''pvcreate''.

  root@SpaceServer:/tmp> pvcreate /dev/emcpowerd
  pvcreate -- physical volume "/dev/emcpowerd" successfully created
 
  root@SpaceServer:/tmp> vgcreate vg_apps /dev/emcpowerd
  vgcreate -- INFO: using default physical extent size 32 MB
  vgcreate -- INFO: maximum logical volume size is 2 Terabyte
  vgcreate -- doing automatic backup of volume group "vg_apps"
  vgcreate -- volume group "vg_apps" successfully created and activated

==== vgextend ====

Permet d'ajouter un disque à un VG existant.

  root@SpaceServer:/tmp> vgextend vg_apps /dev/emcpowera
  vgextend -- INFO: maximum logical volume size is 2 Terabyte
  vgextend -- doing automatic backup of volume group "vg_apps"
  vgextend -- volume group "vg_apps" successfully extended

==== vgreduce ====

Permet de retirer un disque à un VG.

  root@SpaceServer:/tmp> vgreduce vg_apps /dev/emcpowera
  vgreduce -- doing automatic backup of volume group "vg_apps"
  vgreduce -- volume group "vg_apps" successfully reduced by physical volume:
  vgreduce -- /dev/emcpowera

==== vgdisplay ====

Affiche les infos sur un VG donné, notamment les disques sur lesquels il se trouve.

  root@SpaceServer:/etc/postfix> vgdisplay -v vg_dex4
  --- Volume group ---
  VG Name               vg_dex4
  VG Access             read/write
  VG Status             available/resizable
  VG #                  4
  MAX LV                256
  Cur LV                9
  Open LV               8
  MAX LV Size           2 TB
  Max PV                256
  Cur PV                1
  Act PV                1
  VG Size               54.41 GB
  PE Size               32 MB
  Total PE              1741
  Alloc PE / Size       1193 / 37.28 GB
  Free  PE / Size       548 / 17.12 GB
  VG UUID               MQ2P2L-S4Qi-Ig8q-LYW1-0vJN-V4LJ-b2CXcK
  
   --- Logical volume ---
   truncated
  
  --- Physical volumes ---
  PV Name (#)           /dev/emcpowerc (1)
  PV Status             available / allocatable
  Total PE / Free PE    1741 / 548

==== vgscan ====

Recherche les VGs sur tous les disques et met à jour '''/etc/lvmtab'''.

  root@SpaceServer:/tmp> vgscan
  vgscan -- reading all physical volumes (this may take a while...)
  vgscan -- found active volume group "rootvg"
  vgscan -- "/etc/lvmtab" and "/etc/lvmtab.d" successfully created
  vgscan -- WARNING: This program does not do a VGDA backup of your volume group

==== vgchange ====

Permet de changer les attributs d'un VG. En général on utilise ''vgchange -an rootvg'' pour désactiver un VG (on doit dans ce cas avoir démonté les FS) et ''vgchange -ay rootvg'' pour activer.

==== vgremove ====

Permet de supprimer un VG (on doit d'abord le désactiver).

  vgremove vg_apps

==== vgrename ====

Permet de renommer un VG sans le désactiver. Attention à bien modifer ///etc/fstab//

  vgrename vg_apps vg_appli

===== Logical Volumes =====

==== lvcreate ====

Permet de créer un LV sur un VG donné.

  root@SpaceServer:/tmp> lvcreate -L 2G -n lv_test vg_apps
  lvcreate -- doing automatic backup of "vg_apps"
  lvcreate -- logical volume "/dev/vg_apps/lv_test" successfully created

==== lvextend ====

Permet d'augmenter la taille du LV. Umount d'abord du FS

  root@SpaceServer:/tmp> lvextend -L +1G /dev/vg_apps/lv_test
  lvextend -- extending logical volume "/dev/vg_apps/lv_test" to 3 GB
  lvextend -- doing automatic backup of volume group "vg_apps"
  lvextend -- logical volume "/dev/vg_apps/lv_test" successfully extended

==== lvreduce ====

Permet de réduire la taille du LV.
Attention on réduit d'abord le FS et seulement ensuite on peut réduire le LV.

  root@SpaceServer:/tmp> lvreduce -L -1G /dev/vg_apps/lv_test
  lvreduce -- WARNING: reducing active logical volume to 2 GB
  lvreduce -- THIS MAY DESTROY YOUR DATA (filesystem etc.)
  lvreduce -- do you really want to reduce "/dev/vg_apps/lv_test"? [y/n]: y
  lvreduce -- doing automatic backup of volume group "vg_apps"
  lvreduce -- logical volume "/dev/vg_apps/lv_test" successfully reduced

==== lvdisplay ====

Affiche les différentes infos sur le LV. Utilisez ''-v'' pour avoir plus d'infos.

  root@SpaceServer:/tmp> lvdisplay /dev/vg_apps/lv_test
  --- Logical volume ---
  LV Name                /dev/vg_apps/lv_test
  VG Name                vg_apps
  LV Write Access        read/write
  LV Status              available
  LV #                   1
  # open                 0
  LV Size                2 GB
  Current LE             64
  Allocated LE           64
  Allocation             next free
  Read ahead sectors     1024
  Block device           58:9

==== lvremove ====

Permet de supprimer un LV.

  root@SpaceServer:/tmp> lvremove /dev/vg_apps/lv_test
  lvremove -- do you really want to remove "/dev/vg_apps/lv_test"? [y/n]: y
  lvremove -- doing automatic backup of volume group "vg_apps"
  lvremove -- logical volume "/dev/vg_apps/lv_test" successfully removed


====== Opérations courantes ======

note : on travaille ici en //reiserfs//. Pour l'//ext3// utiliser **mkfs.ext3** au lieu de **mkreiserfs**.

===== Créer un filesystem =====
On créé d'abord le volume logique (LV), puis le filesystem (FS) à proprement parler. On finit par modifier le ///etc/fstab//

Création du LV :
  lvcreate -L taille[M|G] -n nom_du_lv nom_du_vg
  lvcreate -L 500M -n lv_apache vgdata

Création du FS (ici au format //reiserfs//):
  mkreiserfs /dev/nom_du_vg/nom_du_lv
  mkreiserfs /dev/vgdata/lv_apache

===== Augmenter un filesystem =====
Il est possible d'augmenter à chaud sans avoir à démonter le FS. Dans ce cas on augmente d'abord le LV ''puis'' ensuite on augmente le FS.

Augmentation du LV :
  lvextend -L +taille[M|G] /dev/nom_du_vg/nom_du_lv
  lvextend -L +500M /dev/vgdata/lv_apache

Augmentation du FS :
  resize_reiserfs -s+taille[M|G] /dev/nom_du_vg/nom_du_lv
  reiserfs -s+500M /dev/vgdata/lv_apache


===== Réduire un FS ======
Il est obligatoire de démonter le FS pour la réduction. On réduit d'abord le FS ''puis'' le LV.

Démontage du FS :
  umount /nom_du_fs
  umount /apache

Réduction du FS :
  resize_reiserfs -s-taille[M|G] /dev/nom_du_vg/nom_du_lv
  resize_reiserfs -s-500M /dev/vgdata/lv_apache

Réduction du LV :
  lvreduce -L -taille[M|G] /dev/nom_du_vg/nom_du_lv
  lvreduce -L 500M /dev/vgdata/lv_apache

Remontage du FS :
  mount /nom_du_fs
  mount /apache

===== Créer un rawdevice ======

On créé d'abord un LV sur lequel on positionnera un rawdevice :

  lvcreate -L 16G -n lv_raw_01 vg_data

Lancer la commande //raw// pour binder les rawdevices :

  raw /dev/raw/rawX /dev/vg_data/lv_raw_01

Renseigner le fichier ///etc/sysconfig/rawdevices//

Configurer le démarrage des raws au boot

  /etc/init.d/rawdevices start

===== Remplacer un disque (RAID1 sur machine Compaq/HP) ======

  * Vérifier l'existant:

  /usr/sbin/hpacucli

//-> controller all show//

  Smart Array 6i in Slot 0      ()
	
//-> controller slot=0 physicaldrive all show//

<code>
Smart Array 6i in Slot 0

  array A
   physicaldrive 2:0   (port 2:id 0 , Parallel SCSI, 72.8 GB, OK)
   physicaldrive 2:1   (port 2:id 1 , Parallel SCSI, 72.8 GB, OK)

  array B
   physicaldrive 2:2   (port 2:id 2 , Parallel SCSI, 72.8 GB, OK)
   physicaldrive 2:3   (port 2:id 3 , Parallel SCSI, 72.8 GB, OK)
</code>

//-> controller slot=0 logicaldrive all show//

<code>
Smart Array 6i in Slot 0

  array A
   logicaldrive 1 (67.8 GB, 1+0, OK)

  array B
   logicaldrive 2 (67.8 GB, 1+0, OK)
</code>

  * Créer un nouveau RAID:

  /usr/sbin/hpacucli

//-> controller slot=0 create type=logicaldrive drives=allunassigned raid=1+0//

Puis //pvcreate// sur le nouveau disque.

  * Etendre un RAID existant:

  /usr/sbin/hpacucli

//-> controller slot=0 array B modify size=max//

Reboot du serveur pour prise en compte au niveau système puis //pvresize// pour étendre le LVM.


===== Créer un LV mirroré ======

  lvcreate --type mirror -L 128MB -m 1 --mirrorlog mirrored -n vol1 testvg

Soit le vg suivant **vg_mirror** :

<code>
Volume groupe : vg_mirror

Volume(s) physique(s) : 2
PE : totaux = 223072 Mo, alloues : 0 Mo, libres : 223072 Mo
PV : /dev/emcpowerm         ,tot_sz = 111536 Mo   ,lib_sz  = 111536 Mo
PV : /dev/emcpowern         ,tot_sz = 111536 Mo   ,lib_sz  = 111536 Mo
</code>

Par défaut le lvm a besoin de 3 disques : 2 pour mirrorer les datas et un 3ème pour la log mais du coup si on perd ce disque on perd les datas ... Autant le mettre en RAM (il sera recréé à chaque reboot par exemple).

<code>
root@serverl1101561:/# lvcreate -m 1 --corelog -L 20G -n lv_one vg_mirror
  Logical volume "lv_one" created

Volume groupe : vg_mirror

Volume(s) physique(s) : 2
PE : totaux = 223072 Mo, alloues : 40960 Mo, libres : 182112 Mo
PV : /dev/emcpowerm         ,tot_sz = 111536 Mo   ,lib_sz  = 91056 Mo
PV : /dev/emcpowern         ,tot_sz = 111536 Mo   ,lib_sz  = 91056 Mo

Volume(s) logique(s)  : 3
LV : lv_one                 ,log_sz = 20480 Mo,   sur   ne_mimage_0 ne_mimage_1
LV : lv_one_mimage_0        ,log_sz = 20480 Mo,   sur
LV : lv_one_mimage_1        ,log_sz = 20480 Mo,   sur

root@server1101561:/# mkfs.ext3  /dev/vg_mirror/lv_one
root@server1101561:/# mount /dev/vg_mirror/lv_one /mnt
</code>

Malheureusement on ne peut pas étendre le LV à chaud, il faut démonter le FS puis faire un //lvchange -an// ce qui n'est pas très pratique.

<code>
root@server1101561:/# lvextend -L +10G /dev/vg_mirror/lv_one
  Extending 2 mirror images.
  Mirrors cannot be resized while active yet.
</code>

Une solution existe néanmoins. On supprime une patte du mirroir, on étend et on réintègre la patte en question :

<code>
root@serverl1101561:/# lvconvert -m 0 /dev/vg_mirror/lv_one
  Logical volume lv_one converted.

root@server1101561:/# lvextend -L +10G /dev/vg_mirror/lv_one
  Extending logical volume lv_one to 30.00 GB
  Logical volume lv_one successfully resized

root@server1101561:/# lvconvert -m 1 --corelog /dev/vg_mirror/lv_one
  Logical volume lv_one converted.
</code>

On peut voir le statut de la resynchro :

<code>
root@server1101561:/var/log# lvs -a /dev/vg_mirror/lv_one
  LV     VG        Attr   LSize  Origin Snap%  Move Log Copy%
  lv_one vg_mirror mwi-ao 50.00G                          9.03
</code>

On vérifie le résultat :

<code>
Volume groupe : vg_mirror

Volume(s) physique(s) : 2
PE : totaux = 223072 Mo, alloues : 61440 Mo, libres : 161632 Mo
PV : /dev/emcpowerm         ,tot_sz = 111536 Mo   ,lib_sz  = 80816 Mo
PV : /dev/emcpowern         ,tot_sz = 111536 Mo   ,lib_sz  = 80816 Mo

Volume(s) logique(s)  : 3
LV : lv_one                 ,log_sz = 30720 Mo,   sur   ne_mimage_0 ne_mimage_1
LV : lv_one_mimage_0        ,log_sz = 30720 Mo,   sur
LV : lv_one_mimage_1        ,log_sz = 30720 Mo,   sur
</code>

On étend le FS :

<code>
root@server1101561:/# ext2online /mnt/
ext2online v1.1.18 - 2001/03/18 for EXT2FS 0.5b
</code>

===== Déplacer des LVs ======

== Cas 1 ==

⇒ On veut déplacer tous les LVs du disque **emcpowerm** vers **emcpowern**, à chaud.

  * Soit le //vg_appli// constitué du disque **emcpowerm** :

<code>
root@server1101561:~# vgdisplay -v vg_appli 2>/dev/null|grep "PV Name"
  PV Name               /dev/emcpowerm
</code>

  * On rajoute le disque **emcpowern** au //vg_appli// :

<code>
root@server1101561:~# pvcreate /dev/emcpowern
  Physical volume "/dev/emcpowern" successfully created

root@server1101561:~# vgextend vg_appli /dev/emcpowern
  Volume group "vg_appli" successfully extended
</code>

  * Soient les LVs suivants :

<code>
root@server1101561:~# ls -1 /dev/vg_appli
lv_data1
lv_data2
lv_data3
lv_data4
lv_data5
</code>

  * On utilise //pvmove// pour déplacer ces LVs, à chaud :

<code>
root@server1101561:~# ls -1 /dev/vg_appli|while read i
> do
> pvmove -n $i /dev/emcpowerm /dev/emcpowern
> echo "$i moved \!"
> done
  /dev/emcpowerm: Moved: 2.0%
  /dev/emcpowerm: Moved: 4.2%
  /dev/emcpowerm: Moved: 6.5%
  /dev/emcpowerm: Moved: 8.8%
  /dev/emcpowerm: Moved: 11.0%
...
</code>

  * On supprime le disque **emcpowerm** du //vg_appli// :

<code>
vgreduce vg_appli /dev/emcpowerm 
vgscan
vgcfgbackup vg_appli
</code>

== Cas 2 ==

⇒ On veut déplacer certains LVs du disque **emcpowerm** vers **emcpowern** avec le moins d'indispo possible et faire un nouveau VG //vg_appli2// avec les LVs déplacés.

On reprend la même procédure que précédemment. Une fois tous les LVs déplacés intégralement sur le nouveau disque il faut désactiver le VG (et donc avoir démonter tous les FS au préalable et désactiver les éventuels raws) :

<code>

root@server1101561:~# vgchange -an vg_appli
  0 logical volume(s) in volume group "vg_appli" now active

root@server1101561:~# vgsplit vg_appli vg_appli2 /dev/emcpowern
  Volume group "vg_appli2" successfully split from "vg_appli"
</code>

Et voila :

<code>
root@server1101561:~# vgscan
  Reading all physical volumes.  This may take a while...
  Found volume group "vg_appli2" using metadata type lvm2
  Found volume group "vg_appli" using metadata type lvm2
  Found volume group "rootvg" using metadata type lvm2
</code>

Ensuite on active les VGs avec //vgchange -ay// et on remonte les LVs.

===== Correspondances dm-* VS logical volumes =====

<code>
root@server2311827:/# lvmdiskscan  |grep dm- |tail
  /dev/dm-23     [        1.00 GB]
  /dev/dm-24     [        3.44 GB]
  /dev/dm-25     [        1.47 GB]
  /dev/dm-26     [        1.47 GB]
  /dev/dm-27     [      160.00 MB]
  /dev/dm-28     [      224.00 MB]
  /dev/dm-29     [        5.00 GB]
  /dev/dm-30     [        5.00 GB]
  /dev/dm-31     [      288.00 MB]
  /dev/dm-32     [       39.06 GB]
</code>

On peut les confondre avec des devices multipath, pour être sur on peut lancer un //multipath -ll// et effectuer la correspondance. Si la commande n'existe pas ou ne rend rien c'est tout simple que linux créé un device dm-* pour chaque LV créé. Pour checker :

  * On récupère les minor/major :

<code>
root@server2311827:/#  ls -l /dev/dm-27
brw-r-----  1 root root 253, 27 Apr 17 09:39 /dev/dm-27
</code>

  * On check dans les VGs :
<code>
root@server2311827:/# vgdisplay -v 2>/dev/null |grep 253:27 -B 11|grep "LV Name"
  LV Name                /dev/rootvg/lv_wls103_d1
</code>


====== Metadevices (RAID 1 logiciel) ======

  * Créer les metadevices :

  mdadm --create /dev/md0 -l 1 --raid-devices=2 /dev/emcpowera2 /dev/emcpowerc2
  mdadm --create /dev/md1 -l 1 --raid-devices=2 /dev/emcpowerb /dev/emcpowerd

  * Créer un RAID 1 avec un seul disque au début :

  mdadm --create /dev/md0 -l 1 --raid-devices=2 /dev/sda2 missing

  * Démarrer les metadevices :

  mdadm --assemble /dev/md0 /dev/emcpowera2 /dev/emcpowerc2
  mdadm --assemble /dev/md1 /dev/emcpowerb /dev/emcpowerd

  * Arrêter les metadevices :

  mdadm --stop /dev/md0
  mdadm --stop /dev/md1

  * Dans le fichier ///etc/mdadm.conf// rajouter :

  DEVICE /dev/emcpowerb /dev/emcpowerd
  DEVICE /dev/emcpowera2 /dev/emcpowerc2

  * Puis pour vérifier :

  mdadm --examine --scan -c /etc/mdadm.conf
  
  root@SpaceServer:/root> mdadm --examine --scan -c /etc/mdadm.conf
  ARRAY /dev/md0 level=raid1 num-devices=2 UUID=cdeabe60:356153ce:16bed617:874f97db
     devices=/dev/emcpowera2,/dev/emcpowerc2
  ARRAY /dev/md1 level=raid1 num-devices=2 UUID=66458bd1:5bb9acd4:18503815:b36812b6
     devices=/dev/emcpowerb,/dev/emcpowerd

<code>
root@spaceServer:/mnt> mdadm --detail /dev/md0
/dev/md0:
        Version : 00.90.00
  Creation Time : Tue Apr 17 16:18:46 2007
     Raid Level : raid1
     Array Size : 57108416 (54.46 GiB 58.48 GB)
    Device Size : 57108416 (54.46 GiB 58.48 GB)
   Raid Devices : 2
  Total Devices : 2
Preferred Minor : 0
    Persistence : Superblock is persistent

    Update Time : Thu Apr 19 12:20:23 2007
          State : dirty, no-errors -----------------------------> le dirty c'est "normal" :-]
 Active Devices : 2
Working Devices : 2
 Failed Devices : 0
  Spare Devices : 0
</code>

  * Ensuite si tout est ok on peut écrire dans le fichier :

  mdadm --examine --scan -c /etc/mdadm.conf >> /etc/mdadm.conf

  * Supprimer un device d'un RAID :

=> on le passe en //failed//
<code>
root@SpaceServer:/mnt>  mdadm /dev/md0 --fail /dev/emcpowerb
mdadm: set /dev/emcpowerb faulty in /dev/md0
</code>

=> on le supprime
<code>
root@SpaceServer:/mnt>  mdadm /dev/md0 --remove /dev/emcpowerb
mdadm: hot removed /dev/emcpowerb

root@SpaceServer:/mnt> mdadm --detail /dev/md0
/dev/md0:
 
    Number   Major   Minor   RaidDevice State
       0       0        0        0      faulty removed
       1     232       48        1      active sync   /dev/emcpowerd
</code>

  * Ensuite on peut rajouter un nouveau device 

<code>
root@SpaceServer:/mnt/ben> mdadm /dev/md0 --add /dev/emcpowerb
mdadm: hot added /dev/emcpowerb
</code>

Hop ! Synchro en cours :

<code>
root@SpaceServer:/mnt/ben> cat /proc/mdstat
Personalities : [raid1]
read_ahead 1024 sectors
Event: 11
md1 : active raid1 emcpowera2[0] emcpowerc2[1]
      56902144 blocks [2/2] [UU]

md0 : active raid1 emcpowerb[2] emcpowerd[1]
      57108416 blocks [2/1] [_U]
      [>....................]  recovery =  0.2% (150040/57108416) finish=88.5min speed=10717K/sec
unused devices: <none>
</code>

Par défaut la vitesse de reconstruction est limitée pour des soucis de perfs, on peut le voir dans la log :

<code>
md: syncing RAID array md0
md: minimum _guaranteed_ reconstruction speed: 1000 KB/sec/disc.
md: using maximum available idle IO bandwith (but not more than 200000 KB/sec) for reconstruction.
md: using 128k window, over a total of 14277056 blocks.
</code>

On peut augmenter la vitesse via ///proc/sys/dev/raid/speed_limit_min// :

  echo 25000 >> /proc/sys/dev/raid/speed_limit_min

On voit tout de suite la différence :

** Avant : **
<code>
root@server9002737:/mnt/ben# cat /proc/mdstat
Personalities : [raid1]
md0 : active raid1 emcpowerd[1] emcpowere[0]
      14277056 blocks [2/2] [UU]
      [======>..............]  resync = 33.7% (4821888/14277056) finish=151.5min speed=1036K/sec
</code>

** Après: **
<code>
root@server9002737:/mnt/ben# cat /proc/mdstat
Personalities : [raid1]
md0 : active raid1 emcpowerd[1] emcpowere[0]
      14277056 blocks [2/2] [UU]
      [================>....]  resync = 82.6% (11803776/14277056) finish=1.6min speed=25004K/sec
</code>

  * On peut aussi retailler un métadevice (augmenter ou réduire) :

  mdadm --grow size=50G /dev/md0
  pvresize /dev/md0

====== Troubleshooting ======


===== EXT3-fs error (device dm-12) in start_transaction: Journal has aborted =====

On récupère les infos //minor// / //major// du device :

  [root@SomeMachine]# ls -l /dev/dm-12
  brw-r-----  1 root root 253, 12 Jun 24 11:27 /dev/dm-12

On peut également trouver les infos sous ///dev/mapper// et utiliser ///proc/partitions//.

On cherche le LV correspondant :

<code>
[root@SomeMachine]# lvdisplay -v |grep -B 13 "253:12"
File descriptor 3 left open
    Finding all logical volumes

  --- Logical volume ---
  LV Name                /dev/vg_oraORACLESID/lv_oracle
  VG Name                vg_oraORACLESID
  LV UUID                6Re4id-CaYP-OcML-z3J7-g4lG-AEtu-PFXLtO
  LV Write Access        read/write
  LV Status              available
  # open                 1
  LV Size                512.00 MB
  Current LE             128
  Segments               1
  Allocation             inherit
  Read ahead sectors     0
  Block device           253:12
</code>

On en déduit le FS grâce au ///etc/fstab// ou au fichier de démarrage MC Service Guard (comme ici) :

  [root@SomeMachine]# grep "vg_oraORACLE_SID/lv_oracle" cl_*/*.sh
  LV[0]="/dev/vg_oraORACLE_SID/lv_oracle"; FS[0]="/apps/oracle"; FS_TYPE[0]="ext3"; FS_MOUNT_OPT[0]=""


===== Retrouver un device =====

Soit l'erreur suivante dans ///var/log/messages// :

  Feb 19 09:28:44 SomeMachine kernel: 3a:0c: rw=0, want=652360104, limit=167772160

Pas forcément très clair ... Ce qui nous intéresse ici c'est **3a:0c**, on convertit de l'hexa vers le décimal :

^  Hexa  ^  Décimal  ^
|  3a  |  58  |
|  0c  |  12  |

Il s'agit du device LVM **(58,12)** :

<code>
root@SomeMachine:/tmp> lvscan |grep ACTIVE|awk '{print $4}'|xargs lvdisplay|grep 58:12 -B 13

--- Logical volume ---
LV Name                /dev/vg_col1/lv_sybasedata1
VG Name                vg_col1
LV Write Access        read/write
LV Status              available
LV #                   3
# open                 1
LV Size                160 GB
Current LE             5120
Allocated LE           5120
Allocation             next free
Read ahead sectors     1024
Block device           58:12
</code>

Ensuite on retrouve le FS associé via le fichier ///etc/fstab// ou le fichier de démarrage cluster (MC Service Guard par exemple).

===== VG inconsistent part I =====

On peut parfois avoir cette erreur si un disque a été retiré à l'arrache :

<code>
Couldn't find device with uuid 'sAK55E-35qf-Ffs5-ju6g-ZCnN-ojwi-BPb1CJ'.
Couldn't find all physical volumes for volume group vg_oap.
</code>

Pour y remédier :

<code>
vgreduce --removemissing --test vg_oap

vgreduce --removemissing vg_oap
  Couldn't find device with uuid 'sAK55E-35qf-Ffs5-ju6g-ZCnN-ojwi-BPb1CJ'.
  Couldn't find all physical volumes for volume group vg_oap.
  Couldn't find device with uuid 'sAK55E-35qf-Ffs5-ju6g-ZCnN-ojwi-BPb1CJ'.
  Couldn't find all physical volumes for volume group vg_oap.
  Couldn't find device with uuid 'sAK55E-35qf-Ffs5-ju6g-ZCnN-ojwi-BPb1CJ'.
  Couldn't find all physical volumes for volume group vg_oap.
  Couldn't find device with uuid 'sAK55E-35qf-Ffs5-ju6g-ZCnN-ojwi-BPb1CJ'.
  Couldn't find all physical volumes for volume group vg_oap.
  Couldn't find device with uuid 'sAK55E-35qf-Ffs5-ju6g-ZCnN-ojwi-BPb1CJ'.
  Couldn't find device with uuid 'sAK55E-35qf-Ffs5-ju6g-ZCnN-ojwi-BPb1CJ'.
  Couldn't find device with uuid 'sAK55E-35qf-Ffs5-ju6g-ZCnN-ojwi-BPb1CJ'.
  Couldn't find device with uuid 'sAK55E-35qf-Ffs5-ju6g-ZCnN-ojwi-BPb1CJ'.
  Wrote out consistent volume group vg_oap
</code>

Puis un petit //vgscan// pour vérifer.

===== VG inconsistent part II =====

Parfois on peut avoir le message d'erreur ci-dessous :

  vgscan -- ERROR "vg_read_with_pv_and_lv(): allocated LE of LV" can't get data of volume group from physical volume(s)

Pour y remédier on peut tenter la commande //vgcfgrestore// et utiliser un backup précédent. Un backup est généré :

  * dans ///etc/lvmconf// sous RHEL3
  * dans ///etc/lvm/backup// sous  RHEL4 / Debian and co

On vérifie le VG :

<code>
root@server1106215:/etc/lvmconf> vgscan
vgscan -- reading all physical volumes (this may take a while...)
vgscan -- found active volume group "rootvg"
vgscan -- found inactive volume group "vg_toto"
vgscan -- only found 0 of 160 LEs for LV /dev/vg_titi/lv_srec (0)
vgscan -- ERROR "vg_read_with_pv_and_lv(): allocated LE of LV" can't get data of volume group "vg_titi" from physical volume(s)
vgscan -- "/etc/lvmtab" and "/etc/lvmtab.d" successfully created
vgscan -- WARNING: This program does not do a VGDA backup of your volume groups
</code>

On restaure le conf du VG :

<code>
root@server1106215:/etc/lvmconf> vgcfgrestore -f vg_titi.conf -n vg_titi "/dev/emcpowerd"
vgcfgrestore -- size of physical volume /dev/emcpowerd differs from backup
</code>

Pour ignorer les contraintes de taille (de toute façon au point où on en est) :

<code>
root@server1106215:/etc/lvmconf> vgcfgrestore -i -f vg_titi.conf -n vg_titi "/dev/emcpowerd"
vgcfgrestore -- forcing write of VGDA of "vg_titi" to physical volume "/dev/emcpowerd"
vgcfgrestore -- ignoring size mismatches
vgcfgrestore -- VGDA for "vg_titi" successfully restored to physical volume "/dev/emcpowerd"
vgcfgrestore -- you may not have an actual backup of restored volume group "vg_titi"
</code>

Juste pour se proteger, on fait un vgcfgbackup sur les 2 noeuds.

<code>
root@server1106216:/etc/lvmconf> ls -l /etc/lvmconf/vg_titi.conf
-rw-r-----    1 root     root       166924 Feb  1 11:15 /etc/lvmconf/vg_titi.conf
root@server1106215:/etc/lvmconf> ls -l *conf
-rw-r-----    1 root     root       166924 Feb  1 11:14 vg_titi.conf
</code>

:!: Parfois il faut lancer le //vgcfgrestore// avec un autre disque du VG jusqu'à ce que ça passe (dans le cas où le VG est sur plusieurs disques), la commande //pvscan// permet de lister les PVs.

===== Savoir qui écrit quoi =====

  * Désactiver temporairement l'écriture du kernel logger dans kern.log (///etc/syslogd.conf//).

<code>
echo 1 > /proc/sys/vm/block_dump
while true; do dmesg -c; sleep 1; done
echo 0 > /proc/sys/vm/block_dump
</code>

===== VGs en double =====

Lorsque des disques SAN sont rajoutés sur une machine Linux alors qu'ils n'ont pas été formatés on peut avoir des erreurs de Duplicate VG name notamment avec le vg_apps. Cela provient du fait que les disques ajoutés non pas été formatés et qu'ils contenaient dejà un vg_apps. Pour que ce soit encore plus rock n' roll le vg_apps importé n'a pas tous ses disques. Par exemple :

-> le vg_apps déjà existant et complet :
<code>
  --- Volume group ---
  VG Name               vg_apps
  VG UUID               sz0iLr-t1jV-iaJf-8xLM-1clh-FK2L-21Zeyk

  --- Physical volumes ---
  PV Name               /dev/dm-21
  PV UUID               llalr9-8I9F-y3st-mcCa-QkZ7-QDX0-ZAHI3O
</code>

-> le vg_apps incomplet et importé par la rajout du disque SAN :
<code>
  --- Volume group ---
  VG Name               vg_apps
  VG UUID               Ca5e4x-xbqq-6j5V-x9vG-Dvdb-xixF-Lq2XUa

  --- Physical volumes ---
  PV Name               unknown device
  PV UUID               jAnT2n-BoUf-Cazf-1SrY-sVx4-3dzn-J83scd
  PV Status             allocatable
  Total PE / Free PE    13942 / 0

  PV Name               /dev/dm-18
  PV UUID               14VTx7-IZYM-yejh-zCf5-lkHM-qDg7-DGLl0c
  PV Status             allocatable
  Total PE / Free PE    27884 / 577

  PV Name               unknown device
  PV UUID               JUOqyk-t6Ob-ciL6-IB4X-k23y-fQNv-KQLd2v
  PV Status             allocatable
  Total PE / Free PE    13942 / 3702
</code>

On remarque les unknown device (chaque disque du VG contient toutes les infos du VG dans son entête). Par ailleurs chaque fois qu'un commande LVM est lancé la machine vomit des erreurs et on ne peut plus bosser sur le vg_apps car il est vu en double par l'OS.

Pour vérifier que c'est bien le /dev/-dm18 qui pose problème on peut visualiser les LVs présents :

<code>
pvdisplay -m /dev/dm-18
</code>

On vérifie qu'aucun FS rétourné par la commande n'est monté.

Pour résoudre le problème :

<code>
vgrename Ca5e4x-xbqq-6j5V-x9vG-Dvdb-xixF-Lq2XUa vg_apps_KO => on renomme le VG avec son VG UUID
vgchange -a n vg_apps_KO				   => on désactive le VG
vgremove vg_apps_KO					   => on bute le VG
pvremove -ff /dev/dm-18					   => on bute l'entête LVM du device
</code>

Sauf que dans le cas que j'ai rencontré je n'ai pas pu renommer le VG car il était en cours d'utilisation ... En fait lors du vgscan un LV du VG foireux devait avoir les mêmes minor/major et a été importé dans le bon VG :

<code>
root@parsl2414967:/tmp# ls -l /dev/vg_apps/lv_dba
lrwxrwxrwx 1 root root 26 Nov 17 18:08 /dev/vg_apps/lv_dba -> /dev/mapper/vg_apps-lv_dba
</code>
L'OS le voyait actif car le bon vg_apps était actif et donc impossible de faire quoique ce soit sur le VG corrompu. La commande lvremove ne passait donc pas (une sorte de LV fantôme). Pour le supprimer réellement il faut utiliser la commande de bas niveau dmsetup qui permet d'accéder aux devices multipath et au LVM. On le supprime :

<code>
dmsetup info -c |grep lv_dba	=> on récupère le nom du LV au format dmsetup
dmsetup remove vg_apps-lv_dba	=> on le supprime réellemment
</code>

Ensuite on peut reprendre la manip ci-dessus en renommant le VG. Si jamais ça ne passe pas on peut aussi supprimer le device /dev/dm-18 :

<code>
mpath8 (360060480000290103021533030353143) dm-18 EMC,SYMMETRIX
[size=109G][features=0][hwhandler=0][rw]
\_ round-robin 0 [prio=2][active]
 \_ 3:0:0:45 sdj 8:144 [active][ready]
 \_ 4:0:0:45 sds 65:32 [active][ready]

dmsetup remove mpath8			=> on supprime le device					
pvremove /dev/sdj /dev/sds		=> on vire les infos LVM sur les 2 chemins
</code>

Un vgscan  permet de remettre tout d'aplomb. Le device /dev/dm-18 est maintenant vierge de toutes infos LVM et on peut enfin bosser.

Cette méthode permet de ne pas rebooter le serveur ni d'arrêter les applis qui tournent.

===== Déterminer le device incriminé lors de SCSI errors =====

<code>
May 31 01:00:04 server3006361 kernel: scsi3 (0:0): rejecting I/O to offline device
May 31 01:00:04 server3006361 kernel: SCSI error: host 3 id 0 lun 0 return code = 4000000
May 31 01:00:04 server3006361 kernel:    Sense class 0, sense error 0, extended sense 0
May 31 01:00:05 server3006361 su(pam_unix)[2593]: session opened for user root by (uid=0)
May 31 01:00:06 server3006361 kernel: scsi3 (0:0): rejecting I/O to offline device
May 31 01:00:06 server3006361 kernel: SCSI error: host 3 id 0 lun 0 return code = 4000000
May 31 01:00:06 server3006361 kernel:    Sense class 0, sense error 0, extended sense 0
May 31 01:00:06 server3006361 kernel: scsi3 (0:0): rejecting I/O to offline device
May 31 01:00:06 server3006361 kernel: SCSI error: host 3 id 0 lun 0 return code = 4000000
May 31 01:00:06 server3006361 kernel:    Sense class 0, sense error 0, extended sense 0
May 31 01:00:06 server3006361 kernel: scsi3 (0:0): rejecting I/O to offline device
May 31 01:00:06 server3006361 kernel: SCSI error: host 3 id 0 lun 0 return code = 4000000
May 31 01:00:06 server3006361 kernel:    Sense class 0, sense error 0, extended sense 0
</code>

<code>
root@server3006361:PRODUCTION:/var/log# cat /proc/scsi/scsi |egrep -A 2 "scsi3"
Host: scsi3 Channel: 00 Id: 00 Lun: 00
  Vendor: Dell     Model: Virtual  CDROM   Rev: 123
  Type:   CD-ROM                           ANSI SCSI revision: 02
</code>

===== Lister hôtes SCSI =====

<code>
[root@localhost ~]# lsscsi --hosts
[0]    ata_piix
[1]    ata_piix
[2]    ahci
</code>

<code>
[root@localhost ~]# lsblk -S
NAME HCTL       TYPE VENDOR   MODEL             REV TRAN
sda  2:0:0:0    disk ATA      VBOX HARDDISK    1.0  sata
sr0  1:0:0:0    rom  VBOX     CD-ROM           1.0  ata
</code>