Accéder au contenu.
Menu Sympa

linux-31 - Re: Test d'un disque dur avec smartctl : demande de conseils

Objet : Discussions sur le logiciel libre

Archives de la liste

Re: Test d'un disque dur avec smartctl : demande de conseils


Chronologique Discussions 
  • From: Claude MICOUIN <mlnglst AT free.fr>
  • To: linux-31 AT culte.org
  • Subject: Re: Test d'un disque dur avec smartctl : demande de conseils
  • Date: Thu, 10 Jun 2021 19:59:16 +0200
  • Authentication-results: pic2s.le-pic.org; dkim=pass (2048-bit key; unprotected) header.d=free.fr header.i= AT free.fr header.b="YY0qC4eT"; dkim-atps=neutral

Donc, j'ai eu plusieurs blocages de l'ordi aujourd'hui.
Ce matin, tout bien.
Cet après-midi, j'ai branché un disque dur neuf à l'aide d'un
adaptateur usb pour récupérer les données du disque dur magnétique
interne et le brancher en lieu et place avec un câble neuf.

Partitionnement et formatage impec, puis copie des données: au début
bien, puis figeage de la copie. Je démonte et débranche le DD. Et là,
la souris usb branchée sur le port voisin ne répond plus. Youpi!
Je branche une souris filaire sur un autre port usb pour reprendre la
main. Ça marche, puis assez rapidement, gel complet de l'ordi.
Redémarrage brutal et plus moyen de passer le cap du bios, ni d'accéder
au bios, ni au menu de démarrage. Grand moment de solitude (avec les
gamins qui te disent "Ça marche pas?" "Mon papa y m'a dit qu'il faut
faire ctrl alt suppr")...

J'ai mis un ventilateur pour refroidir l'intérieur du boitier, sans
succès. Bien plus tard, j'ai débranché les deux DD et j'ai pu accéder
au bios. Rebranche les dd et redémarre...

J'ai fait un dmeg plus bas.
Questions :
1) La chaleur est-elle responsable? Le bios était figé... (j'ai
installé psensor. Je ne sais pas s'il enregistre les températures dans
un log)
2) Les erreurs I/O peuvent-elles être dues à une surchauffe ?
3) Quand est-ce qu'on mange? :-)

Encore merci.
Claude MICOUIN



[ 6.837385] snd_hda_codec_idt hdaudioC0D2: inputs:
[ 6.837388] snd_hda_codec_idt hdaudioC0D2: Front Mic=0xb
[ 6.837390] snd_hda_codec_idt hdaudioC0D2: Rear Mic=0xe
[ 6.837392] snd_hda_codec_idt hdaudioC0D2: Line=0xc
[ 6.837394] snd_hda_codec_idt hdaudioC0D2: dig-in=0x22
[ 6.888094] coretemp coretemp.0: Using relative temperature scale!
[ 6.890022] coretemp coretemp.0: Using relative temperature scale!
[ 6.980697] intel_powerclamp: No package C-state available
[ 7.012148] intel_powerclamp: No package C-state available
[ 7.145313] Adding 9213272k swap on /dev/sdb2. Priority:-2
extents:1 across:9213272k FS
[ 7.240844] random: crng init done
[ 7.240850] random: 7 urandom warning(s) missed due to ratelimiting
[ 7.600069] input: HDA Digital PCBeep as
/devices/pci0000:00/0000:00:1b.0/sound/card0/input4
[ 7.600445] input: HDA Intel Front Mic as
/devices/pci0000:00/0000:00:1b.0/sound/card0/input7
[ 7.600528] input: HDA Intel Rear Mic as
/devices/pci0000:00/0000:00:1b.0/sound/card0/input8
[ 7.600612] input: HDA Intel Line as
/devices/pci0000:00/0000:00:1b.0/sound/card0/input9
[ 7.600697] input: HDA Intel Line Out Front as
/devices/pci0000:00/0000:00:1b.0/sound/card0/input10
[ 7.600778] input: HDA Intel Line Out Surround as
/devices/pci0000:00/0000:00:1b.0/sound/card0/input11
[ 7.600864] input: HDA Intel Line Out CLFE as
/devices/pci0000:00/0000:00:1b.0/sound/card0/input12
[ 7.600947] input: HDA Intel Line Out Side as
/devices/pci0000:00/0000:00:1b.0/sound/card0/input13
[ 7.601031] input: HDA Intel Front Headphone as
/devices/pci0000:00/0000:00:1b.0/sound/card0/input14
[ 7.981549] EXT4-fs (sdb3): mounted filesystem with ordered data
mode. Opts: (null)
[ 8.189773] EXT4-fs (sda2): mounted filesystem with ordered data
mode. Opts: (null)
[ 8.284959] audit: type=1400 audit(1623335994.839:2):
apparmor="STATUS" operation="profile_load" profile="unconfined"
name="/usr/lib/cups/backend/cups-pdf" pid=390 comm="apparmor_parser"
[ 8.284966] audit: type=1400 audit(1623335994.839:3):
apparmor="STATUS" operation="profile_load" profile="unconfined"
name="/usr/sbin/cupsd" pid=390 comm="apparmor_parser"
[ 8.284969] audit: type=1400 audit(1623335994.839:4):
apparmor="STATUS" operation="profile_load" profile="unconfined"
name="/usr/sbin/cupsd//third_party" pid=390 comm="apparmor_parser"
[ 8.295240] audit: type=1400 audit(1623335994.851:5):
apparmor="STATUS" operation="profile_load" profile="unconfined"
name="libreoffice-oopslash" pid=392 comm="apparmor_parser"
[ 8.301986] audit: type=1400 audit(1623335994.855:6):
apparmor="STATUS" operation="profile_load" profile="unconfined"
name="/usr/sbin/haveged" pid=393 comm="apparmor_parser"
[ 8.310541] audit: type=1400 audit(1623335994.867:7):
apparmor="STATUS" operation="profile_load" profile="unconfined"
name="libreoffice-soffice" pid=391 comm="apparmor_parser"
[ 8.310547] audit: type=1400 audit(1623335994.867:8):
apparmor="STATUS" operation="profile_load" profile="unconfined"
name="libreoffice-soffice//gpg" pid=391 comm="apparmor_parser"
[ 8.313936] audit: type=1400 audit(1623335994.867:9):
apparmor="STATUS" operation="profile_load" profile="unconfined"
name="nvidia_modprobe" pid=395 comm="apparmor_parser"
[ 8.313943] audit: type=1400 audit(1623335994.867:10):
apparmor="STATUS" operation="profile_load" profile="unconfined"
name="nvidia_modprobe//kmod" pid=395 comm="apparmor_parser"
[ 8.317498] audit: type=1400 audit(1623335994.871:11):
apparmor="STATUS" operation="profile_load" profile="unconfined"
name="/usr/sbin/cups-browsed" pid=396 comm="apparmor_parser"
[ 8.444564] input: HDA NVidia HDMI/DP,pcm=3 as
/devices/pci0000:00/0000:00:01.0/0000:01:00.1/sound/card1/input5
[ 8.444662] input: HDA NVidia HDMI/DP,pcm=7 as
/devices/pci0000:00/0000:00:01.0/0000:01:00.1/sound/card1/input6
[ 9.476736] IPv6: ADDRCONF(NETDEV_UP): enp5s1: link is not ready
[ 9.477966] IPv6: ADDRCONF(NETDEV_UP): enp5s1: link is not ready
[ 9.477976] IPv6: ADDRCONF(NETDEV_CHANGE): enp5s1: link becomes
ready
[ 9.520214] IPv6: ADDRCONF(NETDEV_UP): enp5s8: link is not ready
[ 9.540289] IPv6: ADDRCONF(NETDEV_UP): enp5s8: link is not ready






Le jeudi 10 juin 2021 à 08:50 +0200, Joyce MARKOLL a écrit :
> PS: qu'est-ce que tu voulais dire par "trifouiller" ? Fouiller 3 fois
> ? As-tu songé à
> vérifier les logs *juste après* un redémarrage ? Par exemple juste
> après redémarrage que
> produit "dmesg | tail -n 120 > dmesg.txt" (et copie "dmesg.txt" vers
> un site pastebin,
> comme pastebin.fr puis fournis le lien en retour sur la liste).
>
>
> On Thu, 10 Jun 2021 08:43:53 +0200
> "Joyce MARKOLL" (via linux-31 Mailing List) <linux-31 AT culte.org>
> wrote:
>
> > Salut,
> >
> > les infos qui t'intéressent en priorité sont celles que j'ai marqué
> > en bleu sur cette
> > capture:
> > https://wtf.roflcopter.fr/pics/gallery#Pz3EbFVw/etQ27NNl.png
> >
> > "Current sector pending count" (des secteurs défectueux en attente
> > de réallocation) et
> > "Offline uncorrectable", des secteurs ne pouvant être corrigés.
> >
> > Des indicateurs comme "Raw_Read_Error_Rate" sont présentés, dans
> > l'interface graphique
> > de SMART, "gsmartcontrol" comme étant dépendant des fabricants et
> > n'est pas toujours une
> > indication de problème (gsmartcontrol est ce que je préfère
> > utiliser, car plus de
> > contrôle visuellement, sans que je m'y connaisse beaucoup). Je te
> > recommande
> > gsmartcontrol.
> >
> > Et je te suggère de faire changer l'alimentation de ce PC. (Plus
> > faire la poussière et
> > changer la pâte thermique).
> >
> > Et gsmartcontrol est disponible dans les dépôts Debian.
> >
> > Pour les erreurs I/O, essaie de changer les câbles SATA. Il y en a
> > peut-être un qui est
> > défectueux.
> >
> > Joyce
> >
> >
> >
> > On Thu, 10 Jun 2021 00:13:03 +0200
> > "Claude MICOUIN" (via linux-31 Mailing List) <linux-31 AT culte.org>
> > wrote:
> >
> > > Bonsoir la liste,
> > > sur le PC de ma classe (Debian Buster), j'ai eu des freeze avec
> > > obligations de redémarrer brutalement. Parfois le redémarrage
> > > lui-même plantait. Pas
> > > très joyeux quand on est en classe avec les gamins qui
> > > s'impatientent... J'ai
> > > trifouillé un peu les câbles sur les disques durs et ça
> > > repartait. Câble ou HD ou
> > > mauvais contact ?
> > >
> > > J'ai lancé smartctl (que je découvre) avec le disque dur
> > > magnétique. Je
> > > ferai le SSD plus tard. Au fait, est-ce utile smartctl sur un ssd
> > > ?
> > > Ici; ils disent que non https://doc.ubuntu-fr.org/smartmontools
> > >
> > > Tous les tests que j'ai faits sont dans le fichier en PJ.
> > > D'abord la commande smartctl -i /dev/sdb
> > > qui m'indique qu'on peut utiliser smartctl sur ce DD
> > > SMART support is: Available - device has SMART capability.
> > > SMART support is: Enabled
> > >
> > >
> > >
> > > Ensuite, smartctl -A /dev/sdb ne m'affiche rien dans la colonne
> > > WHEN_FAILED (ce qui me parait bon signe).
> > > Par contre, les lignes suivantes m'affiche des valeurs élevées.
> > > Est-ce
> > > grave ?
> > > Raw_Read_Error_Rate 52191882
> > >
> > > Seek_Error_Rate 447813722 et les valeurs WORST
> > > et THRESH
> > > semblent assez proches 60 et 30
> > >
> > > Hardware_ECC_Recovered 38512172
> > >
> > >
> > >
> > > smartctl --all /dev/sdb m'affiche en plus:
> > > Num Test_Description Status Remaining
> > > LifeTime(hours) LBA_of_first_error
> > > # 1 Short offline Completed without
> > > error 00% 9726
> > > # 2 Extended offline Interrupted (host
> > > reset) 90% 9725
> > > # 3 Extended offline Interrupted (host
> > > reset) 90% 9724
> > > # 4 Short offline Completed without
> > > error 00% 9724
> > > # 5 Short offline Completed without
> > > error 00% 9719
> > > # 6 Short offline Completed without
> > > error 00% 9719
> > > # 7 Extended offline Completed without
> > > error 00% 8965
> > > # 8 Extended offline Aborted by
> > > host 90% 8964
> > > # 9 Short offline Completed without error 00%
> > > 8964
> > >
> > >
> > > En dernier, j'ai fait un smartctl -l selftest /dev/sdb
> > > suivi d'un smartctl -q errorsonly -H -l selftest /dev/sdb
> > > -> nada
> > >
> > > Questions:
> > > 1) Le disque dur est-il en train de rendre l'âme ?
> > > 2) Dans le cas contraire, d'où viendrait la panne? Mauvais
> > > contact ou
> > > autre chose ?
> > >
> > > Pour le SSD, j'ai eu un série de lignes au boot avec un nombre à
> > > rallonge, puis print_req_error, I/O error, dev sda, sector
> > > <nombre à
> > > rallonge>
> > > Le SSD n'est pas très vieux (le magnétique plus) ce qui me
> > > surprend un
> > > peu.
> > >
> >
> > --
> > Orditux Informatique
> > https://orditux.org
> > https://orditux.org/aol/
> > https://orditux.org/floss
> >
> >
>
> --




Archives gérées par MHonArc 2.6.19+.

Haut de le page