1

yop,

Bon, ce soir ça craint, j'ai l'impression que j'ai un disque qui part en quenouille...

Ajd, boot de linux, premier boot depuis la maj du kernel d'hier : un bus error apparait très tôt dans le boot, dès le début d'init, et le log du bus error s'affiche dès qu'un programme d'init essaye d'écrire quelque chose sur la partition root. Je me tape donc des dizaines de pages de bus error pour finanement arriver au login, sans X. J'arrive à me loguer sur mon user et root. Mais bus error à nouveau dès que j'essaye d'exécuter un programme un peu évolué qui va vouloir écrire sur le disque à un moment où l'autre. J'ai cru réussir à voir passer, dans un défilement, des "secteur défectueux n° .......".

- J'ai exécuté fsck /, qui me dit que tout va bien

- J'ai exécuté fsck /dev/sdb (donc le disque incriminé), qui me parle d'erreur de superblock. Pourtant, fsck /dev/sda (un disque rempli d'un Win à lui tout seul) ne me reporte pas d'erreur. Bref, je suis une quiche en fsck, et j'ai pas envie de tester une option qui va me foutre tout mon DD en l'air.

- "man" ne marche pas, donc ça ne m'aide pas vraiment, parce que j'ai pas d'autre PC à côté pour pêcher des infos en temps réel, X ne se lance évidemment pas.

- J'ai rebooté avec le kernel précédent, résultat identique

- faut que je trouve un moyen de faire un scandisk /surface depuis windows, ou depuis un live CD (quelles sont les bonnes distros pour ce genre de sport ??)

- J'ai, depuis ces erreurs, activé le smart dans le bios (oui, vous avez le droit de me fouetter très violemment :/). J'aimerais savoir s'il est possible lire ce rapport sous Windows, sans télécharger un espèce de freeware bardé de pubs...


Un grand merci d'avance à qui pourra m'aider.

Ah, dernier détail, un secteur défectueux, c'est un présage d'un disque qui va bientôt mourir entièrement, ou non pas du tout ? Le disque a ~3 ans, c'est un Seagate série 12 de 1To.

2

Folco (./1) :
Ah, dernier détail, un secteur défectueux, c'est un présage d'un disque qui va bientôt mourir entièrement, ou non pas du tout ? Le disque a ~3 ans, c'est un Seagate série 12 de 1To.
Quand il y en a un, ça va, c'est quand il y en a beaucoup qu'il y a des problèmes embarrassed

Ça n'est pas vraiment censé arriver avec un disque récent, vu qu'il y a des secteurs en rab pour compenser si jamais un secteur claque. Donc c'est pas bon signe, et un backup d'urgence est fortement recommandé. Après, il est tout-à-fait possible que le problème ne se développe pas davantage, mais on ne sait jamais.

Pour tester l'état SMART et tenter des réparations, je te conseillerais d'utiliser une distrib Linux dédiée que tu peux booter depuis un CD ou une clé USB, du genre Parted Magic.

Quant au message "bus error"... première fois que je vois ça sur un PC, ou alors tu as installé un 68k dedans ? cheeky
avatar
Zeroblog

« Tout homme porte sur l'épaule gauche un singe et, sur l'épaule droite, un perroquet. » — Jean Cocteau
« Moi je cherche plus de logique non plus. C'est surement pour cela que j'apprécie les Ataris, ils sont aussi logiques que moi ! » — GT Turbo

3

Au fait :
Folco (./1) :
- J'ai exécuté fsck /dev/sdb (donc le disque incriminé), qui me parle d'erreur de superblock.
Ça fait super longtemps que je n'ai plus fait de gestion de disque sous Linux, mais de mémoire, fsck s'applique à une partition, et /dev/sdb c'est un disque complet. Vérifie si l'argument ne devrait pas plutôt être quelque chose comme /dev/sdb1. Si fsck s'attend à trouver une partition et que tu lui files un disque (avec un MBR ou l'équivalent en UEFI), il va te sortir des erreurs qui n'auront aucun sens.

Si tu as besoin des man pages, tu peux les trouver en ligne (je sais plus l'adresse, mais ça prend 5 secondes avec Google).
avatar
Zeroblog

« Tout homme porte sur l'épaule gauche un singe et, sur l'épaule droite, un perroquet. » — Jean Cocteau
« Moi je cherche plus de logique non plus. C'est surement pour cela que j'apprécie les Ataris, ils sont aussi logiques que moi ! » — GT Turbo

4

Oui, je m'en suis rendu compte, pour fsck.
Pour man, je connais les man en ligne, mais sans X, c'est chaud. ^^
Pour la réparation, je vais tenter avec un liveCD, oui. Sinon, c'est possible, avec mon VirtualBox sous Windows, de booter ma partition Linux réelle ? Ca me simplifierait bien la vie en fait...

5

Folco (./4) :
Pour la réparation, je vais tenter avec un liveCD, oui
Si possible, fais une image disque avant, c'est plus prudent.
Folco (./4) :
Sinon, c'est possible, avec mon VirtualBox sous Windows, de booter ma partition Linux réelle ? Ca me simplifierait bien la vie en fait...
Oui.

6

Méfiance quand même. Le matos de la machine virtuelle ne sera pas le même que celui de ta machine physique, donc il est possible que ça cafouille. Par ailleurs, je te recommande de ne pas booter ton système depuis la partition corrompue tant qu'elle ne sera pas réparée, pour ne pas aggraver les choses. Si tu veux quand même le faire, fais une image disque avant comme le recommande Pen² (ce qui te permettra de voir au passage s'il y a des erreurs de lecture).
avatar
Zeroblog

« Tout homme porte sur l'épaule gauche un singe et, sur l'épaule droite, un perroquet. » — Jean Cocteau
« Moi je cherche plus de logique non plus. C'est surement pour cela que j'apprécie les Ataris, ils sont aussi logiques que moi ! » — GT Turbo

7

t'as essayé de faire un petit scan via testdisk afin qu'il te dise si t'as pas un header de partoche qui se barre en nouille?
avatar
"If you see strict DRM and copy protection that threatens the preservation of history, fight it: copy the work, keep it safe, and eventually share it so it never disappears. [...] no one living 500 years from now will judge your infringing deeds harshly when they can load up an ancient program and see it for themselves."

Benj Edwards - Why History Needs Software Piracy

- - -
Achat ou échange: topic de mes recherches Meilleur smiley = #helico# Obligatory XKCD

8

Zerosquare (./6) :
Méfiance quand même. Le matos de la machine virtuelle ne sera pas le même que celui de ta machine physique, donc il est possible que ça cafouille.
Oui.
Un copain était obligé de switcher un paramètre du driver de la carte vidéo par exemple.

9

Ok merci, on tentera d'essayer ce soir. smile

10

Un probleme de disque ne ce manifeste pas par des bus error, mais des freeze complet de la machine. Bus error serais plutot un soucis memoire, ou hardware en general.

Tu devrais lancer un coup de memtst86+
avatar
Proud to be CAKE©®™


GCC4TI importe qui a problème en Autriche, pour l'UE plus et une encore de correspours nucléaire, ce n'est pas ytre d'instérier. L'état très même contraire, toujours reconstruire un pouvoir une choyer d'aucrée de compris le plus mite de genre, ce n'est pas moins)
Stalin est l'élection de la langie.

11

Je sais que y'a pas de lien, mais la dernière fois que j'ai eu une série de Bus error, c'était à cause de la pile du bios qui était à plat...

(et en effet, ça provoquait des remises à zéro de paramètres, dont le timing de la ram...)
avatar
Webmaster du site Ti-FRv3 (et aussi de DevLynx)
Si moins de monde enculait le système, alors celui ci aurait plus de mal à nous sortir de si grosses merdes !
"L'erreur humaine est humaine"©Nil (2006) // topics/6238-moved-jamais-jaurais-pense-faire-ca

12

J'ai vérifié mon profil XMP, il est toujours sur ce que j'avais défini. Le hasard a voulu que je démonte tout mon PC pour le passer à l'air comprimé à la boite, on va tester maintenant qu'il est remonté.
Je n'ai aucune erreur côté Windows, se pourrat-il que Linux déconne et Windows fonctionne avec une RAM défaillante ?
Sinon, la pile du BIOS a un an, et je n'y ai pas touché, pourquoi pas.
Sur les mailing lists et les forums, j'ai vu qu'il pourrait également s'agir de UDEV qui déconne avec je sais pas quoi de SATA en 16 bits, bref si il y a un CD dans le lecteur au boot. C'était mon cas, mais ça a contnué même après.

Je manque également d'info parce que mount écrit sur la partition (certainement un log) en montant un volume, et je ne peux donc pas monter une autre partition hormis celle du système qui l'est déjà, ce qui m'interdit de piper ou copier des logs, pour analyse sous Windows. Ca, c'est aussi un souci, vu que les rapports de bus errors sont kilométriques :/

13

D'experience Windows est plus "conciliant" que linux avec de la RAM defaillante oui.

Teste la ram ca ne "coute rien" d'autre que du temps et au moins ca discriminera ce composant si il n'y a aucun soucis.
avatar
Proud to be CAKE©®™


GCC4TI importe qui a problème en Autriche, pour l'UE plus et une encore de correspours nucléaire, ce n'est pas ytre d'instérier. L'état très même contraire, toujours reconstruire un pouvoir une choyer d'aucrée de compris le plus mite de genre, ce n'est pas moins)
Stalin est l'élection de la langie.

14

Ok, merci bien. smile

15

Tiens, truc étrange, mon Windows a pris 3 heures d'avance, c'est concommitant avec mon tour dans le bios d'hier, bien que je n'ai pas changé l'heure. Si ça peut donner un indice...

16

3 heures pile ? C'est étrange, c'est ce qu'on voit souvent avec un dual boot Linux/Windows, si Linux utilise l'horloge en mode UTC et Windows en mode heure locale. Mais ça ne semble pas être ça, et 3 heures c'est trop pour un décalage UTC/heure locale en France.
avatar
Zeroblog

« Tout homme porte sur l'épaule gauche un singe et, sur l'épaule droite, un perroquet. » — Jean Cocteau
« Moi je cherche plus de logique non plus. C'est surement pour cela que j'apprécie les Ataris, ils sont aussi logiques que moi ! » — GT Turbo

17

ben , problème d'écriture dans la mem du bios? ca ressemble à l'erreur de vince.

bus error, sur un x86, c'est rare.

d'après ici http://stackoverflow.com/questions/2089167/debugging-sigbus-on-x86-linux
ça peut venir de mmap() ou d'instructions SSE

18

putain de Parted Magic, c'est payant vtff

3 heures pile, oui. J'ai remis le BIOS à l'heure au dernier boot, et Windows a encore 3 heures dans la gueule >< J'ai déjà eu une heure ou deux entre nux et win, jamais 3 >< 1 heure, pour la différence entre locale et utc, je crois que c'est ce que j'avais.

squalyl -> pourquoi linux, et tout programme qui essaye d'écrire sur cette parition du disque, irait écrire dans le bios ? Via un appel système ?

Sinon, dans le log des bus errors, je vois systématiquement erreur d'écriture sur /dev/sdb (c'est bien ce disque, où est mon système), sector 1888903713. Toujours le même. Je cherche un LiveCD de réparation sous nux...

• Folco crawle dans Distro-watch

Merci pour toute votre aide en tout cas.

19

Folco (./18) :
putain de Parted Magic, c'est payant
Hein ?!
http://sourceforge.net/projects/partedmagic/

Essaie GParted Live CD, sinon :
http://gparted.sourceforge.net/livecd.php
avatar
Zeroblog

« Tout homme porte sur l'épaule gauche un singe et, sur l'épaule droite, un perroquet. » — Jean Cocteau
« Moi je cherche plus de logique non plus. C'est surement pour cela que j'apprécie les Ataris, ils sont aussi logiques que moi ! » — GT Turbo

20

21

Est-ce que ça irait, ça : http://gparted.sourceforge.net/
Entre checker un disque dur et le réparer, ya une marche. Et ça fait quoi concrètement, une réparation ? Ca dit au disque "tu permets plus d'écrire ici, c'est mort" ? Tous les systèmes sont à l'écoute de ce genre d'infos, voire c'est même transparent pour eux ?

Sinon, euh, ça va prendre un peu de temps, mais j'ai, euh, trouvé Parted Magic #itm#

Cross -> Zerosquare, clique sur l'onglet "File"...

Squalyl -> J'ai vu, ça a l'air très puissant ces softs, mais c'est uniquement en CLI, pas d'internet à côté, donc comme je suis pas un gourou, j'ai peur de faire plus de mal que de bien...
edit -> ah si, apparemment ya moyen d'avoir une interface. J'aimerais pouvoir googler pour être sûr des options de réparation (?) que je vais choisir.

22

Bon, ben reboute tongue

23

tu peux utiliser ces softs depuis un cd linux mint si ta clé usb a été faite avec un peu d'espace pour apt-getter ces softs (options possibles dans lili creator)
avatar
Webmaster du site Ti-FRv3 (et aussi de DevLynx)
Si moins de monde enculait le système, alors celui ci aurait plus de mal à nous sortir de si grosses merdes !
"L'erreur humaine est humaine"©Nil (2006) // topics/6238-moved-jamais-jaurais-pense-faire-ca

24

Ah, en effet, même pas pensé. D'ailleurs, on peut apt-getter depuis un dvd. Mais la gravure du mien à échoué, un DVD-R à la benne, un.
Retentative avec UnetBootin et une clé uhaisbé.

25

Fait un CDR
avatar
Proud to be CAKE©®™


GCC4TI importe qui a problème en Autriche, pour l'UE plus et une encore de correspours nucléaire, ce n'est pas ytre d'instérier. L'état très même contraire, toujours reconstruire un pouvoir une choyer d'aucrée de compris le plus mite de genre, ce n'est pas moins)
Stalin est l'élection de la langie.

26

Trop tard. Je suis sur le live. Comme attendum GParted n y voit que du feu. Je vais explorer les autres softs.

27

Un soft me dit ca :
Complete error log:

SMART Error Log Version: 1
ATA Error Count: 408 (device log contains only the most recent five errors)
	CR = Command Register [HEX]
	FR = Features Register [HEX]
	SC = Sector Count Register [HEX]
	SN = Sector Number Register [HEX]
	CL = Cylinder Low Register [HEX]
	CH = Cylinder High Register [HEX]
	DH = Device/Head Register [HEX]
	DC = Device Command Register [HEX]
	ER = Error register [HEX]
	ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 408 occurred at disk power-on lifetime: 17568 hours (732 days + 0 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 ff ff ff 0f  Error: UNC at LBA = 0x0fffffff = 268435455

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 80 ff ff ff 4f 00      00:28:12.251  READ FPDMA QUEUED
  60 00 20 ff ff ff 4f 00      00:28:12.251  READ FPDMA QUEUED
  60 00 60 ff ff ff 4f 00      00:28:12.230  READ FPDMA QUEUED
  60 00 08 ff ff ff 4f 00      00:28:12.230  READ FPDMA QUEUED
  60 00 08 ff ff ff 4f 00      00:28:12.205  READ FPDMA QUEUED

Error 407 occurred at disk power-on lifetime: 17568 hours (732 days + 0 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 ff ff ff 0f  Error: UNC at LBA = 0x0fffffff = 268435455

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 08 ff ff ff 4f 00      00:02:57.568  READ FPDMA QUEUED
  27 00 00 00 00 00 e0 00      00:02:57.564  READ NATIVE MAX ADDRESS EXT
  ec 00 00 00 00 00 a0 00      00:02:57.563  IDENTIFY DEVICE
  ef 03 46 00 00 00 a0 00      00:02:57.563  SET FEATURES [Set transfer mode]
  27 00 00 00 00 00 e0 00      00:02:57.563  READ NATIVE MAX ADDRESS EXT

Error 406 occurred at disk power-on lifetime: 17568 hours (732 days + 0 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 ff ff ff 0f  Error: UNC at LBA = 0x0fffffff = 268435455

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 08 ff ff ff 4f 00      00:02:54.829  READ FPDMA QUEUED
  27 00 00 00 00 00 e0 00      00:02:54.825  READ NATIVE MAX ADDRESS EXT
  ec 00 00 00 00 00 a0 00      00:02:54.824  IDENTIFY DEVICE
  ef 03 46 00 00 00 a0 00      00:02:54.824  SET FEATURES [Set transfer mode]
  27 00 00 00 00 00 e0 00      00:02:54.824  READ NATIVE MAX ADDRESS EXT

Error 405 occurred at disk power-on lifetime: 17568 hours (732 days + 0 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 ff ff ff 0f  Error: UNC at LBA = 0x0fffffff = 268435455

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 08 ff ff ff 4f 00      00:02:52.086  READ FPDMA QUEUED
  60 00 08 ff ff ff 4f 00      00:02:52.076  READ FPDMA QUEUED
  60 00 08 ff ff ff 4f 00      00:02:52.063  READ FPDMA QUEUED
  60 00 08 ff ff ff 4f 00      00:02:52.063  READ FPDMA QUEUED
  60 00 08 ff ff ff 4f 00      00:02:52.037  READ FPDMA QUEUED

Error 404 occurred at disk power-on lifetime: 17568 hours (732 days + 0 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 ff ff ff 0f  Error: UNC at LBA = 0x0fffffff = 268435455

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 08 ff ff ff 4f 00      00:02:38.361  READ FPDMA QUEUED
  27 00 00 00 00 00 e0 00      00:02:38.357  READ NATIVE MAX ADDRESS EXT
  ec 00 00 00 00 00 a0 00      00:02:38.356  IDENTIFY DEVICE
  ef 03 46 00 00 00 a0 00      00:02:38.356  SET FEATURES [Set transfer mode]
  27 00 00 00 00 00 e0 00      00:02:38.356  READ NATIVE MAX ADDRESS EXT

28

Folco (./28) :
When the command that caused the error occurred, the device was active or idle.

merci tritop

29

Oui, on apprend même que mon disque dur a fait une erreur 404, c'est ça les objets connectés tripo En attendant, ça me dit pas comment réparer...

30

Mmmh. Le fait que le secteur où a lieu l'erreur soit pile-poil une puissance de 2 moins un (LBA = 0x0fffffff), c'est suspect. Ça fait plutôt penser à un driver/OS qui déconne qu'à un problème physique avec le disque. Quelqu'un a eu le même souci sous Linux dans un cas tordu : http://www.noah.org/wiki/Disk_errors

Ton soft donne d'autres infos SMART, du genre le nombre total d'erreurs de lecture, etc. ?
avatar
Zeroblog

« Tout homme porte sur l'épaule gauche un singe et, sur l'épaule droite, un perroquet. » — Jean Cocteau
« Moi je cherche plus de logique non plus. C'est surement pour cela que j'apprécie les Ataris, ils sont aussi logiques que moi ! » — GT Turbo