30

Mmmh. Le fait que le secteur où a lieu l'erreur soit pile-poil une puissance de 2 moins un (LBA = 0x0fffffff), c'est suspect. Ça fait plutôt penser à un driver/OS qui déconne qu'à un problème physique avec le disque. Quelqu'un a eu le même souci sous Linux dans un cas tordu : http://www.noah.org/wiki/Disk_errors

Ton soft donne d'autres infos SMART, du genre le nombre total d'erreurs de lecture, etc. ?
avatar
Zeroblog

« Tout homme porte sur l'épaule gauche un singe et, sur l'épaule droite, un perroquet. » — Jean Cocteau
« Moi je cherche plus de logique non plus. C'est surement pour cela que j'apprécie les Ataris, ils sont aussi logiques que moi ! » — GT Turbo

31

Au besoin, comment avoir des infos SMART plus détaillées :
http://www.cyberciti.biz/tips/linux-find-out-if-harddisk-failing.html

Au fait, quelle marque et quel modèle, ton disque ? L'utilitaire du fabricant pourra peut-être faire plus que des outils génériques.
avatar
Zeroblog

« Tout homme porte sur l'épaule gauche un singe et, sur l'épaule droite, un perroquet. » — Jean Cocteau
« Moi je cherche plus de logique non plus. C'est surement pour cela que j'apprécie les Ataris, ils sont aussi logiques que moi ! » — GT Turbo

32

Disque Seagate Barracuda, 7200.12, 1To.

Merci pour tes autres info, je vais regarder. Je vais aussi voir sur le site du fabriquant. smile

33

C'est un disque SATA ou IDE ? Dans le second cas, j'ai peut-être une piste.
avatar
Zeroblog

« Tout homme porte sur l'épaule gauche un singe et, sur l'épaule droite, un perroquet. » — Jean Cocteau
« Moi je cherche plus de logique non plus. C'est surement pour cela que j'apprécie les Ataris, ils sont aussi logiques que moi ! » — GT Turbo

34

Question OS, ça m'a fait ça avec un nouveau kernel, mais j'ai rebooté avec l'ancien et le résultat est identique.

Disque SATA, pardon.

C'est marrant, le mec a un pépin avec le même LBA (lower block address ?), mais dit pas comment il s'en est sorti grin

35

En attendant, je peux monter ma partition, y lire et même y écrire !
root@partedmagic:~# echo > /media/sdb2/home/folco/truc
root@partedmagic:~# ls /media/sdb2/home/folco/truc
/media/sdb2/home/folco/truc
root@partedmagic:~# 

Alors que pasa ? hypno

36

LBA = Logical Block Addresse..

Logique non?
avatar
Proud to be CAKE©®™


GCC4TI importe qui a problème en Autriche, pour l'UE plus et une encore de correspours nucléaire, ce n'est pas ytre d'instérier. L'état très même contraire, toujours reconstruire un pouvoir une choyer d'aucrée de compris le plus mite de genre, ce n'est pas moins)
Stalin est l'élection de la langie.

37

yup cheeky
Je continue à chercher ce qui fera que mon disque ne me pondra pas cette erreur.

Donc, le kernel de mon live CD arrive sans souci à monter cette partition et à y écrire. Pas Debian, aucun de ses deux kernels. Un reset de l'UEFI pourrait-il aider ? Vous en parliez tout à l'heure...
Et SMART est clean !

38

squalyl (./28) :
Folco (./28) :
When the command that caused the error occurred, the device was active or idle.

merci tritop
Erf grin

39

squalyl (./28) :
Folco (./28) :
When the command that caused the error occurred, the device was active or idle.

merci tritop

en fait c'est par opposition à "offline"
avatar
Webmaster du site Ti-FRv3 (et aussi de DevLynx)
Si moins de monde enculait le système, alors celui ci aurait plus de mal à nous sortir de si grosses merdes !
"L'erreur humaine est humaine"©Nil (2006) // topics/6238-moved-jamais-jaurais-pense-faire-ca

40

Bizarre bizarre... un truc anormal dans la configuration (au sens large) du kernel ? un driver qui met la zone ?

Si tu ne veux pas te prendre la tête, réinstalle ta Debian. Sinon... grin
avatar
Zeroblog

« Tout homme porte sur l'épaule gauche un singe et, sur l'épaule droite, un perroquet. » — Jean Cocteau
« Moi je cherche plus de logique non plus. C'est surement pour cela que j'apprécie les Ataris, ils sont aussi logiques que moi ! » — GT Turbo

41

Le memtest est complet et clean (j'ai tenté de booter avec différents profils XMP à différentes fréquences, rien n'y fait, buss error. Je me demande si réinstaller résoudrait le problème. J'ai juste à faire un backup de mon ~ pour garder ma conf à la rigueur, c'est une install light, donc pourquoi pas. Et apt permet d'exporter la liste des paquets installés, donc réinstaller verbatim est un jeu d'enfant. (ça va être dur de lancer un soft qui fera un bus error, et d'écrire sur une partition read-only en fait #triclasse#)

Cependant, je me pose deux questions avant de faire ça :
- est-ce qu'un reset de l'UEFI pourrait résoudre le problème ? J'ai rien de spécialement configuré dedans, à part évidemment la boot sequence, mais je préfère savoir, j'aime pas toucher à un bios si c'est pas indispensable.
- est-ce qu'une image de sauvegarde de la partition (j'arrive à la monter et à la lire !), suivie d'un formattage, puis d'une réécriture de la partition pourrait résoudre le problème ? (mais du coup, c'est un peu contradictoire avec l'idée de réinstaller l'OS)

Merci pour tout. smile

42

Quand tu dis bus error, tu peux être plus précis ? Il y a beaucoup de bus différents dans un PC, et une erreur du bus PCI n'a rien à voir avec le bus mémoire ou le bus SATA. J'ai déjà eu des erreurs de bus SATA avec un disque dur, à cause du contrôleur (côté disque) qui était en fin de vie.

43

Folco (./41) :
- est-ce qu'un reset de l'UEFI pourrait résoudre le problème ? J'ai rien de spécialement configuré dedans, à part évidemment la boot sequence, mais je préfère savoir, j'aime pas toucher à un bios si c'est pas indispensable.
Honnêtement, aucune idée.
Folco (./41) :
- est-ce qu'une image de sauvegarde de la partition (j'arrive à la monter et à la lire !), suivie d'un formattage, puis d'une réécriture de la partition pourrait résoudre le problème ? (mais du coup, c'est un peu contradictoire avec l'idée de réinstaller l'OS)
Pas sûr, mais j'en doute.
avatar
Zeroblog

« Tout homme porte sur l'épaule gauche un singe et, sur l'épaule droite, un perroquet. » — Jean Cocteau
« Moi je cherche plus de logique non plus. C'est surement pour cela que j'apprécie les Ataris, ils sont aussi logiques que moi ! » — GT Turbo

44

spectras -> dur de dire, quand le système ne log pas...
Voici cependant ce que je retire de mon fail.log :
Mar 15 09:03:21 Weygand kernel: [    1.456965] usb 4-1.7: new full-speed USB device number 3 using ehci-pci
Mar 15 09:03:21 Weygand kernel: [    1.552755] usb 4-1.7: New USB device found, idVendor=046d, idProduct=c068
Mar 15 09:03:21 Weygand kernel: [    1.552854] usb 4-1.7: New USB device strings: Mfr=1, Product=2, SerialNumber=3
Mar 15 09:03:21 Weygand kernel: [    1.552946] usb 4-1.7: Product: G500
Mar 15 09:03:21 Weygand kernel: [    1.553019] usb 4-1.7: Manufacturer: Logitech
Mar 15 09:03:21 Weygand kernel: [    1.553095] usb 4-1.7: SerialNumber: 1211148C4E0018
Mar 15 09:03:21 Weygand kernel: [    2.404481] Switched to clocksource tsc
Mar 15 09:03:21 Weygand kernel: [    4.546025] ACPI Warning: 0x0000000000000428-0x000000000000042f SystemIO conflicts with Region \PMIO 1 (20130725/utaddress-251)
Mar 15 09:03:21 Weygand kernel: [    4.546235] ACPI: If an ACPI driver is available for this device, you should use it instead of the native driver
Mar 15 09:03:21 Weygand kernel: [    4.546329] ACPI Warning: 0x0000000000000530-0x000000000000053f SystemIO conflicts with Region \GPR2 1 (20130725/utaddress-251)
Mar 15 09:03:21 Weygand kernel: [    4.546524] ACPI Warning: 0x0000000000000530-0x000000000000053f SystemIO conflicts with Region \GPIO 2 (20130725/utaddress-251)
Mar 15 09:03:21 Weygand kernel: [    4.546720] ACPI: If an ACPI driver is available for this device, you should use it instead of the native driver
Mar 15 09:03:21 Weygand kernel: [    4.546810] ACPI Warning: 0x0000000000000500-0x000000000000052f SystemIO conflicts with Region \GPR2 1 (20130725/utaddress-251)
Mar 15 09:03:21 Weygand kernel: [    4.547004] ACPI Warning: 0x0000000000000500-0x000000000000052f SystemIO conflicts with Region \GPIO 2 (20130725/utaddress-251)
Mar 15 09:03:21 Weygand kernel: [    4.547212] ACPI: If an ACPI driver is available for this device, you should use it instead of the native driver
Mar 15 09:03:21 Weygand kernel: [    4.547302] lpc_ich: Resource conflict(s) found affecting gpio_ich
Mar 15 09:03:21 Weygand kernel: [    4.792336] ACPI Warning: 0x000000000000f040-0x000000000000f05f SystemIO conflicts with Region \_SB_.PCI0.SBUS.SMBI 1 (20130725/utaddress-251)
Mar 15 09:03:21 Weygand kernel: [    4.792536] ACPI: If an ACPI driver is available for this device, you should use it instead of the native driver

Je ne sais pas si ça a un rapport. Je ne sais pas (encore) non plus comment contourner ça.

En tout cas, la ligne "bus error" s'affiche, sans plus de précision, après avoir expliqué qu'elle arrive pas à lire ou écrire sur un secteur de sdb1.

Par contre, depuis mon live CD, j'arrive à lire et écrire sur ce disque. Etrangement, les tests avec Disk Health me parlent bien d'un problème sur ce LBA. Allez savoir ce qui se passe. J'ai probablement le DD qui bat de l'aile en effet sorry

45

Ah ben voilà, c'est clair. C'est ta souris Logitech qui fait tout foirer. Débranche-moi cette bestiole et remplace-là par celle qui dort dans ton placard depuis 2011 embarrassed
avatar
Zeroblog

« Tout homme porte sur l'épaule gauche un singe et, sur l'épaule droite, un perroquet. » — Jean Cocteau
« Moi je cherche plus de logique non plus. C'est surement pour cela que j'apprécie les Ataris, ils sont aussi logiques que moi ! » — GT Turbo

46

grin

Sinon, j'ai l'impression que Windows prend une heure à chaque boot confus Je suis mercredi 19 mars, il est 1:14 AM ><

47

C'est un OS du futur, c'est pour ça.

(peut-être qu'il considère à tort que ton horloge doit être avancée pour l'heure d'été ? je ne sais pas du tout pourquoi, par contre. Peut-être que le stockage de la date du dernier boot déconne, mais je ne sais pas comment c'est géré)
avatar
Zeroblog

« Tout homme porte sur l'épaule gauche un singe et, sur l'épaule droite, un perroquet. » — Jean Cocteau
« Moi je cherche plus de logique non plus. C'est surement pour cela que j'apprécie les Ataris, ils sont aussi logiques que moi ! » — GT Turbo

48

Moué, juste "Bus error" tout seul sur une ligne, c'est vraiment bizarre. Ça fait plutôt penser à un processus qui plante, pas à une erreur kernel.

Dans ce cas, ça peut complètement être lié à ton disque dur, vu que tu peux avoir un SIGBUS si un processus essaie de lire une page mémoire et que le noyau ne parvient pas à la charger. Exemple de scénario qui pourrait faire ça :
=> lancement d'un processus quelconque
=> le noyau mmap la section de code ou de data mais ne la charge pas immédiatement
=> la lecture d'une adresse dans la section provoque une page fault
=> le noyau essaie de charger la page en question depuis le disque dur
=> erreur de lecture depuis le disque dur
=> le noyau envoie un SIGBUS au processus
Folco (./46) :
Sinon, j'ai l'impression que Windows prend une heure à chaque boot confus Je suis mercredi 19 mars, il est 1:14 AM >
Probablement une erreur entre GMT et heure locale (en hiver, la France est en GMT+1).

49

Change la nappe de ton disque dur...

50

Pas con le coup de la nappe, c'est tout simple donc je vais essayer. Ceci dit, le reste du disque (1 To - 100 Go) se lit nickel, le disque contient même mon grub.

Sinon, y a-t-il un moyen pour dire au disque "tu touches plus à ce putain de LBA $00FFFFFF. Le système gueulera, mais au moins je saurai que je n'ai peut-être qu'un fichier de conf à recopier ici ou là depuis un live.
spectras (./48) :
juste "Bus error" tout seul sur une ligne

Ya plusieurs pages de log avant. Je vais virer "nomodeset" des options kernel pour essayer d'en voir plus à l'écran. Mais je peux rien loguer ! :/

Et as-tu une explication au fait que le système ne monte la partition qu'en lecture seule ?

51

tu as tester de booter avec "noapic" ?
avatar
Proud to be CAKE©®™


GCC4TI importe qui a problème en Autriche, pour l'UE plus et une encore de correspours nucléaire, ce n'est pas ytre d'instérier. L'état très même contraire, toujours reconstruire un pouvoir une choyer d'aucrée de compris le plus mite de genre, ce n'est pas moins)
Stalin est l'élection de la langie.

52

Folco (./50) :
Sinon, y a-t-il un moyen pour dire au disque "tu touches plus à ce putain de LBA $00FFFFFF.
Encore une fois, je pense que ce message d'erreur est trompeur. LBA $00FFFFFF, c'est le tout dernier secteur avant la barre des 128 Go. Ça serait vraiment une sacrée coïncidence qu'il n'y ait qu'un secteur défectueux et que ce soit justement celui-là !

Sur un disque IDE, ça pourrait être un problème avec la gestion du LBA48 : l'ancien protocole ne supportait que 28 bits, ce qui empêchait d'accéder aux secteurs au-delà de 128 Go, justement. Mais je ne sais pas si ça s'applique aussi aux disques SATA.
avatar
Zeroblog

« Tout homme porte sur l'épaule gauche un singe et, sur l'épaule droite, un perroquet. » — Jean Cocteau
« Moi je cherche plus de logique non plus. C'est surement pour cela que j'apprécie les Ataris, ils sont aussi logiques que moi ! » — GT Turbo

53

pour loguer il faut passer console=/dev/ttyS0 et logger via port série avec hyperterminal, putty, un shell connecté à un port série via /etc/inittab ou tout autre truc série sur un autre PC trioui

54

Oué, pas de souci, je te garde une chambre et une assiette pour ce soir. Surtout, débarque quand tu veux avec ton matos, et entre sans frapper cheeky
Godzil (./51) :
tu as tester de booter avec "noapic" ?

"noacpi" tu veux dire ? Non, c'est un switch que j'ai souvent vu, mais je ne sais pas ce qu'il signifie. Je regarderai pour ma culture, mais je ne connais pas les arcanes d'un kernel linux...
Zerosquare (./52) :
Encore une fois, je pense que ce message d'erreur est trompeur.

Mince, tu as raison, ton argumentaire tient bien la route en effet...

Donc ce qui va suivre est probablement inutile, mais peut-être que ça pourra en dire plus à spectras sur l'origine de l'erreur. Ca me semble être l'essentiel de ce qui veut bien s'afficher sur mon écran (le modeset ne marche pas au fait), je vous ai fait grâce des données hexa.
On lit donc, au-dessus de Bus error :
Fail command : RPDMA Queued
Status { DRDY ERR } Error { UNC }

sdb: unhandled sense code
result hostbyte = DID_OK, driverbyte = DRIVER_SENS
unrecovered read error: autoreallocate // (je crois qu'il y a "fail" après autoreallocate, dans mon souvenir ça échoue justement)
end request : I/O error, dev sdb sector fail 1888xxxxxxx

Je vais googler sur ces quelques termes...

55

Ho Zero, je crois que tu tiens un truc, la limite des 128GB

Folco: non non pas noacpi, mais bien noapic..
Verifie dans ton bios/uefi que tu n'aurais pas par erreur active un truc comme emulation IDE pour que le SATA soit vu comme de l'IDE..

Autre point, tu es sur que c'est bien la lib sata qui est utilise et non l'ancien code dans ton kernel?

Et si avec dd tu essaye de lire en raw le disque:

dd if=/dev/sdX of=/dev/null bs=Y skip=Z

pour lire juste avant le split des 128G, puis juste a la limite et apres, que se passe-t-il?
avatar
Proud to be CAKE©®™


GCC4TI importe qui a problème en Autriche, pour l'UE plus et une encore de correspours nucléaire, ce n'est pas ytre d'instérier. L'état très même contraire, toujours reconstruire un pouvoir une choyer d'aucrée de compris le plus mite de genre, ce n'est pas moins)
Stalin est l'élection de la langie.

56

Alors, dans l'ordre :
- échec avec autre câble et autre alim sata
- échec avec noacpi (mais je vais réessayer avec noapic, donc)
- j'ai pas touché à mon bios entre le dernier boot valide et le premier échec, mais je vais vérifier. Je vais même reset mon bios après avoir tenté le noapic
- j'utilise le kernel up-to-date de debian testing, le 3.13.1. Echec au premier boot. Le boot précédent utilisait le 3.12.1, qui est toujours installé, mais qui depuis ne marche plus. Peut-être que la maj a pété un truc sad

Mon disque qui foire est sdb, peux-tu préciser les Y et Z de ta commande stp ?

57

je dirais
Y=137 438 953 400
et Z=137 438 953 500

(le point intéressant étant à 137 438 953 472happy)
avatar
Webmaster du site Ti-FRv3 (et aussi de DevLynx)
Si moins de monde enculait le système, alors celui ci aurait plus de mal à nous sortir de si grosses merdes !
"L'erreur humaine est humaine"©Nil (2006) // topics/6238-moved-jamais-jaurais-pense-faire-ca

58

Merci vince, je tente ça de ce pas.
Godzil (./55) :
Autre point, tu es sur que c'est bien la lib sata qui est utilise et non l'ancien code dans ton kernel?

Comment le savoir stp ?

59

Bon, j'ai utilisé ces paramètres pour dd (j'avais booté en noapic, fail identique) :dd if=/dev/sdb of=/dev/null bs=1 skip=137 438 953 400 count = 100 (merci info qui marche, contrairement à man ! \o/)
Aucune erreur, mais ce n'est qu'en lecture. Je n'ai a priori pas de souci pour lire ce FS de toute façon.

60

Il y a un problème d'ACPI. J'aurais tenté un noacpi dans le chargeur... Pour desactiver le APIC il faudrait ajouter nolapic (no local apic) au chargeur. Ce dernier pourrait avoir une incidence sur l'horloge bien que trois heures de décalage paraissent bizarre.
Une mise à jour du bios a été faite ?