J'ai un problème "récurent" avec le pc linux qui héberge TI-FR.

J'ai une freebox fibre qui est branchée à un routeur netgear r6300 (et à la box tv mais bon, c'est pas pour ce qu'elle sert) en mode dmz et derrière y'a mon LAN, intégrant entre autres TI-FR qui est sous ubuntu.

Seulement voilà, sans que je sache pourquoi, parfois, la machine ubuntu devient invisible de l'extérieur, le serveur est toujours up, apache aussi, en lan on peut accéder aux sites hébergés mais depuis l'extérieur, rien, la seule solution qui "marche" est de rebooter le routeur.

Sauf qu'il n'est pas planté, parce que de l'extérieur, je peux me connecter en SSH à n'importe quelle autre machine (dont un port est exposé dans les règles de routage bien entendu) pour faire un tunnel qui me permet de prendre la main en graphique sur n'importe quelle machine du lan (le serveur TI-FR inclus) et rebooter soit TI-FR, soit le routeur (mais en général je fais le routeur parce que c'est plus rapide et avec efficacité garantie).

J'en viens à ma question : comment "identifier" ce qui pose problème ???
(et ensuite, comment le résoudre)


PS : c'est un vieux problème, je l'avais déjà avec mon précédent routeur et avec les serveurs précédents (sous debian ou gentoo, x86 ou pa-risc) et la box précédente (livebox)
avatarWebmaster du site Ti-FRv3 (et aussi de DevLynx)
Si moins de monde enculait le système, alors celui ci aurait plus de mal à nous sortir de si grosses merdes !
"L'erreur humaine est humaine"©Nil (2006) // topics/6238-moved-jamais-jaurais-pense-faire-ca
Comment est configuré l'adressage interne du serveur ? Tu es en adressage fixe ? En DHCP fixe ?
C'est tout le serveur qui devient invisible, ou uniquement le service Web ? (mais peut-être que tu n'as que ce service accessible de l'extérieur ? hm non, tu as aussi le FTP, donc j'imagine que c'est tout le serveur).
Et comment est configuré la visibilité du serveur ? C'est une IP/un port interne déclarée sur le routeur ? Au niveau de la Box ?
avatar
DHCP Fixe

Tout le serveur devient invisible (mais uniquement depuis l'extérieur, en lan on ne détecte aucun problème))

Sur la box, tout est routé vers 192.168.0.100 qui est l'adresse ip fixe du port wan du routeur.

Le routeur gère le sous réseau 192.168.1.* pour le lan. Et il a une table de NAT/PAT qui fait que le port 80 est routé vers l'adresse du serveur, que le port 123456789 est routé vers mon PC de cuisine etc...

Chaque machine du réseau est en DHCP et c'est le routeur qui fournit les adresses. Le tout en s'appuyant sur une table d'adresses "fixes" pour telle ou telle adresse mac.
avatarWebmaster du site Ti-FRv3 (et aussi de DevLynx)
Si moins de monde enculait le système, alors celui ci aurait plus de mal à nous sortir de si grosses merdes !
"L'erreur humaine est humaine"©Nil (2006) // topics/6238-moved-jamais-jaurais-pense-faire-ca
Hm, le souci de ces routeurs est qu'ils ne sont pas faits pour un usage semi-intensif à intensif, donc que les firmwares peuvent déconner sans qu'on sache trop pourquoi (débordement de pile, etc.).
T'as pas moyen d'avoir un cron qui le redémarre toutes les nuits à 3 ou 4h ? Il doit mettre quoi, 3 minutes à démarrer, ça devrait être une coupure de service acceptable, non ?
avatar
Ouais enfin c'est pas un noname à dix balles non plus https://www.netgear.com/home/products/networking/wifi-routers/r6300.aspx

Et surtout, si c'est bien lui qui "plante", pourquoi les autres machines restent accessibles ?
avatarWebmaster du site Ti-FRv3 (et aussi de DevLynx)
Si moins de monde enculait le système, alors celui ci aurait plus de mal à nous sortir de si grosses merdes !
"L'erreur humaine est humaine"©Nil (2006) // topics/6238-moved-jamais-jaurais-pense-faire-ca
Tu te rends compte a quel point cette propal est crade ? grin

On a pendu des sysadmins pour moins que ca grin

Mais j'ai pas d'autre idée... essayer de tester un autre routeur peut être?

vince: peut être parce qu'il ne perd que cette règle de routage? c'est étrange en tout cas.

autre idee alakon puisque ca semble survivre aux différents serveurs routeurs et box, y'aurait pas un appareil qui essayerait de renouveler un bail DHCP, ce qui ferait sauter une règle de routage ? le routeur precedent était de quel modèle?
squalyl (./6) :
vince: peut être parce qu'il ne perd que cette règle de routage? c'est étrange en tout cas.
il n'en perd pas qu'une, il a l'air de perdre toutes celles liées à cette machine en particulier...
avatarWebmaster du site Ti-FRv3 (et aussi de DevLynx)
Si moins de monde enculait le système, alors celui ci aurait plus de mal à nous sortir de si grosses merdes !
"L'erreur humaine est humaine"©Nil (2006) // topics/6238-moved-jamais-jaurais-pense-faire-ca
j'ai édité:

autre idee alakon puisque ca semble survivre aux différents serveurs routeurs et box, y'aurait pas un appareil qui essayerait de renouveler un bail DHCP, ce qui ferait sauter un (ensemble de) règles de routage ? le routeur precedent était de quel modèle?
netgear wgt624
avatarWebmaster du site Ti-FRv3 (et aussi de DevLynx)
Si moins de monde enculait le système, alors celui ci aurait plus de mal à nous sortir de si grosses merdes !
"L'erreur humaine est humaine"©Nil (2006) // topics/6238-moved-jamais-jaurais-pense-faire-ca
donc encore du netgear... problème avec leur moteur de routage qui serait réutilisé dans plusieurs produits?
squalyl (./6) :
Tu te rends compte a quel point cette propal est crade ? grin

On a pendu des sysadmins pour moins que ca grin
Ben le souci c'est que j'imagine qu'avec un routeur comme ça, il n'y a que peu de moyens de faire un diagnostic correct... j'imagine qu'il n'y a pas d'accès terminal pour voir si, au moment où ça a planté, le routeur a toujours une conf correcte et viable pour ce serveur...
C'est malheureux, mais pour une solution domestique, le reboot programmé est parfois ce qu'on fait de moins pire (pour une solution pro aussi, mais je ne vais pas reparler des solutions de contrôle d'accès physique, ça me ferait trop mal sad )
avatar
le truc c'est que c'est pas "régulier", une fois par jour pour le reboot c'est trop et trop peu (des fois y'a une semaine sans problèmes et des fois y'a besoin de reboot une heure à peine après le précédent)
avatarWebmaster du site Ti-FRv3 (et aussi de DevLynx)
Si moins de monde enculait le système, alors celui ci aurait plus de mal à nous sortir de si grosses merdes !
"L'erreur humaine est humaine"©Nil (2006) // topics/6238-moved-jamais-jaurais-pense-faire-ca
oui, je me doute que c'est super dur a reproduire et pas régulier, sinon c'est pas drole...

un raspberry pi qui pingue le truc cassé et active un relais pour redémarrer le routeur?

Nil: je sais bien sad
squalyl (./13) :
oui, je me doute que c'est super dur a reproduire et pas régulier, sinon c'est pas drole...

un raspberry pi qui pingue le truc cassé et active un relais pour redémarrer le routeur?

Nil: je sais bien sad
un raspi chez toi ? parce que depuis le lan rien ne permet de détecter que ça ne marche plus :/
avatarWebmaster du site Ti-FRv3 (et aussi de DevLynx)
Si moins de monde enculait le système, alors celui ci aurait plus de mal à nous sortir de si grosses merdes !
"L'erreur humaine est humaine"©Nil (2006) // topics/6238-moved-jamais-jaurais-pense-faire-ca
bah typiquement, là, ça ne marche plus...
avatarWebmaster du site Ti-FRv3 (et aussi de DevLynx)
Si moins de monde enculait le système, alors celui ci aurait plus de mal à nous sortir de si grosses merdes !
"L'erreur humaine est humaine"©Nil (2006) // topics/6238-moved-jamais-jaurais-pense-faire-ca
(donc prise de main en ssh sur une autre machine, rdp en tunnel ssh vers une troisième machine et je peux reboot le routeur...)
avatarWebmaster du site Ti-FRv3 (et aussi de DevLynx)
Si moins de monde enculait le système, alors celui ci aurait plus de mal à nous sortir de si grosses merdes !
"L'erreur humaine est humaine"©Nil (2006) // topics/6238-moved-jamais-jaurais-pense-faire-ca
Depuis ton LAN j'imagine qu'en tapant l'IP LAN du serveur ca marche.

Mais si tu tapes le nom DNS de la machine inaccessible est ce que ca marche toujours?

si oui ca va être relou sorry
(et ça suffit pas, et reboot linux)
avatarWebmaster du site Ti-FRv3 (et aussi de DevLynx)
Si moins de monde enculait le système, alors celui ci aurait plus de mal à nous sortir de si grosses merdes !
"L'erreur humaine est humaine"©Nil (2006) // topics/6238-moved-jamais-jaurais-pense-faire-ca
et là c'est bon (donc c'est pas QUE le routeur, vu qu'il a fallu rebooter linux)
avatarWebmaster du site Ti-FRv3 (et aussi de DevLynx)
Si moins de monde enculait le système, alors celui ci aurait plus de mal à nous sortir de si grosses merdes !
"L'erreur humaine est humaine"©Nil (2006) // topics/6238-moved-jamais-jaurais-pense-faire-ca
vince (./14) :
un raspi chez toi ? parce que depuis le lan rien ne permet de détecter que ça ne marche plus :/
Accès à travers un VPN, genre Monocle (je ne sais pas si ça existe encore, mais Zeph doit pouvoir te proposer quelque chose j'imagine)
avatarZeroblog

« Tout homme porte sur l'épaule gauche un singe et, sur l'épaule droite, un perroquet. » — Jean Cocteau
« Moi je cherche plus de logique non plus. C'est surement pour cela que j'apprécie les Ataris, ils sont aussi logiques que moi ! » — GT Turbo
Zerosquare (./20) :
mais Zeph doit pouvoir te proposer quelque chose j'imagine
Une option dans le profil ? trilove
avatar
(et après, il s'étonne de se taper des croche-pattes automatisés !)
avatarZeroblog

« Tout homme porte sur l'épaule gauche un singe et, sur l'épaule droite, un perroquet. » — Jean Cocteau
« Moi je cherche plus de logique non plus. C'est surement pour cela que j'apprécie les Ataris, ils sont aussi logiques que moi ! » — GT Turbo
(C'est mon côté maso :3)
avatar
Linux n'a pas une tendance par défaut à renouveler le bail DHCP justement ? Ou à mal tolérer le renouvellement de son bail par le routeur ?
avatarpedrolane stoppe la chute des chevaux

La DNC-Team : un club plein de mystères
c'est pas linux qui fait ca mais dhclient et effectivement normalement un client DHCP envoie une renew request au milieu du bail.
Et ça ne peut pas être à ce moment que le serveur se prend les pieds dans le tapis ? lui faire relancer les services impactés juste après la renew request pourrait peut-être résoudre le problème, non ?

Je dis ça naïvement, on parle de choses dont j'appréhende vaguement le concept
avatarpedrolane stoppe la chute des chevaux

La DNC-Team : un club plein de mystères
Le truc, c'est qu'un bail c'est à durée "fixe", ça dépends pas de la qté de data échangée...

Là , j'ai essayé un truc : j'ai débranché la seconde carte réseau du serveur, ça n'a toujours pas "planté" depuis...
avatarWebmaster du site Ti-FRv3 (et aussi de DevLynx)
Si moins de monde enculait le système, alors celui ci aurait plus de mal à nous sortir de si grosses merdes !
"L'erreur humaine est humaine"©Nil (2006) // topics/6238-moved-jamais-jaurais-pense-faire-ca
(et ouais, débranché parce que "ifdown p2p2" marchait pas)
avatarWebmaster du site Ti-FRv3 (et aussi de DevLynx)
Si moins de monde enculait le système, alors celui ci aurait plus de mal à nous sortir de si grosses merdes !
"L'erreur humaine est humaine"©Nil (2006) // topics/6238-moved-jamais-jaurais-pense-faire-ca
Depuis ce jour là, j'ai pas eu besoin de reboot le serveur...confus
avatarWebmaster du site Ti-FRv3 (et aussi de DevLynx)
Si moins de monde enculait le système, alors celui ci aurait plus de mal à nous sortir de si grosses merdes !
"L'erreur humaine est humaine"©Nil (2006) // topics/6238-moved-jamais-jaurais-pense-faire-ca