1

Connaîtriez-vous une méthode pour télécharger des pages web complètes (faire l'équivalent d'un Ctrl+S dans Firefox, au format page web complète) ?
Le but est d'intégrer ça dans du code Python, sur une machine sans interface graphique…
J'ai commencé à regarder Selenium, mais a priori ça ne fonctionne pas (impossible de piloter pour taper le nom du fichier dans la boîte de dialogue et valider l'enregistrement sad)
avatar
<<< Kernel Extremis©®™ >>> et Inventeur de la différence administratif/judiciaire ! (©Yoshi Noir)

<Vertyos> un poil plus mais elle suce bien quand même la mienne ^^
<Sabrina`> tinkiete flan c juste qu'ils sont jaloux que je te trouve aussi appétissant

2

wget ne te va pas ?
https://www.guyrutenberg.com/2014/05/02/make-offline-mirror-of-a-site-using-wget/

Quelqu'un cite aussi HTTrack dans les commentaires :
http://www.httrack.com/
avatar
Zeroblog

« Tout homme porte sur l'épaule gauche un singe et, sur l'épaule droite, un perroquet. » — Jean Cocteau
« Moi je cherche plus de logique non plus. C'est surement pour cela que j'apprécie les Ataris, ils sont aussi logiques que moi ! » — GT Turbo

3

J'ai pensé à wget -R, mais ça ne fonctionne pas avec les sites contenant un peu de JS pour la mise en forme. C'est ce que j'aimais bien dans selenium : l'utilisation d'un vrai moteur web HTML+JS permet d'avoir un rendu normal (même si ça va foirer avec un site qui se construit totalement en JS, genre les fameuses Single Page Applications).

Accessoirement, ça permettrait d'utiliser des sites web avec authentification.

Je me demande si je peux utiliser une extension Firefox pour sauvegarder sans passer par les boîtes de dialogue standard.

Ah oui, j'ai oublié de préciser : le but est de faire fonctionner le tout sur macOS et Linux.
avatar
<<< Kernel Extremis©®™ >>> et Inventeur de la différence administratif/judiciaire ! (©Yoshi Noir)

<Vertyos> un poil plus mais elle suce bien quand même la mienne ^^
<Sabrina`> tinkiete flan c juste qu'ils sont jaloux que je te trouve aussi appétissant

4

Tu peux essayer Chrome en mode headless ou Firefox qui possède l'équivalent il me semble. Ça évitera la couche d'abstraction supplémentaire de Selenium dont tu n'as a priori pas besoin et qui est très instable.
avatar
All right. Keep doing whatever it is you think you're doing.
------------------------------------------
Besoin d'aide sur le site ? Essayez par ici :)

5

Ok, merci happy je vais regarder ça. Il y a des chances que ce soit exactement ce dont j'ai besoin happy
avatar
<<< Kernel Extremis©®™ >>> et Inventeur de la différence administratif/judiciaire ! (©Yoshi Noir)

<Vertyos> un poil plus mais elle suce bien quand même la mienne ^^
<Sabrina`> tinkiete flan c juste qu'ils sont jaloux que je te trouve aussi appétissant

6

il existe aussi http://phantomjs.org
et la le mec il le pécho par le bras et il lui dit '

7

j'avais commencé à voir ça également. Je pense que je vais utiliser l'export PDF, même si ce n'est pas parfait.
Au pire, je changerai de solution plus tard (en gardant ce topic au chaud).


Merci !
avatar
<<< Kernel Extremis©®™ >>> et Inventeur de la différence administratif/judiciaire ! (©Yoshi Noir)

<Vertyos> un poil plus mais elle suce bien quand même la mienne ^^
<Sabrina`> tinkiete flan c juste qu'ils sont jaloux que je te trouve aussi appétissant