Logo iformat.io iformat.io

Comment convertir du HTML en PDF pour l'archivage (quand une URL ne suffit pas)

P
03 juillet 2026
6 minutes de lecture
Révisé par rapport aux spécifications W3C, ISO et IETF par le Équipe éditoriale d'iFormat. Formats, flux de travail et comportement des fichiers vérifiés par rapport aux implémentations de référence.

Vous venez de lire un article véritablement utile, un document essentiel ou un document de recherche et vous savez par expérience que l'URL pourrait ne plus fonctionner dans six mois. Les propriétaires de sites font pivoter le contenu, suppriment les anciens messages, redirigent les archives vers des pages de vente ou font simplement faillite.

La réponse fiable à long terme : convertir la page HTML en PDF. Voici comment procéder correctement.

Pourquoi « il suffit de le mettre en signet » échoue à long terme

La pourriture des URL est plus courante que la plupart des gens ne le pensent. Une étude de 2021 a révélé qu'environ 10 % des URL de citations académiques cessent de fonctionner dans les quatre ans. Le contenu Web général pourrit plus rapidement. Si cela vaut la peine d'être lu maintenant, cela vaut la peine d'être préservé.

Le PDF est le format d'archivage des documents. Tous les appareils de la planète l'ouvrent, le format est stable depuis des décennies et il sera toujours lisible en 2050. Internet Archive fonctionne, mais PDF vous donne une copie que vous possédez et qui ne dépend de l'infrastructure de personne d'autre.

Le moyen le plus rapide

Deux chemins selon votre point de départ :

  1. Depuis un onglet de navigateur: Ctrl/Cmd + P → Enregistrer au format PDF. Cela fonctionne sur tous les navigateurs et préserve la page telle qu'elle vous apparaît. C'est l'option la plus rapide si l'article est déjà chargé devant vous.
  2. À partir d'une URL ou d'un fichier HTML: Utilisez le Convertisseur HTML en PDF pour déposer un fichier ou coller le HTML brut. Utile pour archiver des pages que vous n'avez pas ouvertes ou pour convertir par lots des fichiers HTML enregistrés à partir de votre dossier de téléchargement.

Faire en sorte que la méthode du navigateur se comporte

Ctrl/Cmd + P → Enregistrer au format PDF est l'approche classique du navigateur, mais les paramètres par défaut produisent souvent des résultats laids : publicités, bannières de cookies, barres latérales et menus de navigation tous conservés dans le PDF, gaspillant de l'espace et encombrant l'archive.

Avant d'enregistrer, utilisez le navigateur "Mode Lecteur" :

  • Safari: cliquez sur l'icône "AA" → Afficher le lecteur.
  • Firefox: cliquez sur l'icône du lecteur dans la barre d'adresse (apparaît uniquement sur les articles).
  • Chrome/Bord: Utilisez une extension comme « Mode Lecteur » ou « Print Friendly ».

Le mode Lecteur supprime tout sauf le texte de l’article et les images en ligne. Ensuite, Ctrl/Cmd + P → Enregistrer au format PDF produit une archive propre et ciblée du contenu réel.

Enregistrez également l'URL et la date

Si vous archivez du matériel de recherche ou de référence, ajoutez l'URL source et la date à laquelle vous y avez accédé en haut du PDF. La plupart des exportations PDF du navigateur le font automatiquement (l'en-tête affiche l'URL, le pied de page affiche la date). Vérifiez avant d’enregistrer : les métadonnées comptent parfois plus que le contenu lui-même.

Quand la méthode du navigateur tombe en panne

Certaines pages ne se convertissent pas bien via le navigateur :

  • Pages derrière les murs de connexion: la méthode du navigateur fonctionne si vous êtes connecté et que vous consultez la page. Le convertisseur en ligne ne peut pas accéder au contenu derrière les murs d'authentification à moins que vous n'enregistriez d'abord le code HTML localement.
  • Pages qui chargent du contenu via JavaScript: certains sites chargent paresseusement des images ou des commentaires uniquement lorsque vous faites défiler. Faites défiler jusqu’au bout avant de sauvegarder pour tout déclencher.
  • Pages avec en-têtes/pieds de page collants: ceux-ci se répètent souvent sur chaque page imprimée, gaspillant beaucoup d'espace vertical. Le mode Lecteur résout ce problème.
  • Pages avec popups modaux: rejetez toutes les bannières de cookies ou les invites d'abonnement avant l'impression.

Pour l'échelle : conversion de fichiers HTML enregistrés

Si vous avez enregistré des pages sous forme de fichiers HTML (les navigateurs vous permettent souvent d'« Enregistrer la page sous » un fichier .html complet), vous pouvez les convertir par lots au format PDF ultérieurement. Chargez-les dans le Convertisseur HTML en PDF un à la fois, ou par lots sur Pro.

Il s'agit également du flux de travail d'archivage de la documentation que vous avez rédigée vous-même : brouillon en HTML ou Markdown, converti en PDF pour la copie d'archive.

Gestion des images

Les images en ligne conservent leur résolution d'origine tant qu'elles ont été chargées lors de la conversion. Deux problèmes courants :

  • Images chargées paresseusement: les sites modernes retardent souvent le chargement des images jusqu'à ce que vous y parveniez. Si vous n'avez pas fait défiler une image avant la conversion, elle n'a peut-être pas encore été chargée et le PDF affichera un espace réservé ou rien.
  • Images hébergées en externe: si l'article intègre des images d'un autre domaine qui sera ensuite mis hors ligne, les images seront 404 lors des vues futures. Si l'archivage est important, enregistrez les images localement et utilisez un convertisseur qui intègre les images en ligne.

Qu’en est-il des articles interactifs contenant beaucoup de JavaScript ?

Les graphiques interactifs, les vidéos intégrées et les visualisations basées sur JavaScript ne survivent pas à la conversion au format PDF : ils s'aplatissent jusqu'à leur état initial. Pour un graphique, c'est généralement bien (vous obtenez l'image statique de la vue initiale). Pour un outil ou une vidéo interactif, vous perdez complètement l’interactivité. Pensez à prendre des captures d’écran des états interactifs clés comme matériel supplémentaire.

Préservation structurelle

Ce qui survit proprement :

  • Texte de l'article.
  • Rubriques (H1, H2, H3) avec leur hiérarchie.
  • Images en ligne (à condition qu'elles soient chargées).
  • Listes à puces et numérotées.
  • Tableaux (généralement).
  • Liens hypertextes (devenus cliquables dans le PDF).
  • Formatage de base (gras, italique, blocs de code).

Ce qui change souvent :

  • Les mises en page à plusieurs colonnes se réduisent à une seule colonne.
  • Les barres latérales et les citations sont redistribuées en ligne.
  • Les polices personnalisées remplacent si le navigateur les affiche d'une manière différente de l'exportation PDF.

Organiser vos archives

Suggestions pratiques :

  • Nommer les fichiers avec date + source : 2026-07-03-nytimes-article-titre.pdf.
  • Stocker dans une structure de dossiers par sujet ou par année.
  • Sauvegardez jusqu'à deux emplacements (disque local + stockage cloud).
  • Envisagez un gestionnaire de références approprié (Zotero, Mendeley) si vous archivez des sources académiques : ils gèrent ensemble le stockage PDF, les citations et les métadonnées consultables.

Conclusion

Les URL sont éphémères, les PDF sont archivés. Utilisez le mode Lecteur et l'impression au format PDF du navigateur pour des enregistrements individuels rapides, ou le convertisseur en ligne pour les fichiers HTML enregistrés. Conservez l'URL et la date d'accès, faites attention au contenu chargé paresseux et sachez que les éléments interactifs s'aplatissent. Pour rappel, le PDF est le format qui sera encore là dans dix ans.

Convertissez HTML en PDF maintenant

Déposez un fichier HTML ou collez du HTML brut, récupérez un PDF propre. Le niveau gratuit gère les fichiers jusqu'à 10 Mo.

Ouvrez le convertisseur →
Parcourir tous les messages