Autres langues
Autres actions
← Retour Comment scanner et numériser des livres : un tutoriel
de Source ouverte
Publié le : 2023-05-23 (mis à jour : 2025-11-15)
10-20 minutes
Numériser des livres est quelque chose que très peu d'entre nous ont jamais eu à faire, pourtant ce n'est pas particulièrement compliqué.
Dans ce guide, nous aborderons différentes méthodes pour scanner et numériser vos propres livres, adaptées à tous les budgets et niveaux techniques.
Lire plus
| ProleWiki possède une bibliothèque, camarade ! Si vous numérisez votre livre et qu'il appartient à nos catégories (œuvres socialistes), nous serions ravis de l'avoir ! |
Numériser des livres est quelque chose que très peu d'entre nous ont jamais eu à faire, pourtant ce n'est pas particulièrement compliqué.
Dans ce guide, nous aborderons différentes méthodes pour scanner et numériser vos propres livres, adaptées à tous les budgets et niveaux techniques.
Quelques considérations techniques[modifier | modifier le wikicode]

Scanner un livre n'est pas intrinsèquement super difficile malgré le format volumineux, mais il y a certaines choses à prendre en considération.
Sémantiquement, scanner fait référence au processus de prise de photos numériques de votre livre. C'est littéralement une photo avec tous les artefacts visibles, comme vous pouvez le voir à droite.
La numérisation est l'étape supplémentaire qui suit et fait référence au processus de conversion de votre livre en un format numérique natif. Cela signifie généralement un PDF avec du texte exploitable (dans lequel vous pouvez effectuer des recherches), des pages blanches, etc.
Caractéristiques du scanner[modifier | modifier le wikicode]
Votre scanner doit avoir une résolution d'au moins 300 ppp (points par pouce) pour garantir de bons résultats, en particulier pour assurer une bonne RCO (reconnaissance optique de caractères, que nous verrons à la fin de ce guide). Tous les scanners modernes atteignent cette résolution sans problème et la dépassent parfois, cela n'a d'importance que si vous possédez un scanner plus ancien.
En plus des ppp, vous devez connaître le nombre de mégapixels de votre scanner. La plupart des scanners dédiés aux livres commencent à 13 mégapixels (13 millions de pixels) et sont également capables d'effectuer la RCO de votre livre à cette taille.
Ces deux paramètres déterminent la qualité finale de votre scan et vous permettent également de scanner des livres plus grands. Cela se comprend : si le livre est plus grand, vous devez éloigner davantage l'appareil photo pour prendre une photo complète, et vous avez donc besoin de plus de pixels pour obtenir une bonne image.
Faut-il scanner avec son téléphone ?[modifier | modifier le wikicode]
La plupart des smartphones proposent aujourd'hui un mode de numérisation de documents (ou des applications dédiées). Il existe également des supports bon marché que vous pouvez acheter (ou fabriquer vous-même) pour poser votre téléphone sur une surface transparente surélevée, avec le livre en dessous.
Cependant, la résolution de l'appareil photo de votre téléphone est probablement insuffisante pour prendre de bonnes photos d'un livre. Vous pouvez essayer vous-même avec un téléphone que vous possédez, mais aucun téléphone sur le marché ne peut prendre des photos de haute qualité, surtout pas de documents avec beaucoup de petits détails (la police de caractères). Ces scanners de documents sont surtout utiles lorsque vous devez envoyer une photo à quelqu'un, mais pas pour numériser vos livres.
Quel scanner et quelle méthode choisir[modifier | modifier le wikicode]

La méthode maison : le processus destructif[modifier | modifier le wikicode]
La manière la plus simple de scanner un livre repose sur un équipement que vous avez probablement déjà chez vous : un scanner à plat. Le vôtre est probablement intégré à votre imprimante domestique. Sinon, ils peuvent être assez bon marché à acquérir et sont si courants que vous pourrez probablement en emprunter ou en louer un gratuitement (demandez dans les bibliothèques publiques !).
Cependant, pour obtenir les meilleurs résultats, vous devrez détruire votre livre. Bien que les avis divergent, cela reste acceptable pour les livres encore imprimés, car ils sont facilement remplaçables. Si vos livres sont plus anciens ou même des antiquités, en revanche, ce serait dommage de les détruire alors qu'il existe des processus non destructifs.
Dans ce processus, vous allez simplement désassembler le livre, puis scanner toutes les pages une par une et les reconstituer dans un PDF. Comme le scanner est plat, vous avez besoin d'un document plat à y insérer.
Notez que nous ne qualifions pas le processus destructif de facile ou rapide, car vous devez d'abord désassembler le livre, puis le reconstituer dans le scanner (c'est-à-dire scanner les pages dans le bon ordre) ! C'est une solution facile à condition d'avoir déjà l'équipement chez vous, mais il existe définitivement de meilleures méthodes.
Vous pourriez certainement essayer de scanner votre livre relié une page à la fois en maintenant une moitié du livre hors du scanner, mais vous obtiendrez probablement des résultats médiocres avec beaucoup d'artefacts et des caractères flous près de la marge intérieure.
De même, vous ne pouvez pas vraiment numériser deux pages à la fois avec ce type de scanner (en posant le livre à plat sur toute la surface optique), car cela créera des ombres et un flou. Cela peut également endommager le livre ; ils ne sont pas conçus pour supporter une pression sur la reliure.
Comment démonter un livre[modifier | modifier le wikicode]
Si vous souhaitez numériser votre livre de cette manière en le détruisant, vous devez savoir quel type de reliure il possède et la défaire. Je vais simplement lier le tutoriel de Wikihow sur la façon de démonter un livre, car ils l'expliquent bien mieux que je ne pourrais le faire.
Utiliser un scanner de livres grand public[modifier | modifier le wikicode]

Heureusement, il existe aujourd'hui des scanners de livres dédiés et abordables. Les modèles varient généralement entre 100 et 200 dollars États-uniens : ce n'est pas exactement "bon marché", mais cela reste accessible si vous prévoyez de numériser plusieurs livres. Ils peuvent également servir de scanner quotidien classique, ce qui est un point à considérer.
Comme avec un scanner à plat, si vous ne souhaitez pas en acheter un, cherchez autour de vous, dans les bibliothèques, pour en louer ou emprunter un ! Votre université ou lieu de travail en possède peut-être même un.
Le scanner que je recommande est le CZUR Shine Ultra, à partir de 13 mégapixels. Il peut numériser jusqu'au format A3 (essentiellement deux pages de taille lettre) et possède tous les avantages listés ci-dessous, sauf que les lumières LED sont inutiles car elles brillent trop fort sur le livre, ce qui crée un reflet.
Avantages[modifier | modifier le wikicode]
Ces scanners permettent de numériser vos livres rapidement et efficacement, sans les détruire.
La plupart d'entre eux sont également capables de faire de la reconnaissance optique de caractères (OCR) en un clic, avec généralement de bons résultats.
Ils sont définitivement plus rapides qu'un scanner à plat, certains modèles pouvant numériser une page par seconde. La plupart disposent également d'une fonction "numérisation automatique", où le logiciel détecte lorsque vous tournez la page et prend automatiquement une photo.
Pour vous aider à maintenir le livre en place, ces scanners ont généralement une option dans les paramètres du logiciel pour supprimer numériquement vos doigts de l'image. Ensuite, vous pouvez prendre une photo avec la pédale fournie.
Une fois que vous avez terminé d'utiliser le scanner, vous pouvez le plier en deux pour qu'il prenne très peu de place.
Soyons honnêtes, numériser un livre est un travail fastidieux et répétitif. Avoir un appareil comme celui-ci pour accélérer le processus est définitivement utile : mathématiquement, si votre livre fait 300 pages et que vous numérisez 2 pages à la fois, vous aurez terminé en environ 150 à 300 secondes, soit environ 5 minutes. Cela, si vous n'avez pas à refaire des pages et que vous travaillez très efficacement. Dans tous les cas, ils sont beaucoup plus rapides que les scanners à plat qui, hors temps de préparation, peuvent prendre 10 secondes pour numériser une seule page.
Inconvénients[modifier | modifier le wikicode]
Cependant, comme ces scanners sont effectivement des caméras montées avec beaucoup de traitement logiciel, vous devez prendre en compte la taille maximale des livres qu'ils peuvent numériser, ainsi que l'éclairage approprié. Les scanners à plat créent leur propre éclairage, donc ce n'est pas un problème pour eux, et la plupart de ces scanners suspendus ont également des lumières LED, mais certaines ont une position d'éclairage terrible qui les rend inutiles, et nécessiteront une source externe pour éclairer correctement le livre (idéalement, toute la page doit être éclairée de manière uniforme).
Ces scanners ne fonctionnent pas sur tous les systèmes d'exploitation ! Vérifiez la compatibilité avant d'en acheter un.
Ils représentent également un investissement, bien sûr, surtout si vous ne prévoyez de les utiliser qu'une ou deux fois. Cependant, la plupart des partis communistes possèdent de nombreux livres et documents dans leur propre bibliothèque, et pourraient être intéressés par l'achat d'un tel scanner ! Proposez l'idée à votre parti, camarade.
Scanners portatifs[modifier | modifier le wikicode]

Les scanners portatifs sont également une solution, bien qu'ils soient aussi chers que les scanners de livres mentionnés ci-dessus, avec plus d'inconvénients.
Avantages[modifier | modifier le wikicode]
Ces scanners sont absolument portables, et vous pouvez les emmener partout avec vous (par exemple, pour numériser des livres à la bibliothèque sans les emprunter).
Ils ont également une bonne résolution, car ils sont conçus pour numériser des livres, évidemment.
Pour autant que je sache, ils fournissent leur propre éclairage et garantissent une numérisation correcte à chaque fois.
Ils enregistrent également vos pages sur une carte mémoire (normalement une carte microSD), ce qui peut être un avantage ou un inconvénient. L'avantage est que vous n'avez pas besoin de le connecter à un PC et qu'il fonctionnera sur tous les systèmes d'exploitation.
Inconvénients[modifier | modifier le wikicode]
Cependant, ces scanners présentent de nombreux inconvénients. Ils fonctionnent sur batterie et s'éteindront avant que vous n'ayez terminé un livre entier : généralement après 100 pages.
Apprendre à "faire glisser" le scanner sur la page (il est monté sur de petites roues) demande un certain temps d'adaptation, mais ce n'est rien de trop difficile.
La taille de votre livre est également limitée par la longueur du scanner, bien qu'ils devraient pouvoir numériser tous les livres existants, car il est rare que les livres dépassent le format A4, et la plupart sont généralement de taille poche (proche du A5).
Enfin, j'imagine qu'ils doivent avoir des difficultés à numériser correctement le milieu d'un livre, lorsque la marge intérieure est la plus profonde et qu'il est difficile d'aplatir complètement les pages.
Je ne recommanderais ce scanner que si vous en trouvez d'autres utilisations dans votre vie quotidienne, comme numériser rapidement des documents au travail ou à l'école. Sinon, je vous conseillerais plutôt le scanner de livres mentionné un peu plus tôt.
Scanners professionnels de livres[modifier | modifier le wikicode]

Dans tous les scanners que nous avons vus jusqu'à présent, il y a un problème évident : il faut maintenir les pages d'une manière ou d'une autre, ce qui n'est tout simplement pas la façon dont les livres fonctionnent (surtout lorsqu'ils ont plus de pages, car la reliure devient plus épaisse).
Les scanners professionnels de livres ont une solution simple : on pose le livre sur une surface en forme de V, ce qui est meilleur pour la reliure et l'alignement.
Cependant, ces scanners ne sont pas destinés à un usage domestique : celui de droite coûte 15 000 USD.
Il existe des services, peut-être même près de chez vous, qui peuvent numériser vos livres pour vous. Cela vaut la peine de les explorer avant d'effectuer un achat, car le prix pourrait être moins élevé que d'acheter un scanner entier juste pour cela.
Cette méthode, au fait, est celle utilisée par l'Internet Archive pour numériser leurs livres.
Numériser votre livre[modifier | modifier le wikicode]
Dans tous les cas, une fois que vous avez sélectionné votre méthode pour numériser votre livre, vous devez passer à la numérisation proprement dite.
Nous allons finalement aussi numériser le livre, donc le meilleur format final est le PDF.
Les scanners de livres avec OCR intégré vous guideront à travers tout cela via leur logiciel. Si vous utilisez un scanner à plat, il peut avoir des capacités PDF, ou il peut créer des images individuelles.
La plupart des logiciels de scanners vous permettront de voir votre image après la numérisation et vous demanderont si vous souhaitez en prendre d'autres, donc vous ne devriez pas rencontrer de problèmes. Si une page semble mal numérisée (trop sombre, trop floue), reprenez-la simplement et supprimez la numérisation erronée au fur et à mesure.
Puisque nous parlons de numériser des centaines de pages, vous devriez absolument être méthodique lors de la numérisation afin de ne pas oublier d'erreurs dans votre lot.
Créer un PDF si nécessaire[modifier | modifier le wikicode]
Si votre scanner crée des images individuelles, mieux vaut espérer qu'il les nomme dans l'ordre (par ex. NUMÉRISATION_000001, NUMÉRISATION_000002, NUMÉRISATION_000003) et qu'il n'essaie pas de dupliquer un nom (NUMÉRISATION_0000001 (1)), car cela facilitera la fusion en un seul PDF.
Pour créer un PDF si votre scanner produit des images individuelles, vous pouvez les télécharger sur ilovepdf (un favori des étudiants du monde entier), bien que je ne sois pas sûr du nombre de JPEG qu'ils peuvent traiter en une fois.
Sinon, vous pouvez télécharger un logiciel. Je connais Xodo PDF Reader and Editor sur Windows (via le Microsoft Store), bien qu'il soit un peu encombrant pour créer des PDF.
Une fois que votre livre est converti en un seul PDF, vous devriez absolument parcourir le fichier pour repérer toute erreur (doublons, pages mal orientées, pages illisibles qui n'ont pas été correctement numérisées, etc.).
Ensuite, nous pourrons passer à l'OCR de votre livre et le numériser correctement.
Comment utiliser la reconnaissance optique de caractères (OCR)[modifier | modifier le wikicode]
L'OCR n'est en aucun cas une nouveauté dans le domaine technologique, mais ce n'est que récemment qu'elle est devenue un outil viable pour numériser des livres.
L'OCR transforme essentiellement une image de texte en texte réel que vous pouvez sélectionner, copier, coller, rechercher, etc.
Si vous utilisez un scanner de livres, il pourra probablement le faire pour vous. Il pourra également conserver la mise en forme intacte (comme la position des numéros de page, les marges, etc.) et peut même transformer votre livre en un document Word. Sinon, il existe plusieurs outils gratuits en ligne, avec des résultats variables.
OnlineOCR.net donne de bons résultats et est capable d'exporter le résultat au format Word (que vous pouvez ensuite ouvrir avec, par exemple, LibreOffice et exporter à nouveau en PDF).
Il est important de noter qu'aucune solution OCR n'est parfaite à 100 %. Plus votre matériel source est contrasté (par ex. noir sur blanc), meilleurs sont les résultats. Mais parfois, le logiciel peut substituer un mauvais caractère s'il ne comprend pas ce qu'il voit.
Il est possible de parcourir le livre et de le corriger, bien sûr, mais pour la plupart des cas d'usage, les erreurs d'OCR sont laissées telles quelles, car elles atteignent tout de même un taux de précision de 99,9 %.
Partager votre livre numérisé (sur Prolewiki ?)[modifier | modifier le wikicode]
Une fois que votre livre est correctement numérisé, pourquoi ne pas le télécharger dans notre bibliothèque ? Nous visons à héberger autant de documents marxistes, socialistes, apparentés au socialisme et historiques que possible ! Pour partager correctement votre livre sur ProleWiki, vous devrez (pour l'instant) demander un compte. Gardez votre document OCR .docx (Word) à portée de main. Une fois votre compte approuvé, vous pourrez créer une page pour le livre que vous avez numérisé et simplement copier tout le contenu de votre document Word (Ctrl+A) et coller sur la page du livre, et ça marche tout seul !
