Comment extraire du texte à partir d'images à l'aide de la ligne de commande
Il est assez facile de lire une image et de tirer le texte vous-même. Mais extraire dynamiquement le texte à partir d'une photo est un peu plus difficile, et heureusement, imgclip offre une solution assez simple.
Ce outil de ligne de commande fonctionne dans le terminal pour Mac, Windows et Linux. Il faut simplement un argument pour le fichier image avec la langue, puis renvoie le texte copié dans votre presse-papiers.
Vous pouvez installer l’ensemble de la bibliothèque via npm et c’est un installation assez simple. La chose est quelques KB seulement et il est livré avec un fichier JS que vous pouvez parcourir sur GitHub.
Imgclip utilise le Tesseract.js bibliothèque pour automatiser le traitement des images et extraire le texte via OCR. C'est l'une des bibliothèques d'OCR les plus puissantes à ce jour, et elle est complètement open source, tout comme imgclip..
Je pense que je suis le plus impressionné par la qualité et la rapidité de cet outil. Ça marche vraiment pour tirer un texte précis et c'est l'un des outils les plus simples à utiliser.
La commande imgclip devrait être courir directement dans le terminal, suivi du chemin relatif à l'image. Vous pouvez aussi ajouter quatre options sur la fin pour personnaliser la sortie.
-h
,--Aidez-moi
: sortie des informations d'utilisation-V
,--version
: affiche le numéro de version-l
,--lang
: affiche la langue du texte dans l'image-p
,--impression
: imprime le texte dans l'image (au lieu de copier dans le presse-papier)
Au moment d'écrire ces lignes, Tesseract supporte 65 langues avec plus sur le chemin. Le code que vous ajoutez au --lang
la balise doit être le code utilisé dans les fichiers Tesseract.
Par exemple, -l eng
va rechercher l'image pour texte en anglais, tandis que -l jpn
va chercher Texte japonais et vous pouvez même courir -l jpn_vert
rechercher texte japonais orienté verticalement.
Étant donné que imgclip repose énormément sur Tesseract, vous disposez essentiellement du pouvoir de toute cette bibliothèque..
À Commencer, visitez la page GitHub et téléchargez une copie localement, ou installez-la dans un répertoire spécifique via npm. Ensuite, vous pouvez exécuter l'outil dans le terminal comme une application à analyser n'importe quelle image que vous voulez.
À voir imgclip en action, Découvrez cette brève vidéo créée sous forme de démo imgclip.