Page d'accueil » comment » Comment extraire des images, du texte et des fichiers incorporés à partir de documents Word, Excel et PowerPoint

    Comment extraire des images, du texte et des fichiers incorporés à partir de documents Word, Excel et PowerPoint

    Supposons que quelqu'un vous ait envoyé un document Word contenant beaucoup d'images et que vous souhaitiez que ces images soient sauvegardées sur votre disque dur. Vous pouvez extraire des images d'un document Microsoft Office avec une simple astuce.

    Si vous avez un fichier Word (.docx), Excel (.xlsx) ou PowerPoint (.pptx) avec des images ou d’autres fichiers incorporés, vous pouvez les extraire (ainsi que le texte du document), sans avoir à les enregistrer séparément. . Et surtout, vous n'avez pas besoin de logiciel supplémentaire. Les formats de fichier au format Office XML, docx, xlsx et pptx, sont en réalité des archives compressées que vous pouvez ouvrir comme tout fichier .zip normal avec Windows. À partir de là, vous pouvez extraire des images, du texte et d’autres fichiers incorporés. Vous pouvez utiliser le support .zip intégré de Windows ou une application telle que 7-Zip si vous préférez.

    Si vous avez besoin d'extraire des fichiers d'un ancien document bureautique, tel qu'un fichier .doc, .xls ou .ppt, vous pouvez le faire avec un petit logiciel gratuit. Nous détaillerons ce processus à la fin de ce guide.

    Comment extraire le contenu d'un fichier Office plus récent (.docx, .xlsx ou .pptx)

    Pour accéder au contenu interne d'un document Office basé sur XML, ouvrez l'Explorateur de fichiers (ou l'Explorateur Windows dans Windows 7), accédez au fichier à partir duquel vous souhaitez extraire le contenu, puis sélectionnez le fichier..

    Appuyez sur "F2" pour renommer le fichier et changer l'extension (.docx, .xlsx ou .pptx) en ".zip". Laissez la partie principale du nom de fichier seule. Appuyez sur "Entrée" lorsque vous avez terminé.

    La boîte de dialogue suivante s'affiche pour vous avertir de la modification de l'extension du nom de fichier. Cliquez sur “Oui”.

    Windows reconnaît automatiquement le fichier en tant que fichier compressé. Pour extraire le contenu du fichier, cliquez avec le bouton droit de la souris sur le fichier et sélectionnez «Extraire tout» dans le menu contextuel..

    Dans la boîte de dialogue "Sélectionner une destination et extraire des fichiers", le chemin où le contenu du fichier .zip sera extrait s'affiche dans la zone d'édition "Les fichiers seront extraits dans ce dossier". Par défaut, un dossier portant le même nom que le nom du fichier (sans l'extension de fichier) est créé dans le même dossier que le fichier .zip. Pour extraire les fichiers dans un autre dossier, cliquez sur «Parcourir»..

    Accédez à l'emplacement où vous souhaitez extraire le contenu du fichier .zip, en cliquant sur «Nouveau dossier» pour créer un nouveau dossier, si nécessaire. Cliquez sur "Sélectionner un dossier".

    Pour ouvrir une fenêtre de l'Explorateur de fichiers (ou de l'Explorateur Windows) avec le dossier contenant les fichiers extraits, une fois qu'ils ont été extraits, cochez la case «Afficher les fichiers extraits une fois terminés» afin de cocher la case correspondante. Cliquez sur "Extraire".

    Comment accéder aux images extraites

    Le contenu extrait contient un dossier nommé «mot», si votre fichier d'origine est un document Word (ou «xl» pour un document Excel ou «ppt» pour un document PowerPoint). Double-cliquez sur le dossier «word» pour l'ouvrir..

    Double-cliquez sur le dossier "media".

    Toutes les images du fichier original se trouvent dans le dossier «média». Les fichiers extraits sont les images originales utilisées par le document. À l'intérieur du document, il peut y avoir un redimensionnement ou d'autres propriétés définies, mais les fichiers extraits sont les images brutes sans que ces propriétés ne soient appliquées..

    Comment accéder au texte extrait

    Si Office n'est pas installé sur votre PC et que vous devez extraire du texte d'un fichier Word (ou Excel ou PowerPoint), vous pouvez accéder au texte extrait dans le fichier “document.xml” du dossier “word”..

    Vous pouvez ouvrir ce fichier dans un éditeur de texte, tel que Bloc-notes ou WordPad, mais il est plus facile à lire dans un éditeur XML spécial, tel que le programme gratuit XML Bloc-notes. Tout le texte du fichier est disponible en morceaux de texte brut, quel que soit le style et / ou la mise en forme appliqués dans le document lui-même. Bien sûr, si vous allez télécharger un logiciel gratuit pour afficher ce texte, vous pouvez également télécharger LibreOffice, qui peut lire des documents Microsoft Office..

    Comment extraire des objets OLE incorporés ou des fichiers attachés

    Pour accéder aux fichiers incorporés dans un document Word lorsque vous n'avez pas accès à Word, ouvrez d'abord le fichier Word dans WordPad (qui est intégré à Windows). Vous remarquerez peut-être que certaines icônes de fichiers incorporés ne s'affichent pas, mais elles sont toujours présentes. Certains des fichiers incorporés peuvent avoir des noms de fichiers partiels. WordPad ne prend pas en charge toutes les fonctionnalités de Word. Il est donc possible que certains contenus ne soient pas affichés correctement. Mais vous devriez pouvoir accéder aux fichiers.

    Si nous faisons un clic droit sur l'un des fichiers incorporés dans notre exemple de fichier Word, l'une des options est «Ouvrir un objet PDF». Cela ouvre le fichier PDF dans le programme de lecteur de PDF par défaut sur votre PC. À partir de là, vous pouvez enregistrer le fichier PDF sur votre disque dur..

    Si WordPad n'a pas d'option pour ouvrir votre fichier, notez ici le type de fichier. Par exemple, notre deuxième fichier dans ce document est un fichier .mp3.

    Retournez ensuite dans votre dossier «Fichiers de [Document]» et double-cliquez sur le dossier «Embeddings» dans le dossier «Word»..

    Malheureusement, les types de fichiers ne sont pas conservés dans les noms de fichiers. Ils ont tous une extension de fichier «.bin» à la place. Si vous savez quels types de fichiers sont incorporés dans le fichier, vous pouvez probablement en déduire quel fichier correspond à la taille du fichier. Dans notre exemple, nous avons incorporé un fichier PDF et un fichier MP3 dans notre document. Étant donné que le fichier MP3 est probablement plus volumineux que le fichier PDF, nous pouvons déterminer quel fichier correspond à tel ou tel fichier en consultant la taille du fichier, puis en le renommant à l'aide des extensions appropriées. Ci-dessous, nous renommons le fichier MP3..

    Notez que tous les fichiers ne s'ouvrent pas nécessairement avec ce processus. Par exemple, notre fichier PDF s'est ouvert correctement à partir de WordPad, mais nous ne pouvions pas l'ouvrir en renommant son fichier .bin..

    Une fois que vous avez extrait le contenu du fichier compressé, vous pouvez rétablir l’extension du fichier d’origine en .docx, .xlsx ou .pptx. Le fichier reste intact et peut être ouvert normalement dans le programme correspondant.

    Comment extraire des images d'anciens documents Office (.doc, .xls ou .ppt)

    Si vous devez extraire des images d'un document Office 2003 (ou antérieur), un outil gratuit, appelé Assistant Extraction d'images Office, facilite cette tâche. Ce programme vous permet également d'extraire des images de plusieurs documents (de types identiques ou différents) à la fois. Téléchargez le programme et installez-le (une version portable est également disponible si vous préférez ne pas l'installer).

    Exécutez le programme et l'écran de bienvenue s'affiche. Cliquez sur Suivant".

    Tout d'abord, nous devons sélectionner le fichier à partir duquel vous souhaitez extraire les images. Sur l'écran Input & Output, cliquez sur le bouton «Browse» (icône de dossier) à droite de la zone d'édition du document..

    Accédez au dossier contenant le document souhaité, sélectionnez-le et cliquez sur «Ouvrir»..

    Le dossier contenant le fichier sélectionné devient automatiquement le dossier de sortie. Pour créer un sous-dossier dans ce dossier portant le même nom que le fichier sélectionné, cochez la case «Créer un dossier ici» afin de cocher la case correspondante. Ensuite, cliquez sur "Suivant".

    Sur l'écran Prêt à démarrer, cliquez sur «Démarrer» pour commencer à extraire les images..

    L’écran suivant s’affiche pendant le processus d’extraction.

    Sur l’écran Terminé, cliquez sur “Cliquez ici pour ouvrir le dossier de destination” pour afficher les fichiers d’image obtenus..

    Comme nous avons choisi de créer un sous-dossier, nous obtenons un dossier contenant les fichiers image extraits du fichier..

    Vous verrez toutes les images sous forme de fichiers numérotés.

    Vous pouvez également extraire des images de plusieurs fichiers à la fois. Pour ce faire, sur l’écran Input & Output, cochez la case «Batch Mode» pour cocher la case..

    L'écran Entrée et sortie par lots s'affiche. Cliquez sur "Ajouter des fichiers".

    Dans la boîte de dialogue Ouvrir, accédez au dossier contenant l'un des fichiers à partir duquel vous souhaitez extraire des images, sélectionnez les fichiers à l'aide de la touche "Maj" ou "Ctrl" pour sélectionner plusieurs fichiers, puis cliquez sur "Ouvrir"..

    Vous pouvez ajouter des fichiers d'un autre dossier en cliquant à nouveau sur «Ajouter des fichiers», en naviguant jusqu'au dossier de la boîte de dialogue Ouvrir, en sélectionnant les fichiers souhaités, puis en cliquant sur «Ouvrir»..

    Une fois que vous avez ajouté tous les fichiers à partir desquels vous souhaitez extraire des images, vous pouvez choisir de créer un dossier séparé pour chaque document du même dossier que chaque document dans lequel les fichiers d’image seront sauvegardés en cliquant sur le lien «Créer un dossier». chaque document ”pour qu'il y ait une coche dans la case.

    Vous pouvez également spécifier le dossier de sortie comme étant «identique à celui de chaque fichier d'entrée» ou entrer ou sélectionner un dossier personnalisé à l'aide de la zone d'édition et du bouton «Parcourir» situé sous cette option. Cliquez sur «Suivant» une fois que vous avez sélectionné les options souhaitées..

    Cliquez sur "Démarrer" sur l'écran Prêt à démarrer.

    L’écran suivant affiche la progression de l’extraction.

    Le nombre d'images extraites s'affiche sur l'écran Terminé. Cliquez sur "Fermer" pour fermer l'assistant d'extraction d'images Office..

    Si vous avez choisi de créer un dossier distinct pour chaque document, vous verrez les dossiers portant le même nom que les fichiers contenant les images, quel que soit le ou les dossiers de sortie spécifiés..

    Encore une fois, nous obtenons toutes les images sous forme de fichiers numérotés pour chaque document.

    Vous pouvez maintenant renommer les images, les déplacer et les utiliser dans vos propres documents. Assurez-vous simplement que vous avez le droit de les utiliser légalement.