FIG 1 - Rinominare l'estensione .docx in .zip |
Ogni archivio è costituito da 3 cartelle: _rels, docProps e word.
- _rels
Contenente i metadati relativi alle connessioni che intercorrono tra i file dell'archivio. - docProps
Cartella che contiene le proprietà del documento. - word
La cartella word ospita i contenuti veri e propri del documento comprese le immagini che sono memorizzate all'interno di una sottocartella generalmente chiamata media.
FIG 2 - Cartelle contenute all'interno del file docx |
FIG 3 - All'interno della cartella word è presente la cartella media che contiene le immagini del documento |
Dunque per estrarre le immagini da un file .docx basta modificare l'estensione in .zip e navigare nella struttura dell'archivio fino a trovare e salvare i file delle immagini. Tale trucco può essere utile anche per recuperare parte dei contenuti di un file .docx corrotto e non apribile tramite MS Word.
FIG 4 - Immagine contenuta all'interno del documento docx nella cartella word\media |