/ / / Cómo extraer imágenes, texto y archivos incrustados de documentos de Word, Excel y PowerPoint

Cómo extraer imágenes, texto y archivos incrustados de documentos de Word, Excel y PowerPoint

00_lead_image_extract_images_from_word_file

Supongamos que alguien le envió un documento de Word con muchas imágenes y desea que guarde esas imágenes en su disco duro. Puede extraer imágenes de un documento de Microsoft Office con un simple truco.

Si tiene una palabra (.docx), Excel (.xlsx), o archivo de PowerPoint (.pptx) con imágenes u otros archivos incrustados, puede extraerlos (así como el texto del documento), sin tener que guardar cada uno por separado. Y lo mejor de todo, no necesita ningún software adicional. Los formatos de archivo basados ​​en XML de Office (docx, xlsx y pptx) son en realidad archivos comprimidos que puede abrir como cualquier archivo .zip normal con Windows. Desde allí, puede extraer imágenes, texto y otros archivos incrustados. Puede usar la compatibilidad con .zip incorporada de Windows o una aplicación como 7-Zip si lo prefiere.

Si necesita extraer archivos de un documento de Office anterior, como un archivo .doc, .xls o .ppt, puede hacerlo con un pequeño software gratuito. Detallaremos ese proceso al final de esta guía.

Cómo extraer el contenido de un archivo de Office más reciente (.docx, .xlsx o .pptx)

Para acceder a los contenidos internos de un XML basadoDocumento de Office, abra el Explorador de archivos (o el Explorador de Windows en Windows 7), navegue hasta el archivo del que desea extraer el contenido y seleccione el archivo.

01_pressing_f2_to_rename_file

Presione "F2" para cambiar el nombre del archivo y cambiar la extensión (.docx, .xlsx o .pptx) a ".zip". Deje la parte principal del nombre del archivo solo. Presione "Enter" cuando haya terminado.

02_changing_extension_to_zip

El siguiente cuadro de diálogo muestra una advertencia sobre el cambio de la extensión del nombre del archivo. Haga clic en "Sí".

02a_rename_confirmation

Windows reconoce automáticamente el archivo como un archivo comprimido. Para extraer el contenido del archivo, haga clic derecho en el archivo y seleccione "Extraer todo" en el menú emergente.

03_seleccionando_extracto_todos

En "Seleccionar un destino y extraer archivos"cuadro de diálogo, la ruta donde se extraerá el contenido del archivo .zip se muestra en el cuadro de edición "Los archivos se extraerán a esta carpeta". De manera predeterminada, se crea una carpeta con el mismo nombre que el archivo (sin la extensión del archivo) en la misma carpeta que el archivo .zip. Para extraer los archivos a una carpeta diferente, haga clic en "Examinar".

04_clicking_browse

Navegue hasta donde desea extraer el contenido del archivo .zip, haga clic en "Nueva carpeta" para crear una nueva carpeta, si es necesario. Haga clic en "Seleccionar carpeta".

05_creating_new_folder_and_selecting_it

Para abrir un Explorador de archivos (o el Explorador de Windows)ventana con la carpeta que contiene los archivos extraídos que se muestran una vez que se extraen, seleccione la casilla de verificación "Mostrar archivos extraídos cuando se complete" para que haya una marca de verificación en el cuadro. Haga clic en "Extraer".

06_clicking_extract

Cómo acceder a las imágenes extraídas

Incluido en el contenido extraído hay una carpetallamado "palabra", si su archivo original es un documento de Word (o "xl" para un documento de Excel o "ppt" para un documento de PowerPoint). Haga doble clic en la carpeta "word" para abrirla.

07_opening_word_folder

Haga doble clic en la carpeta "medios".

08_opening_media_folder

Todas las imágenes del archivo original están en elCarpeta "media". Los archivos extraídos son las imágenes originales utilizadas por el documento. Dentro del documento, puede haber un cambio de tamaño u otras propiedades establecidas, pero los archivos extraídos son las imágenes sin procesar sin estas propiedades aplicadas.

09_images_from_file

Cómo acceder al texto extraído

Si no tiene Office instalado en su PC,y necesita extraer texto de un archivo de Word (o Excel o PowerPoint), puede acceder al texto extraído en el archivo "document.xml" en la carpeta "word".

10_document_xml_file

Puede abrir este archivo en un editor de texto, comoNotepad o WordPad, pero es más fácil de leer en un editor XML especial, como el programa gratuito, XML Notepad. Todo el texto del archivo está disponible en fragmentos de texto sin formato, independientemente del estilo y / o formato aplicado en el documento mismo. Por supuesto, si va a descargar software gratuito para ver este texto, también puede descargar LibreOffice, que puede leer documentos de Microsoft Office.

11_document_xml_file_open_in_xml_notepad

Cómo extraer objetos OLE incrustados o archivos adjuntos

Para acceder a archivos incrustados en un documento de Word cuandono tiene acceso a Word, primero abra el archivo de Word en WordPad (que viene integrado en Windows). Puede notar que algunos de los íconos de archivos incrustados no se muestran, pero aún están allí. Algunos de los archivos incrustados pueden tener nombres de archivo parciales. WordPad no es compatible con todas las funciones de Word, por lo que algunos contenidos pueden mostrarse de forma incorrecta. Pero debería poder acceder a los archivos.

Si hacemos clic derecho en uno de los archivos incrustados ennuestro archivo de Word de muestra, una de las opciones es "Abrir objeto PDF". Esto abre el archivo PDF en el programa lector de PDF predeterminado en su PC. Desde allí, puede guardar el archivo PDF en su disco duro.

11a_opening_pdf_file

Si WordPad no tiene una opción para abrir su archivo, tome nota de su tipo de archivo aquí. Por ejemplo, nuestro segundo archivo en este documento es un archivo .mp3.

Luego, regrese a la carpeta "Archivos de [Documento]" y haga doble clic en la carpeta "incrustaciones" dentro de la carpeta "palabra".

12_embeddings_folder

Desafortunadamente, los tipos de archivo no se conservanen los nombres de archivo. Todos tienen una extensión de archivo ".bin" en su lugar. Si sabe qué tipos de archivos están incrustados en el archivo, probablemente pueda deducir qué archivo es cuál por el tamaño del archivo. En nuestro ejemplo, teníamos un archivo PDF y un archivo MP3 incrustado en nuestro documento. Debido a que el archivo MP3 es probablemente más grande que el archivo PDF, podemos determinar qué archivo es cuál al observar el tamaño de los archivos y luego cambiarles el nombre con las extensiones correctas. A continuación, vamos a cambiar el nombre del archivo MP3.

13_archivos_embebidos_extraídos

Tenga en cuenta que no todos los archivos se abrirán necesariamente mediante este proceso; por ejemplo, nuestro archivo PDF se abrió correctamente desde WordPad, pero no pudimos abrirlo cambiando el nombre de su archivo .bin.

Una vez que haya extraído el contenido de la cremalleraarchivo, puede revertir la extensión del archivo original a .docx, .xlsx o .pptx. El archivo permanecerá intacto y se puede abrir normalmente en el programa correspondiente.

Cómo extraer imágenes de documentos de Office anteriores (.doc, .xls o .ppt)

Si necesita extraer imágenes de Office 2003(o anterior), hay una herramienta gratuita llamada Asistente de extracción de imágenes de Office que facilita esta tarea. Este programa también le permite extraer imágenes de múltiples documentos (del mismo tipo o de diferentes tipos) a la vez. Descargue el programa e instálelo (también hay una versión portátil disponible si prefiere no instalarlo).

Ejecute el programa y aparecerá la pantalla de bienvenida. Haga clic en Siguiente".

14_bienvenida_pantalla

Primero, debemos seleccionar el archivo del que desea extraer las imágenes. En la pantalla de Entrada y Salida, haga clic en el botón "Examinar" (icono de carpeta) a la derecha del cuadro de edición de Documento.

15_clicking_browse_for_document

Navegue a la carpeta que contiene el documento que desea, selecciónelo y haga clic en "Abrir".

16_apertura_archivo_palabras

La carpeta que contiene el archivo seleccionado.se convierte automáticamente en la carpeta de salida. Para crear una subcarpeta dentro de esa carpeta con el mismo nombre que el archivo seleccionado, haga clic en la casilla de verificación "Crear una carpeta aquí" para que haya una marca de verificación en la casilla. Luego, haga clic en "Siguiente".

17_clicking_siguiente

En la pantalla Listo para comenzar, haga clic en "Inicio" para comenzar a extraer las imágenes.

18_ready_to_start

La siguiente pantalla aparece mientras se procesa la extracción.

19_processing_please_wait

En la pantalla Finalizado, haga clic en "Haga clic aquí para abrir la carpeta de destino" para ver los archivos de imagen resultantes.

20_ carpeta de destino_apertura

Debido a que elegimos crear una subcarpeta, obtenemos una carpeta que contiene los archivos de imagen extraídos del archivo.

21_apertura_subcarpeta

Verá todas las imágenes como archivos numerados.

22_images_from_older_word_file

También puede extraer imágenes de múltiples archivos a la vez. Para hacer esto, en la pantalla Entrada y Salida, haga clic en la casilla de verificación "Modo de lote" para que haya una marca de verificación en la casilla.

23_clicking_batch_mode

Aparece la pantalla Batch Input & Output. Haga clic en "Agregar archivos".

24_clicking_add_files

En el cuadro de diálogo Abrir, navegue a la carpetaque contiene cualquiera de los archivos de los que desea extraer imágenes, seleccione los archivos con la tecla "Mayús" o "Ctrl" para seleccionar varios archivos y haga clic en "Abrir".

Puede agregar archivos desde otra carpeta haciendo clic en "Agregar archivos" nuevamente, navegando a la carpeta en el cuadro de diálogo Abrir, seleccionando los archivos deseados y haciendo clic en "Abrir".

25_apertura_archivos

Una vez que haya agregado todos los archivos de los quedesea extraer imágenes, puede optar por crear una carpeta separada para cada documento dentro de la misma carpeta que cada documento en el que se guardarán los archivos de imagen haciendo clic en la casilla de verificación "Crear una carpeta para cada documento" para que haya una marca de verificación en el cuadro.

26_clicking_next_on_batch_mode

También puede especificar la carpeta de salida para que sea"Igual que la carpeta de entrada de cada archivo" o ingrese o seleccione una carpeta personalizada utilizando el cuadro de edición y el botón "Examinar" debajo de esa opción. Haga clic en "Siguiente" una vez que haya seleccionado las opciones que desea.

26a_specifying_output_folder

Haga clic en "Inicio" en la pantalla Listo para comenzar.

27_ready_to_start_for_batch_mode

La siguiente pantalla muestra el progreso de extracción.

28_procesamiento_pantalla

La cantidad de imágenes extraídas se muestra en la pantalla Finalizada. Haga clic en "Cerrar" para cerrar el Asistente de extracción de imágenes de Office.

29_mago_cierre

Si elige crear una carpeta separada para cada documento, verá carpetas con los mismos nombres que los archivos que contienen las imágenes, cualesquiera carpetas de salida que haya especificado.

30_folders_containing_images

Nuevamente, obtenemos todas las imágenes como archivos numerados para cada documento.

31_imágenes_desde_un_archivo

Ahora puede cambiar el nombre de las imágenes, moverlas y usarlas en sus propios documentos. Solo asegúrese de tener los derechos para usarlos legalmente.