/ / Hur man extraherar bilder, text och inbäddade filer från Word-, Excel- och PowerPoint-dokument

Hur man extraherar bilder, text och inbäddade filer från Word-, Excel- och PowerPoint-dokument

00_lead_image_extract_images_from_word_file

Säg att någon skickade ett Word-dokument med många bilder, och du vill att du ska spara bilderna på din hårddisk. Du kan extrahera bilder från ett Microsoft Office-dokument med ett enkelt trick.

Om du har ett Word (.docx), Excel (.xlsx) eller PowerPoint (.pptx) -fil med bilder eller andra filer inbäddade, du kan extrahera dem (liksom dokumentets text) utan att behöva spara var och en separat. Och bäst av allt, du behöver ingen extra programvara. De Office XML-baserade filformaten – docx, xlsx och pptx – är faktiskt komprimerade arkiv som du kan öppna som alla vanliga .zip-filer med Windows. Därifrån kan du extrahera bilder, text och andra inbäddade filer. Du kan använda Windows inbyggda .zip-support, eller en app som 7-Zip om du föredrar.

Om du behöver extrahera filer från ett äldre kontordokument - som en .doc, .xls eller .ppt-fil - kan du göra det med en liten bit gratis programvara. Vi kommer att beskriva den processen i slutet av den här guiden.

Hur man extraherar innehållet i en nyare Office-fil (.docx, .xlsx eller .pptx)

För att få tillgång till det inre innehållet i en XML-baseradOffice-dokument, öppna File Explorer (eller Windows Explorer i Windows 7), navigera till filen från vilken du vill extrahera innehållet och välj filen.

01_pressing_f2_to_rename_file

Tryck på “F2” för att byta namn på filen och ändra tillägget (.docx, .xlsx eller .pptx) till “.zip”. Lämna huvuddelen av filnamnet ensam. Tryck på "Enter" när du är klar.

02_changing_extension_to_zip

Följande dialogruta visar varning för att ändra filnamnstillägget. Klicka på "Ja".

02a_rename_confirmation

Windows känner igen automatiskt filen som en zippad fil. För att extrahera innehållet i filen, högerklicka på filen och välj "Extract All" från popup-menyn.

03_selecting_extract_all

På "Välj en destination och extrahera filer"dialogrutan, visas sökvägen där innehållet i .zip-filen kommer att extraheras i redigeringsrutan "Filer kommer att extraheras till den här mappen". Som standard skapas en mapp med samma namn som filnamnet (utan filändelsen) i samma mapp som .zip-filen. Klicka på "Bläddra" för att extrahera filerna till en annan mapp.

04_clicking_browse

Navigera dit du vill att innehållet i .zip-filen ska extraheras, klicka på "Ny mapp" för att skapa en ny mapp, om det behövs. Klicka på ”Välj mapp”.

05_creating_new_folder_and_selecting_it

Så här öppnar du en File Explorer (eller Windows Explorer)fönster med mappen som innehåller de extraherade filerna som visas när de har extraherats markerar du kryssrutan "Visa extraherade filer när den är klar" så att det finns en bock i rutan. Klicka på "Extract".

06_clicking_extract

Hur du får åtkomst till de extraherade bilderna

En mapp ingår i det extraherade innehålletheter "word", om din ursprungliga fil är ett Word-dokument (eller "xl" för ett Excel-dokument eller "ppt" för ett PowerPoint-dokument). Dubbelklicka på mappen “ord” för att öppna den.

07_opening_word_folder

Dubbelklicka på "media" -mappen.

08_opening_media_folder

Alla bilder från originalfilen finns i"Media" -mapp. De extraherade filerna är de originalbilder som används av dokumentet. Inuti dokumentet kan det vara storleksändring eller andra egenskaper, men de extraherade filerna är råbilder utan att dessa egenskaper tillämpas.

09_images_from_file

Hur du får åtkomst till den extraherade texten

Om du inte har Office installerat på din dator,och du måste extrahera text ur en Word (eller Excel eller PowerPoint) -fil, du kan komma åt den extraherade texten i filen "document.xml" i mappen "word".

10_document_xml_file

Du kan öppna den här filen i en textredigerare, t.ex.Notepad eller WordPad, men det är lättare att läsa i en speciell XML-redigerare, som gratisprogrammet, XML Notepad. All text från filen finns i bitar av vanlig text oavsett stil och / eller formatering som används i själva dokumentet. Naturligtvis, om du kommer att ladda ner gratis programvara för att se den här texten, kan du lika gärna ladda ner LibreOffice, som kan läsa Microsoft Office-dokument.

11_document_xml_file_open_in_xml_notepad

Hur man extraherar inbäddade OLE-objekt eller bifogade filer

För att få åtkomst till inbäddade filer i ett Word-dokument närdu har inte tillgång till Word, först öppna Word-filen i WordPad (som kommer inbyggt i Windows). Du kanske märker att några av de inbäddade filikonerna inte visas, men att de fortfarande finns där. Vissa av de inbäddade filerna kan ha delvisa filnamn. WordPad stöder inte alla Word-funktioner, så vissa innehåll kan visas felaktigt. Men du borde kunna komma åt filerna.

Om vi ​​högerklickar på en av de inbäddade filerna ivår exempel Word-fil, ett av alternativen är "Öppna PDF-objekt". Detta öppnar PDF-filen i standard PDF-läsarprogrammet på din PC. Därifrån kan du spara PDF-filen på din hårddisk.

11a_opening_pdf_file

Om WordPad inte har något alternativ för att öppna din fil, notera dess filtyp här. Till exempel är vår andra fil i detta dokument en .mp3-fil.

Gå sedan tillbaka till mappen "Files from [Document]" och dubbelklicka på mappen "inbäddningar" i mappen "word".

12_embeddings_folder

Tyvärr bevaras inte filtypernai filnamn. De har alla en ".bin" filändelse istället. Om du vet vilka typer av filer som är inbäddade i filen kan du antagligen dra vilken fil som är vilken efter filens storlek. I vårt exempel hade vi en PDF-fil och en MP3-fil inbäddad i vårt dokument. Eftersom MP3-filen troligen är större än PDF-filen, kan vi ta reda på vilken fil som är vilken genom att titta på filernas storlekar och sedan byta namn på dem med rätt tillägg. Nedan byter vi namn på MP3-filen.

13_extracted_embedded_files

Observera att inte alla filer nödvändigtvis öppnas med den här processen - till exempel öppnade vår PDF-fil korrekt från WordPad, men vi kunde inte få den att öppna genom att döpa om sin .bin-fil.

När du har extraherat zippets innehåll-filen kan du återställa förlängningen av den ursprungliga filen till .docx, .xlsx eller .pptx. Filen förblir intakt och kan öppnas normalt i motsvarande program.

Hur man extraherar bilder från äldre kontordokument (.doc, .xls eller .ppt)

Om du behöver extrahera bilder från ett Office 2003(eller tidigare) dokument, det finns ett gratis verktyg som heter Office Image Extraction Wizard som gör denna uppgift lätt. Detta program låter dig också extrahera bilder från flera dokument (av samma eller olika typer) på en gång. Ladda ner programmet och installera det (det finns också en bärbar version tillgänglig om du hellre inte vill installera det).

Kör programmet så välkomstskärmen visas. Klicka på "Nästa".

14_welcome_screen

Först måste vi välja filen från vilken du vill extrahera bilderna. Klicka på knappen "Bläddra" (mappikonen) till höger om dokumentredigeringsrutan på skärmen Input & Output.

15_clicking_browse_for_document

Navigera till mappen som innehåller dokumentet du vill ha, välj det och klicka på "Öppna".

16_opening_word_file

Mappen som innehåller den valda filenblir automatiskt Output-mappen. Om du vill skapa en undermapp i den mappen som heter samma som den valda filen klickar du på kryssrutan "Skapa en mapp här" så att det finns en bock i rutan. Klicka sedan på "Nästa".

17_clicking_next

Klicka på "Start" på skärmen Klar att starta för att börja extrahera bilderna.

18_ready_to_start

Följande skärm visas medan extraktionen behandlas.

19_processing_please_wait

Klicka på "Klicka här för att öppna destinationsmappen" på skärmen Färdig för att se de resulterande bildfilerna.

20_opening_destination_folder

Eftersom vi valde att skapa en undermapp, får vi en mapp som innehåller bildfilerna extraherade från filen.

21_opening_subfolder

Du kommer att se alla bilder som numrerade filer.

22_images_from_older_word_file

Du kan också extrahera bilder från flera filer samtidigt. För att göra detta, klicka på kryssrutan “Batch Mode” på skärmen Input & Output så att det finns en bock i rutan.

23_clicking_batch_mode

Skärmen Batch Input & Output visas. Klicka på "Lägg till filer".

24_clicking_add_files

Navigera till mappen i dialogrutan Öppnasom innehåller någon av filerna som du vill extrahera bilder från, välj filerna med "Shift" eller "Ctrl" för att välja flera filer och klicka på "Open".

Du kan lägga till filer från en annan mapp genom att klicka på "Lägg till filer" igen, navigera till mappen i dialogrutan Öppna, välja önskade filer och klicka på "Öppna".

25_opening_files

När du har lagt till alla filer som du kommer frånvill extrahera bilder kan du välja att skapa en separat mapp för varje dokument i samma mapp som varje dokument som bildfilerna sparas i genom att klicka i kryssrutan "Skapa en mapp för varje dokument" så att det finns en bock i lådan.

26_clicking_next_on_batch_mode

Du kan också ange vilken utmatningsmapp som ska vara"Samma som varje fils inmatningsmapp" eller ange eller välj en anpassad mapp med redigeringsrutan och "Bläddra" -knappen under det alternativet. Klicka på "Nästa" när du har valt de alternativ du vill ha.

26a_specifying_output_folder

Klicka på "Start" på skärmen Klar att starta.

27_ready_to_start_for_batch_mode

Följande skärm visar utvinningsförloppet.

28_processing_screen

Antalet extraherade bilder visas på skärmen Färdig. Klicka på "Stäng" för att stänga guiden för Office Image Extraction.

29_closing_wizard

Om du valde att skapa en separat mapp för varje dokument ser du mappar med samma namn som filerna som innehåller bilderna, beroende på vilken eller vilka utmatningsmappar du angav.

30_folders_containing_images

Återigen får vi alla bilder som numrerade filer för varje dokument.

31_images_from_one_file

Nu kan du byta namn på bilderna, flytta dem och använda dem i dina egna dokument. Se bara till att du har rätten att använda dem lagligt.