Tekst uit PDF-bestanden extraheren

Tijdens het omgaan met PDF- of Portable Document Format-bestanden, wilt u soms alle tekst uit een PDF-bestand extraheren . In deze handleiding laten we zien hoe u gemakkelijk tekst uit PDF-bestanden kunt extraheren of PDF-bestanden kunt converteren naar tekstbestanden in Windows, met of zonder de hulp van online hulpmiddelen.

De eenvoudigste en snelste manier om tekst uit PDF-bestanden te halen, is door gratis online-services te gebruiken. Voor deze onlinediensten is geen extra software vereist, wat betekent dat u uw werk kunt doen zonder extra software op uw pc te hoeven installeren.

Als de hieronder vermelde online services niet de gewenste resultaten geven of als u tekst wilt extraheren uit een gevoelig bestand dat u niet naar een externe server wilt uploaden, kunt u de gratis Windows-software bekijken die wordt genoemd in Methode 3 tot 5. Lees ook onze 6 manieren om PDF-bestanden te comprimeren.

Methode 1 van 6

ExtractPDF

ExtractPDF is een gratis online service om tekst en afbeeldingen uit PDF-bestanden volledig te vullen. De service biedt een gemakkelijk te begrijpen lay-out. Na het openen van de ExtractPDF-pagina in uw webbrowser, klikt u op de knop Bladeren om uw PDF-bestand te selecteren, klikt u op de knop Uploaden om het geselecteerde bestand naar de ExtractPDF-server te uploaden en met de extractie te beginnen.

Zodra de taak is voltooid, ziet u opties om tekstcontext, lettertypen en afbeeldingen uit het geüploade PDF-bestand te downloaden. Als u de geëxtraheerde tekst als een TXT-bestand wilt downloaden (om te openen in Kladblok of Word), schakelt u naar het tabblad Tekst en klikt u op Resultaat downloaden als een bestandsknop.

Zoals u in de bovenstaande afbeelding kunt zien, ondersteunt de service geen bestanden die groter zijn dan 12 MB. Deze beperking zou geen programma moeten zijn, aangezien de meeste PDF-bestanden kleiner dan 12 MB zijn.

Tijdens onze test hebben we gemerkt dat voor sommige PDF-bestanden de service de gewenste uitvoer niet geeft. Als u problemen ondervindt met deze service, bekijkt u de volgende.

Methode 2 van 6

Online OCR

Online OCR is een online hulpmiddel om tekst uit PDF-bestanden van minder dan 5 MB te extraheren. De service converteert PDF's naar bewerkbare Microsoft Word-bestanden (.docx) of tekstbestanden (.txt).

Methode 3 van 6

STDU Viewer

STDU Viewer is eigenlijk een gratis software die is ontworpen om meerdere bestandsindelingen te openen en te bekijken. Daarnaast ondersteunt de gratis versie van STDU Viewer het exporteren van tekstuele inhoud van PDF-bestanden.

Als u de tekstinhoud van een PDF-bestand wilt exporteren, opent u het PDF-bestand met STDU Viewer, klikt u op het menu Bestand, klikt u op Exporteren, klikt u op Tekst, selecteert u een locatie om het nieuwe tekstbestand op te slaan en klikt u vervolgens op de knop OK.

Met de exportoptie kunt u tekst uit een enkele, meerdere of alle pagina's extraheren. De downloadgrootte van STDU Viewer is minder dan 3 MB. De gratis versie van STDU Viewer is alleen voor persoonlijk en niet-commercieel gebruik.

Methode 4 van 6

PDF2Text Pilot

PDF2Text Pilot is een gratis software voor Windows om PDF-bestanden naar tekstbestanden te converteren met een enkele muisklik. Nadat u de software hebt geïnstalleerd en uitgevoerd, hoeft u alleen de PDF-bestanden te selecteren die u als tekstbestanden wilt zien en vervolgens op de knop Converteren te klikken. Uw geconverteerde bestanden zijn binnen een paar seconden klaar.

De kracht van PDF2Text Pilot is de eenvoudige interface en mogelijkheid om meerdere PDF-bestanden in één keer te converteren.

Methode 5 van 6

A-PDF Text Extractor

A-PDF Text Extractor is een andere Windows-software ontworpen om tekst uit PDF-bestanden te extraheren. De software is helemaal gratis voor zowel persoonlijk als commercieel gebruik.

Na het installeren van A-PDF Text Extractor (installatiegrootte is minder dan 1 MB), start u A-PDF Text Extractor. Klik op de knop Openen om het PDF-bestand te openen en klik vervolgens op Tekstknop extraheren om er tekst uit te extraheren.

Methode 6 van 6

Gaaiho PDF Reader

Gaaiho PDF Reader is een uitstekend stuk software ontworpen om met PDF-bestanden om te gaan. Deze gratis software biedt een overvloed aan functies die u niet kunt vinden in andere gratis PDF-reader-software. Een van de functies is de mogelijkheid om gemakkelijk tekst uit PDF-bestanden te extraheren.

Als u een PDF-bestand als tekstbestand wilt opslaan, klikt u na het openen van het PDF-bestand in Gaaiho Reader op Bestand, klikt u op Opslaan als en selecteert u vervolgens PDF naar tekst in het vervolgkeuzemenu naast Opslaan als type.

Wat denk je over deze tools? Ben je op de hoogte van een betere gratis tool voor dezelfde baan? Laat het ons weten in reacties.