Iedere dag bieden wij GRATIS software met licentie waarvoor je normaliter moet betalen!
PDF OCR 4.3.1 werd aangeboden als een giveaway op 22 november 2013
PDF OCR is gebaseerd op OCR technologie om gescande PDF papieren boeken of documenten snel en gemakkelijk te converteren naar bewerkbare tekstbestanden. PDF OCR beschikt over een ingebouwde tekstbewerker waarmee je het resultaat kunt bewerken zonder MS Word. PDF OCR ondersteunt ook batchverwerking om via OCR alle pagina’s van een pdf-bestand te converteren naar tekstbestand. PDF OCR beschikt over een Scanned Image To PDF Converter, waarmee je zelf gescande PDF boeken kunt aanmaken.
Windows 7, Vista, XP, 2003, 2000, ME; Pentium Processor or better, Pentium 4 or higher recommended; 128MB RAM or more, 256MB RAM is recommended; 20MB Hard disk space for install
22.9 MB
$49.95
PDF Page Delete is een kleine gratis applicatie om pagina's te verwijderen uit een PDF-bestand. Het programma kan snel geselecteerde PDF-pagina's verwijderen en het resultaat opslaan als een nieuw PDF-bestand.
PDFZilla is een desktop applicatie dat snel en nauwkeurig PDF-bestanden kan converteren naar bewerkbare MS Word-documenten, MS Excel tabellen, Rich Text documenten, platte tekst bestanden, afbeeldingen, HTML-bestanden en Shockwave Flash SWF-bestanden. PDZilla kan PDF-bestanden ook roteren, knippen en samenvoegen.
WinPDFEditor is een Windows PDF bewerkingssoftware waarmee je PDF-documenten kunt aanpassen en bewerken, door tekst of afbeeldingen toe te voegen, ongewenste content te verwijderen, lijnen te tekenen en pagina's te draaien.
In the first OCR program I used you had to draw in every letter in a grid, this had to be done for all size fonts, and types, that is bold and italic and it took days just for one font, and it still was useless!.
Fortunately, we have moved on since then but not too far according to my test on today's download.
It made a complete hash of an image from a car auto manual that had been scanned.
Recently, I've been testing OCR programs including OmniPage, and non-have fared well except ABBYY which quite frankly is in a class of its own.
I used it on the same page that I tested today's download on and even though the image was a rather washed out looking page it was just short of perfect.
My first introduction to ABBYY OCR was when it came free with a printer.
It is so good that I found the best way of converting many PDF documents is to convert them to an image and then use it.
Recently, I found Ashraf’s recommendation UniPDF, to be by far the best converter of non-image PDF files.
If you need to convert PDF files, normal and image, use UniPDF and ABBYY and you have all the bases covered.
Frankly, today's download is comparatively is a waste of disk space.
No bad...easy to use GUI, can edit the OCR results with a built-in text editor, thus enabling you to edit scanned PDF files without using Word
It also gives you the option to convert one single page, a range of pages, or the entire PDF file in batch mode (supports even the Italian Language....woh, simply unbelievable...LOL!!)
As for conversion quality, I found it pretty GOOD with regard to TEXT only...not so good when required to extract text from images.
But if you want a better and more professional OCR product (for instance an ABBYY OCR software) you have to pay more, of course!!!
THUMBS UP from me!
BEST FREE ALTERNATIVES
http://www.ocronline.com (==> Supports over 153 languages)
http://www.paperfile.net (==> It also uses the powerful Tesseract engine by Google like this GAOTD)
http://capture2text.sourceforge.net
And to create a PDF file directly from scanned documents and images for FREE:
http://www.softpedia.com/get/Office-tools/PDF/Free-Scan-to-PDF.shtml
http://www.softwareok.com/?seite=Microsoft/WinScan2PDF
Enjoy!
Pros
*Allows you to extract text from PDF files — quickly converts text in a PDF document into an editable text document
*Intuitive interface that is simple for almost everyone to figure out
*Can be used as a standard PDF viewer (although we don't recommend it)
Cons
*Hit-or-miss conversion quality
Free Alternatives
gImageReader (not specific to PDFs but an OCR program nonetheless)
Final Verdict
Click here for final verdict and full review
#13 Giovanni
Sometimes if a job needs doing properly you have to pay, today I pointed out a program that does its job exceptionally well.
I did it in the hope that it would help people from wasting their money on programs that performs badly.
This appears to have upset you and for the life of me I cannot understand why.
For a frontend to free Tesseract engine it's quite costly. Some people try to harvest from other people's seed. Unfortunately this software is not the only one.
By the way a Readiris variant (restricted to scanned text) I got with a Kodak scanner-printer got quite good results i.e. only a few corrections needed. Unfortunately I can't compare it to ABBY as my version is quite outdated and two updates of good software sum up to the price of the latest versions.
As I don't need it often ...
But I've got a good advice for all those who hate to empty their printer cartridges just because the background of a PDF is fully coloured.
Former comment I didn't succeed to transfer to GOTD:
My only reason for converting PDFs to doc etc. has been for editing, e.g. to erase coloured background before printing which costs up to 60 times more ink (3 colours!) than pure black on white and thus emptying your cartridges in a hurry.
If it's the same for you, Adobe Acrobat can print black on white, too, but is too costly. But there is free PDF-XChange Viewer (portable). Goto Edit, Preferences, Accessibility and select "Override Document Colours" and then "Use Custom Colour Scheme". After changing colour to your wishes (Line Art? Fill Colour?): "Apply". By the way there is a predefined colour scheme for black and white, too.
Working effectively I have "installed" portable variant twice to allow a quick comparison of author's PDF and black and white.
PDF-XChange Viewer OCR + portable (multilanguage):
http://www.tracker-software.com/product/downloads
@15, Ootje - Teamviewer - it does ring a bell, but ever so slightly.
Het klinkt inderdaad aantrekkelijk. Al staat er geen PC in de garage, maar elders in huis. Ik heb net een gevecht met ZoneAlarm achter de rug, want ik wilde op de nieuwe virtuele W7 Starter hun firewall zetten, maar kreeg twee keer achter elkaar hun firewall en antivirus in een: zaSetupWeb_120_104_000. Wel handig voor mensen die hun firewall en/of virusscanner vijf minuten willen uitzetten. Of de internettoegang tijdelijk willen stopzetten. De derde keer scheepsrecht en heb ik alleen de firewall: zafwSetupWeb_120_104_000. Nog wel even klooien om de ZA-voorkeuren (add-in, startpagina, zoekmachine) uit FireFox te slopen. Maar ook dat is gelukt. Nu Temaviewer zetten op de iPad en de desktops. Hoef ik wat minder trap te lopen?? Als ZoneAlarm het goed vindt.
Bedankt voor de tip.
Save | Cancel
@7 krypteller
Ken je het programma Teamviewer: gratis voor prive-gebruik.
Op beide machines installeren en starten; id-getal en code-getal ingeven en hebt contact.
Bij iemand op de laptop en iPad en garage-pc gezet; hierna kan met de laptop of iPad contact gemaakt worden met de PC achterin de koude garage, zodat toch de administratie vanaf de warme keukentafel gedaan kan worden.
Teamviewer staat dan in een automatische antwoord en inlogstand.
http://www.teamviewer.com/nl/index.aspx
Ik gebruik het van tijd tot tijd om klusjes op afstand uit te voeren. Er is ook een uitvoering, die draait zonder installatie en enkel gasten toe kan laten na vermelding van de getallen.
De firewall moet het wel doorlaten.
Ootje
Save | Cancel
Re #11, bedankt voor de tip van de citrix receiver. De app staat er op. Nu me nog aanmelden voor een proefaccount.
Save | Cancel
@ 7 Win op Ipad? - Win-Os van de server via citrix receiver werkt anders prima op mijn aaipet ;-)
prog van vandaag is speelgoed... (eigenlijk speelfout!)
Save | Cancel
Re #6, OT: vervolg op mijn vorige posting. Die kwam van mijn W81. 64 desktop. De echte. Deze komt vanaf dezelfde hardware, maar FireFox draait nu op een virtuele W7 Starter. Net vanmorgen erop gezet.
Save | Cancel
Re #6, "Beetje raar dat W8 en W8.1 er nog niet bij staan."
Inderdaad. Maar het draait wel prima op mijn W 8.1 64 desktop. En ook onder XP. In ben geen kanjer, maar een 70+ oude hobbyist en gebruik Ubuntu 12.04 LTS, XP, Vista, W7 Starter (dus 32), W7 64 en W8.1 64 door elkaar. Als een programma al eens niet zou draaien onder het ene OS, dan draai ik het op dezelfde hardware virtueel onder een ander OS. Helaas heb ik nog geen foefje om Windows software op mijn iPad te draaien.
Save | Cancel
Beetje raar dat W8 en W8.1 er nog niet bij staan. Toch ?
Dat mag je van zo'n goed programma toch wel verwachten, lijkt me.
Ik ontvang tegenwoordig nogal eens pdf's, maar ja, de besturing hier is W8.1 . (moet een beetje met m'n tijd meegaan, vond ik :-) )
Dus beetje jammer.
Misschien weet een van de kanjers hier daar een foefje voor ?
Save | Cancel
"PDF OCR 4.3.1"
Vandaag een Setup in het Engels met het invullen van een nummer uit het Readme-bestand.
Er zijn wel een aantal zaken, waarbij misschien iets veranderd moet worden.
De plaats, waar het programma zelf denkt te mogen installeren is niet in de standaard "C:\Program Files", maar gewoon in de root van de C:-schijf.
https://dl.dropboxusercontent.com/u/10366431/_GOTD/PDFOCR431_20131122/Installatiepad.png
Tijdens de eerste start wordt je uitgenodigd om het aan te schaffen:
https://dl.dropboxusercontent.com/u/10366431/_GOTD/PDFOCR431_20131122/EersteStart.png
Dit is dus niet noodzakelijk, omdat er al een nummer aanwezig is.
Je kunt gewoon op een knop klikken; ik heb de linker genomen.
Hierna kan een registratieknop gevonden worden onder de knop About:
https://dl.dropboxusercontent.com/u/10366431/_GOTD/PDFOCR431_20131122/Registratie.png
Dit verloopt soepel.
Het laden van een PDF en verwerken tot een tekst verloopt ook eenvoudig.
Vlak voor het verwerken kan de OCR-taal worden gekozen, waaronder gelukkig ook Nederlands staat:
https://dl.dropboxusercontent.com/u/10366431/_GOTD/PDFOCR431_20131122/OCR-start.png
Het resultaat van de PDF:
https://dl.dropboxusercontent.com/u/10366431/_GOTD/PDFOCR431_20131122/licentie_tot_publiceren.pdf
kunt u zelf beoordelen, staat standaard in "C:\PDFOCR_Output"; het is wel een TXT bestand geworden:
https://dl.dropboxusercontent.com/u/10366431/_GOTD/PDFOCR431_20131122/licentie_tot_publiceren-11-22-9-35-25.txt
Een iets ander bestand:
https://dl.dropboxusercontent.com/u/10366431/_GOTD/PDFOCR431_20131122/Cartrek600HardwareManualNL.pdf
Doordat er afbeeldingen in deze PDF zitten, wordt het een stuk lastiger:
https://dl.dropboxusercontent.com/u/10366431/_GOTD/PDFOCR431_20131122/Cartrek600HardwareManualNL-11-22-10-19-1.txt
Ootje
Save | Cancel
Rotzooi in vergelijking met even dure producten van ABBYY (PDF Transformer). Het maakt alleen txt, geen doc. De aanbieder schrijft: "images and graphics will be recognized as text too, so you might get the unknown characters. You can delete unknown characters in Text Editor."
Bij alle ABBYY-producten kunt u zelf markeren welke delen tekst zijn, welke tabellen en welke grafisch (images). ABBYY doet een uitstekende voorzet, maar u kunt dat eenvoudig met de hand aanpassen.
Save | Cancel
@ Ootje. M.b.t tip online virusscanner twee dagen geleden : bedankt hiervoor! Gr Hans
Save | Cancel
van PdfZilla, hoe het verder gaat is bekend ;)
Save | Cancel