koristni članki

Kako ustvarim iskalni arhiv dokumentov PDF?

V stolpcu o tehničnih nasvetih na Goldavelez.com - naj bodo vprašanja, ljudje! - pomagamo bralcu, ki ima preveč pomembnih dokumentov, ki morajo narediti čaroben prehod v digitalno sfero. Vsaj to se sliši veliko bolj vznemirljivo kot "optično prepoznavanje znakov", ki se v resnici ne odlepi z jezika.

Bralec Goldavelez.com Phil piše:

Hvala za prijazne besede, Phil! Z veseljem vam pomagam - ne zaradi laskanja, ampak zato, ker je verjetno veliko bralcev razmišljalo (tudi jaz). Imam cel kup stvari, za katere bi rad prešel iz fizičnega v digitalni svet, tako da lahko potem Marie Kondo izvirne dokumente in fotografije spravim v pozabo. Kupe papirja mi ne prinašajo veselja.

Na voljo imate nekaj možnosti. Začel bi z očitno eno: Google. Ob predpostavki, da ustvarjate PDF, naložite datoteke v Google Drive. Z desno miškino tipko kliknite katerega koli posameznega PDF-ja, s kazalcem miške kliknite »Odpri z« in izberite »Google Dokumenti.« Google bo nato poskusil zagnati nekaj OCR-ja v vašem PDF-ju in nastalo datoteko lahko shranite kot dokument. Nato lahko iščete po tem dokumentu (in vseh drugih, ki jih pretvorite) prek samega Drive.

Bolj ko o tem razmišljam, pa se mi zdi, da je rešitev malo nelegantna glede na to, koliko datotek morate delati. Namesto tega lahko poskusim kos programske opreme, kot je TesseractStudio.Net - ali samo Tesseract OCR, če se ne bojite ukazne vrstice. To bi morali uporabljati za ustvarjanje OCR podatkov iz datotek, nato pa jih lahko poiščete neposredno prek Windows ali macOS. OCRmyPDF je še enaka možnost, podobna Tesseract OCR, vendar se spet igrate s tipkanimi ukazi za uporabo OCR za vaše datoteke. Grafičnega vmesnika ni, prav tako ni (neposredne) podpore za Windows.

Obstaja tudi Paperwork, odprtokodno orodje za katalogiziranje dokumentov, ki je vgrajeno z OCR, kar bi zagotovo upošteval glede na to, da je zasnovan tako, da je vse v enem kosu programske opreme za arhiviranje, razvrščanje in iskanje dokumentov. Zveni, kot da bi lahko bilo tisto, kar iščete.

Nisem uporabljal pregledovalnika PDF-XChange, vendar so ga drugi priporočili kot možnost. Brezplačna različica bo pustila vodne žigove v vaše datoteke PDF, vendar lahko ustvari PDF iz slik in, če se pravim, doda OCR vsem, ki jih imate. Vredno je raziskati, čeprav to ni idealna (brezplačna) rešitev. Podobno lahko FreeOCR posname vaše slike ali datoteke PDF, uporabi OCR in rezultate izvozi v navadne besedilne datoteke ali Wordove dokumente. Če ne zamerite iskanju po svojih arhivih, je to možnost.

Kar zadeva plačljive rešitve, vedno obstajata Adobe Acrobat Pro ali Foxit PhantomPDF . Oboje vam bo omogočilo dodajanje OCR v datoteke PDF in vse vaše dokumente bi morali obdelati v velikem paketu (ali ustvarili skript, ki to stori z vsebino map). To boste morda celo dosegli med brezplačnimi preizkusi aplikacij, če ne omejujejo svojih zmogljivosti OCR. Videl sem tudi, da so drugi, ki imajo vašo posebno težavo, našli uspeh s pomočjo aplikacije, kot je PDF OCR, ki bi lahko bila cenejša alternativa.

To je vse, kar si lahko omislim z vrha glave (in z malo raziskovanja). Upajmo, da vam ena od teh rešitev ustreza - ne da bi vam to stalo majhno bogastvo. Pišite nazaj in mi sporočite, katera aplikacija je najbolje delovala za vas!

Tech 911 Imate tehnično vprašanje, ki vas spremlja ponoči? Na to bi radi odgovorili! Pošljite - z "Tech 911" v zadevi.