Skannitud dokumentide teisendamine sõnaks - õnnelik Android

Kui peate raamatu tekstivormingus digiteerima, võib teil olla mitu küsimust. Kas seda saab teha? Kuidas on kvaliteediga, kas see on hea? Seda saab mitte ainult teha, vaid on ka mitu võimalust skannitud dokumendi Wordiks teisendamiseks. Vaatame:

  • Skannides dokumendi PDF-vormingus ja redigeerides seda hiljem Adobe Acrobat XI Pro abil, et see Wordi vormingus salvestada. Acrobati Pro versioon on tasuline, kuid saate osta tasuta 30-päevase proovilitsentsi.
  • Veebisaidilt OnlineOCR.net . See veebirakendus võimaldab teil teisendada PDF-, JPG-, TIFF- ja GIF-vormingus dokumente Wordiks, Excelisse ja tekstiks. Tasuta versioonis saame teisendada kuni 15 lehekülge tunnis ja dokumente, millel on kuni üks leht.
  • Skannides dokumendi (OCR) vormingus ja salvestades selle tekstina. Seejärel saame Wordi avada ja redigeerida või salvestada .doc-vormingus.
  • Mõne optilise märgituvastusprogrammi kasutamine :
    •  VueScan (saadaval Windowsile, Mac OS X-ile ja Linuxile)
    • Kooka  (Linuxi jaoks)
    • Kontorilääts ( Androidile ja iOS-ile )
    • CamScanner ( Androidile ja iOS-ile )

Kõige tõhusam viis kõigist, mida võiksime öelda, on Adobe Acrobat Pro, kuid ainult siis, kui skannimine on väga, väga puhas ja kvaliteetne. Optilise märgituvastuse rakendused on jõudnud kaugele, kuid need näitavad siiski mõningaid lünki näiteks paksus kirjas või kursiivis ning mõnede sõnade transkriptsioon olenevalt originaaldokumendi fonditüübist võib olla vale.

Proovige see dokument skannida ja Wordile edastada, et näha, mis juhtub

Skannerist endast

Mõni skanner sisaldab optilise tuvastuse (OCR) funktsiooni oma skannimisprogrammis. Dokumendi tekstiks skannimiseks peate lihtsalt määrama digiteerimise vormingu ja vaatama ühte, mis viitab OCR-ile või sarnasele (see sõltub skanneri brändist / mudelist).

Minge PDF-st Wordi Adobe Acrobat XI Pro abil

Kui Adobe Acrobat XI Pro on alla laaditud ja installitud ( teil on SIIN tasuta 30-päevane prooviversioon), minge jaotisse Tööriistad -> Tekstituvastus -> Selles failis .

Klõpsake aknas " Teksti tuvastamine " nuppu " Muuda " ja valige teksti keel, väljundi stiil ja eraldusvõime.

Lõpuks minge tagasi jaotisse Tööriistad -> Sisu redigeerimine -> Redigeeri teksti ja pilte "ning muutke teksti, kui teil on vaja sõna parandada. Lõpetamiseks klõpsake nuppu " Fail -> Salvesta nimega " ja salvestage see Wordi vormingus.

OnlineOCR

OnlineOCR on veebirakendus piltide või pdf-failide ülekandmiseks Wordi ja seda on väga lihtne kasutada. Seletan, kuidas see töötab: sisestage //www.onlineocr.net/ ja klõpsake nuppu " Vali fail ". Valige skannitud dokument ning seejärel valige ekraani keskel asuvatest 2 rippmenüüst keel ja väljundvorming.

Lõpetamiseks klõpsake nuppu " Teisenda ". Vahetult selle all kuvatakse tavalise teksti eelvaade, mida saate muuta, kui peate mõnda sõna parandama. Lõpuks klõpsake nuppu " Laadi väljundfail alla " ja saate faili Wordi vormingus alla laadida. Siin on näide PDF-failist, mis on teisendatud OnlineOCR-iga Wordiks:

  • Algne PDF:

  • Teisendatud dokument:

Kui see veebirakendus teid ei rahulda, võite proovida muid sarnaseid alternatiive, näiteks FreeOCR või Free-Online-OCR .

Optilise märgituvastuse (OCR) programmid

Kui te ei soovi oma dokumente veebis muuta ja vajate töölauarakendust, võite kasutada selliseid rakendusi nagu VueScan (mis on lisaks üldlevinud Windowsile saadaval ka Maci ja Linuxi jaoks).

Teine võimalus on dokumendi skannimiseks ja otse tekstiks teisendamiseks kasutada oma Android- või iOS-seadet. On selliseid rakendusi nagu Office Lens ( Androidile ja iOS-ile ) või CamScanner ( Androidile ja iOS-ile ), mis viivad kogu protsessi läbi samast rakendusest. Nendel juhtudel on soovitatav pilt enne teksti teisendamist puhastada. Kui soovite selle meetodi kohta rohkem teada saada, vaadake seda postitust .

Minu arvates on optilise märgituvastustehnika, ehkki see on viimastel aastatel palju paranenud, täiuslikuks tehnikaks olemisest siiski valgusaastate kaugusel. Palju üksikasju, palju sõnu, mida ta "tõlgib" valede tähtede ja sümbolitega, mis teksti risustavad. Tal puudub siiani see täiendav intelligentsus, mis paneks teda nägema, et " t &! $ Olog1a " ei saa olla tekstis ühegi sõna kehtiv tõlge. Ma ei näe endiselt arusaamist lugemisest, vaid üksikute tähtede, mis moodustavad sõnu, lihtsa visuaalse äratundmise ilma neid ülejäänud tekstiga integreerimata. Olen siiski veendunud, et hetk, mil teeme selle viimase suure hüppe, läheneb iga päevaga.

Kas teil on telegramm installitud? Saate meie kanali iga päeva parima postituse . Või kui soovite, uurige kõike meie Facebooki lehelt .