4 bezmaksas tiešsaistes OCR rīki ir pārbaudīti

4 bezmaksas tiešsaistes OCR rīki ir pārbaudīti

Ja vēlaties jebkuru drukātu tekstu pārvērst digitālā tekstā, kuru varat kopēt, ielīmēt, rediģēt un meklēt, jums jāizmanto optisko rakstzīmju atpazīšanas (OCR) skeneri.





Izvēloties dokumenta skenēšanu vai fotografēšanu, tas tiks saglabāts tādā formātā kā JPEG vai PDF. OCR programmatūra var atpazīt šajos dokumentos esošos burtus un ciparus un pārvērst tos par meklējamu PDF failu vai failā, kuru varat rediģēt tādās programmās kā Microsoft Word.





Problēma ir tā, ka daži OCR skeneri darbojas daudz labāk nekā citi, un labākais no tiem ir diezgan smags makā.





Piemēram, Omnipage18 maksā 150 USD, bet ir īpaši labs dažādu valodu atpazīšanā. Adobe Acrobat Pro DC maksā uzkrītošus 400 USD, bet tai ir neticama precizitāte. ABBYY FineReader maksā 150 USD, bet lieliski pārvērš dokumentus, piemēram, žurnālus un brošūras, meklējamā tekstā. Vēlāk šajā rakstā mēs pārbaudīsim ABBYY tiešsaistes piedāvājumu.

Tomēr, ja jūs meklējat bezmaksas alternatīvas, kuras varat lejupielādēt un izmantojiet operētājsistēmā Windows vai OS X, jums vajadzētu izmēģināt šos OCR rīkus. Bet, ja vēlaties izmantot bezmaksas, tiešsaistē OCR rīks, turpiniet lasīt, jo esam izmēģinājuši dažus populārākos, ar rezultātiem zemāk.



Tests

Šķiet, ka lielākā daļa cilvēku tagad izmanto savus viedtālruņus, lai veiktu skenēšanu, es nolēmu izmantot Evernote skenējamā lietotne (Bezmaksas operētājsistēmās iOS un Android). Skenēju Ričarda Dokina pirmo lapu Kāpt neiespējami , lai redzētu, kādus rezultātus mēs varētu iegūt ar ļoti vienkāršu formatējumu. Es arī skenēju Tima Ferisa lapu Četru stundu šefpavārs izmēģināt skenerus ar nedaudz sarežģītāku formatējumu. Katru no šiem failiem es saglabāju kā PDF failu.

Pēc tam šie dokumenti tika pārbaudīti ar dažiem it kā labākajiem tiešsaistes OCR rīkiem, lai noskaidrotu, cik labi tiem veicās.





Bezmaksas tiešsaistes OCR [vairs nav pieejams]

Par laimi, bezmaksas tiešsaistes OCR lietošanai nav nepieciešama reģistrācija. Un es biju divreiz pārsteigts, kad ieraudzīju viņu prasību saglabāt mana dokumenta formatējumu un izkārtojumu.

Vietne apgalvo, ka var atbalstīt PDF, GIF, BMP, JPEG, TIFF un PNG ievadi. Rezultāti var būt DOC, PDF teksta dokuments, RTF un TXT. Diemžēl es nevarēju noskaidrot, vai viņiem ir faila lieluma ierobežojums.





Pamata dokuments PDF formātā

Pārveidots pilnīgi perfekti. Nav daudz ko teikt! Mēs dodamies uz a ļoti labs sākums.

Pamatdokuments DOC

Faktiskie vārdi, šķiet, ir pārvērtušies nevainojami, ja neskaita “ount” no “Mount Rushmore”, kas kaut kā iet AWOL. Tomēr formatējums ir cits stāsts. Daudzi komati tika aizstāti ar pasvītrojumiem, un dokumenta punktos tika ievietotas izlases atstarpes. Kad vēlāk redzat, kā šajā testā veicās augstākās klases programmatūrai, tas nav slikts darbs pavisam .

Sarežģīts dokuments PDF formātā

Sarežģīts dokuments uz DOC

Šoreiz reklāmguvums aizņēma tikai 10 sekundes, un teksts atkal tika pārveidots ar aptuveni 95% precizitāti. Radās dažas dīvainas atstarpes problēmas, un programmatūrai bija grūtības pārveidot fontu dokumenta augšējā labajā stūrī, un šeit un tur nokavēja dažas rakstzīmes.

Spriedums

i2OCR

i2OCR izvirza dažus iespaidīgus apgalvojumus. Rīks atpazīst vairāk nekā 60 valodas, var apstrādāt vairāku kolonnu izkārtojumus (noņemot formatējumu), tam nav faila lieluma ierobežojumu, var konvertēt augšupielādētos failus un no URL. Un, lai izmantotu šo rīku, jums arī nav jāreģistrējas.

Pakalpojums darbojas, vienkārši iegūstot tekstu no attēla un pēc tam izdodot neformatētu tekstu. Jūs varat ātri labot visas kļūdas blakus skatā, pirms teksta kopēšanas citās programmās vai lejupielādes DOC, PDF vai HTML formātā.

Piezīme: kad mēģināju augšupielādēt savus PDF dokumentus, i2OCR tos noraidīja, tāpēc man tie bija jāpārvērš JPEG formātā (uzņemot to ekrānuzņēmumu un pēc tam augšupielādējot failus).

Pamatdokuments vienkāršā tekstā

Sarežģīts dokuments vienkāršā tekstā

Lielākā daļa teksta tika pārveidota bez pārāk daudzām kļūdām, izņemot virsrakstu un recepti augšējā labajā stūrī, kas šim rīkam nebija lasāma. Veids, kā kolonnas tika pārveidotas par vienkāršu tekstu, nebūt nebija ideāls. Ja vēlaties, lai šī konvertēšana būtu funkcionējoša, būtu nepieciešams daudz laika, lai rindas pārkārtotu saskaņotos teikumos.

Spriedums

Tiešsaistes OCR

Tiešsaistes OCR pašlaik atbalsta 46 dažādas valodas un var pārvērst PDF, JPG, BMP, TIFF un GIF formātus Word, Excel vai vienkāršā teksta formātā. Vietne apgalvo, ka “pārveidotie dokumenti izskatās tieši tāpat kā oriģināls - tabulas, kolonnas un grafika”.

Versija, kuru varat izmantot bez reģistrācijas, ļauj pārvērst līdz 15 attēliem stundā (5 MB ierobežojums). Ja reģistrējaties kontam, varat iegādāties vairāk lapu, pārsniedzot šo ierobežojumu, vienlaikus pārvēršot arī vairāku lapu dokumentus un ZIP arhīvus.

Pamatdokuments DOC

Pamatdokuments tika pārveidots nevainojami, izņemot romiešu ciparu Es netiek paņemts. Kā vietne solīja, formatējums bija tieši tāds, kāds tas bija grāmatā. Paldies par šo rīku.

Sarežģīts dokuments uz DOC

Pēc tam, kad bijuši vīlušies iepriekšējos OCR rīkos, pārveidojot sarežģīto dokumentu, mani ļoti iespaidoja tiešsaistes OCR. Izkārtojums bija gandrīz ideāls, kā redzat iepriekš. Tomēr kārtējo reizi recepte netika uztverta pārāk labi, bet visas citas nelielas kļūdas bija niecīgas.

Spriedums

Absolūti fantastiski rezultāti no tiešsaistes OCR. Vienīgais mīnuss, ko es redzu, ir tas, ka nav iespējams lejupielādēt konvertētos dokumentus kā PDF failus, jo minētie izvades formāti ietver tikai DOCX, XLSX un TXT.

ABBYY FineReader Online (10 lappušu izmēģinājuma versija)

Kā minēts iepriekš, ABBYY ir viens no OCR programmatūras tirgus līderiem, kura pilna lejupielādes programma maksā aptuveni 150 USD. Viņi piedāvā a 10 lappušu bezmaksas izmēģinājuma versija lai to tiešsaistes rīku (nepieciešama reģistrācija). Lai abonētu 5 USD, viņu tiešsaistes rīks ļaus jums katru mēnesi pārvērst 200 lapas.

Pieņemamie faili var būt līdz 100 MB jebkurā no šiem formātiem: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP un PNG. ABBYY arī atpazīst gandrīz 200 valodas. Izejas ir īpaši iespaidīgas - ar izvēli starp DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 un EPUB.

Izmēģinājuma laikā varat pat izmēģināt pāris BETA funkcijas. Pirmais ir iespēja tulkot dokumentu citā valodā. Otrs ir eksportēt konvertēto dokumentu uz mākoņa krātuves kontu neatkarīgi no tā, vai tas ir Dropbox, Google disks, Evernote, Microsoft OneDrive vai Box.

Pamatdokuments DOCX

Sarežģīts dokuments uz DOCX

Pēc pārveidošanas dokumenta tekstā bija ļoti maz kļūdu (izņemot OCR, kas atkal cīnās ar šīs receptes fontu!), Bet formatējums atstāja daudz vēlamo.

Trīs kolonnas kaut kā aizņēma divas lapas, ar centrālo kolonnu tikai parādās otrajā lapā. Ja jūs patiesībā gribējāt darīt Izmantojot šo pārveidoto dokumentu, jūs galu galā izvilkt matus.

Pamata dokuments PDF formātā

Sarežģīts dokuments PDF formātā

Spriedums

Galīgais iznākums

Ja, tāpat kā lielākā daļa cilvēku, jūs vienkārši vēlaties skenēt dažus žurnālu rakstus un dažus mājsaimniecības rēķinus, jums šie dokumenti nebūs jārediģē. Tāpēc tieša konvertēšana uz PDF būs jums piemērota, jo jūs joprojām varēsit meklēt šos dokumentus. Šim nolūkam bezmaksas tiešsaistes OCR noteikti bija labākais bezmaksas rīks, kuru mēs pārbaudījām. Tomēr, ja esat gatavs maksāt USD 5 mēnesī par gandrīz pilnību, ABBYY FineReader tiešsaistē bija nedaudz precīzāks.

Runājot par dokumentu konvertēšanu uz DOC, mums neizdevās atrast perfektu risinājumu, taču līdz šim labākie rezultāti bija Tiešsaistes OCR . Pārvēršana nebija perfekta, taču formatējuma integritāte lielā mērā tika saglabāta neskarta, un kļūdas bija niecīgas. Salīdzinot šos rezultātus ar “premium” piedāvājumu no ABBYY, jūs varat būt neapmierināti.

Mēs šajā ziņojumā neiekļāvām Google diska OCR iespējas; mazliet par visu Google izpratni, bet vairāk par to, ka mēs vēlējāmies pārbaudīt dažus citus bezmaksas tiešsaistes OCR pakalpojumus.

Jums: Kādus citus tiešsaistes OCR rīkus jūs ieteiktu mūsu lasītājiem? Un ko tu esi mēģinājis, ko nekad vairs neizmantotu?

Kopīgot Kopīgot Čivināt E -pasts Rokas animācijas rokasgrāmata iesācējiem

Runas animēšana var būt izaicinājums. Ja esat gatavs sākt pievienot dialogu savam projektam, mēs to sadalīsim jūsu vietā.

kā izdzēst nokopēto saiti operētājsistēmā Android
Lasīt Tālāk Saistītās tēmas
  • Internets
  • Produktivitāte
  • Failu konvertēšana
  • OCR
Par autoru Robs Lakstīgala(Publicēti 272 raksti)

Robs Naitingeils ir ieguvis filozofijas grādu Jorkas universitātē, Lielbritānijā. Viņš ir strādājis par sociālo mediju vadītāju un konsultantu vairāk nekā piecus gadus, vienlaikus vadot seminārus vairākās valstīs. Pēdējos divus gadus Robs ir bijis arī tehnoloģiju rakstnieks, kā arī MakeUseOf sociālo mediju vadītājs un biļetenu redaktors. Jūs parasti atradīsit viņu ceļojot pa pasauli, mācoties video rediģēšanu un eksperimentējot ar fotogrāfiju.

Vairāk no Rob Nightingale

Abonējiet mūsu biļetenu

Pievienojieties mūsu informatīvajam izdevumam, lai iegūtu tehniskus padomus, pārskatus, bezmaksas e -grāmatas un ekskluzīvus piedāvājumus!

Noklikšķiniet šeit, lai abonētu