- 1. Značajke CuneiForm, značajke
- 2. Primjer prepoznavanja teksta
- 3. Batch Text Recognition
- 4. Zaključci
Pomozite razvoju web mjesta, dijelite članak s prijateljima!
Prije ili kasnije, svatko tko često radi s uredskim programima suočava se s tipičnim zadatkom - skeniranje teksta iz knjige, časopisa, novina, samo letaka, a zatim ih prevesti u tekstualni format, na primjer, u Word dokumentu.
Da biste to učinili, potreban vam je skener i poseban program za prepoznavanje teksta. U ovom ćemo članku govoriti o besplatnom analognom FineReaderu - CuneiFormu (o prepoznavanju u FineReaderu - pogledajte ovaj članak).
Počnimo …
sadržaj
- 1. Značajke CuneiForm, značajke
- 2 2. Primjer prepoznavanja teksta
- 3 3. Batch Text Recognition
- 4 4. Zaključci
1. Značajke CuneiForm, značajke
klinasto pismo
Možete je preuzeti s web mjesta razvojnog programera: http://cognitiveforms.com/
Program za prepoznavanje teksta s otvorenim izvorom. Osim toga, on radi u svim verzijama sustava Windows: XP, Vista, 7, 8, koji se svidi. Uz to, dodajte puni ruski prijevod programa!
Pros:
- prepoznavanje teksta na 20 najpopularnijih svjetskih jezika (samo je engleski i ruski uključeni u ovaj broj);
- ogromna podrška za različite tiskane fontove;
- provjerite rječnik priznatog teksta;
- mogućnost spremanja rezultata rada u nekoliko varijanti;
- očuvanje strukture dokumenta;
- izvrsna podrška i priznavanje tablica.
kontra:
- ne podržava prevelike dokumente i datoteke (više od 400 dpi);
- ne podržava izravno neke vrste skenera (dobro, nije zastrašujuće, upravljački program skenera dolazi s posebnim programom za skeniranje);
- Dizajn ne sjaji (ali tko to treba, ako program u potpunosti riješi problem).
2. Primjer prepoznavanja teksta
Pretpostavljamo da ste već primili potrebne slike za prepoznavanje (skenirane tamo ili preuzete knjigu u pdf / djvu formatu na internetu i izdvojile potrebne slike od njih.) Da biste to učinili, pogledajte ovaj članak.)
1) Otvorite željenu sliku u programu CuineForm (datoteka / otvorena ili "Cntrl + O").
2) Za početak prepoznavanja - najprije morate odabrati različita područja: tekst, slike, tablice itd. U Cuneiformu to se može obaviti ne samo ručno nego i automatski ! Da biste to učinili, kliknite gumb "označavanje" na vrhu zaslona prozora.
3) Nakon 10-15 sekundi. program će automatski označiti sva područja s različitim bojama. Na primjer, područje teksta je označeno plavom bojom. Usput, ona je ispravno istaknula sva područja i prilično brzo. Iskreno, nisam očekivala tako brzu i točnu reakciju od nje …
4) Za one koji ne vjeruju automatskom označavanju, možete koristiti priručnik. Da biste to učinili, nalazi se alatna traka (pogledajte donju sliku), zahvaljujući kojoj možete odabrati: tekst, tablicu, sliku. Pomicanje, povećanje / smanjenje početne slike, rubovi usjeva. Općenito, dobar set.
5) Nakon što su sva područja označena, možete početi prepoznati . Da biste to učinili, jednostavno kliknite gumb s istim imenom, kao na donjoj slici.
6) Doslovno za 10-20 sekundi. prije nego što otvorite dokument u Microsoft Wordu s prepoznatim tekstom. Zanimljivo je, u tekstu za ovaj primjer, pogreške, naravno, bile, ali ih ne postoji mnogo! Posebno, dano u kakvoj je neizvrsnoj kvaliteti izvorni materijal - slika.
Brzinom i kvalitetom je sasvim usporedivo s FineReaderom!
3. Batch Text Recognition
Ova funkcija programa može biti korisna kada trebate prepoznati više od jedne slike, ali nekoliko odjednom. Oznaka za pokretanje prepoznavanja paketa obično je skrivena u izborniku "start".
1) Nakon otvaranja programa, morate stvoriti novi paket ili otvoriti prethodno spremljenu. U našem primjeru stvorite novu.
2) U sljedećem koraku dajemo mu ime, po mogućnosti tako da ćemo za pola godine sjetiti što se nalazi u njemu.
3) Zatim odaberite jezik dokumenta (ruski-engleski), navedite postoje li slike i tablice u skeniranom materijalu.
4) Sada morate odrediti mapu u kojoj se nalaze datoteke za prepoznavanje. Usput, zanimljivo, sam program će pronaći sve slike i druge grafičke datoteke koje ih može prepoznati i dodati ih u projekt. Morat ćete ukloniti one dodatne.
5) Sljedeći korak nije važno, odlučite što učiniti s izvornim datotekama, nakon prepoznavanja. Preporučujem da odaberete potvrdni okvir "ništa ne učinite".
6) Ostaje samo odabrati format u kojem će se priznati dokument spremiti. Postoji nekoliko opcija:
- rtf - datoteku iz dokumenta riječi, otvara se svim popularnim uredima (uključujući besplatne, link na programe);
- txt - format teksta, možete spremiti samo tekst, slike i tablice u njoj;
- htm - hipertekstualna stranica, prikladno je ako skenirate i prepoznate datoteke za web mjesto. Mi ćemo ga odabrati u našem primjeru.
7) Nakon što kliknete gumb "spreman", započinje obrada vašeg projekta.
8) Program radi vrlo brzo. Nakon priznanja pojavljuje se kartica s htm datotekama. Ako kliknete na takvu datoteku, počinje preglednik gdje možete vidjeti rezultate. Usput, paket se može spremiti za daljnji rad s njom.
9) Kao što možete vidjeti, rezultati rada su vrlo impresivni. Program je bio lako prepoznatljiv po programu, a pod njom je lako prepoznati tekst. S činjenicom da je program besplatan - to je obično super!
4. Zaključci
Ako često ne skenirate i prepoznate dokumente, onda nema smisla kupiti FineReader. Kod većine zadataka CuneiForm jednostavno obrađuje.
S druge strane, ima i kontra.
Prvo, previše je alata za uređivanje i provjeru rezultata. Drugo, kada morate prepoznati puno slika, onda je u FineReaderu prikladnije odmah vidjeti sve što se dodaje projektu u stupcu desno: brzo ukloniti nepotrebne, ispravke itd. I treće, na dokumentima vrlo slabe kvalitete, CuneiForm gubi kao priznanje: Potrebno je uzeti dokument - ispraviti pogreške, staviti interpunkcijske znakove, obrnute zareze itd.
To je sve. Poznajete li još jednog vrijednog besplatnog programa za prepoznavanje teksta?