Beannachtaí do gach léitheoir sa bhlag!
Ceapaim go raibh orthu siúd a bhíonn ag obair go minic ar an ríomhaire (ní imríonn siad, ach go n-oibríonn sé), déileáil le haitheantas téacs. Bhuel, mar shampla, scanadh tú sliocht as an leabhar agus anois is gá duit an chuid seo a ghreamú isteach i do cháipéis. Ach is pictiúr é an doiciméad scanta, agus teastaíonn téacs uainn - mar sin teastaíonn cláir speisialta agus seirbhísí ar líne uainn chun téacs ó phictiúir a aithint.
Maidir le cláir aitheantais, scríobh mé cheana féin i bpoist roimhe seo:
- Scan téacs agus aitheantas i FineReader (clár íoctha);
- Obair in FineReader analógach - CuneiForm (clár saor in aisce).
Sa mhír chéanna ba mhaith liom díriú ar sheirbhísí ar líne chun aitheantas téacs a aithint. Tar éis an tsaoil, má theastaíonn uait an téacs a fháil go tapa le 1-2 phictiúr - ní dhéanaimid ciall le cláir éagsúla a shuiteáil ...
Tá sé tábhachtach! Tá cáilíocht an aitheantais (líon na n-earráidí, an inléiteacht, etc.) ag brath go mór ar cháilíocht na híomhá bunaidh. Dá bhrí sin, nuair a dhéantar scanadh (grianghraif, etc.), roghnaigh an cháilíocht chomh hard agus is féidir. I bhformhór na gcásanna, beidh cáilíocht 300-400 dpi go leor (is é dpi an paraiméadar a dhéanann cáilíocht an phictiúir a thréithriú. I suíomhanna beagnach gach scanóir, is iondúil go sonraítear an paraiméadar seo).
Seirbhísí ar líne
D'fhonn obair na seirbhísí a thaispeáint, rinne mé seat de cheann de mo chuid alt. Déanfar an seat seo a uaslódáil chuig na seirbhísí go léir, agus tugtar an cur síos orthu thíos.
1) //www.ocrconvert.com/
Is maith liom an tseirbhís seo mar gheall ar a simplíocht. Cé gur Béarla é an suíomh, oibríonn sé go maith leis an teanga Rúise freisin. Ní gá duit clárú. Chun aitheantas a thosú, ní mór duit 3 chéim a dhéanamh:
- uaslódáil do íomhá;
- roghnaigh teanga an téacs, atá sa phictiúr;
- brúigh an cnaipe tús aitheantais.
Tacaíocht formáide: PDF, GIF, BMP, JPEG.
Taispeántar an toradh thíos sa phictiúr. Caithfidh mé a rá, tá an téacs aitheanta go maith. Ina theannta sin, go han-tapa - d'fhan mé 5-10 soicind go litriúil.
2) //www.i2ocr.com/
Oibríonn an tseirbhís seo mar an gcéanna leis an tseirbhís thuas. Anseo is gá duit an comhad a íoslódáil, an teanga aitheantais a roghnú agus an cnaipe téacs sliocht a chliceáil. Oibríonn an tseirbhís go han-tapa: 5-6 soicind. leathanach amháin.
Formáidí tacaithe: TIF, JPEG, PNG, BMP, GIF, PBM, PGM, PPM.
Tá toradh na seirbhíse seo ar líne i bhfad níos áisiúla: feiceann tú dhá fhuinneog láithreach - sa chéad cheann an toradh aitheantais, sa dara ceann - an bhuníomhá. Dá bhrí sin, tá sé éasca go leor athruithe a dhéanamh le linn eagarthóireachta. Cláraigh ar an tseirbhís, dála an scéil, níl sé riachtanach freisin.
3) //www.newocr.com/
Tá an tseirbhís seo uathúil ar bhealaí éagsúla. Ar dtús, tacaíonn sé leis an bhformáid "nua-aimseartha" DJVU (dála an scéil, an liosta iomlán formáidí: JPEG, PNG, GIF, BMP, TIFF, PDF, DjVu). Ar an dara dul síos, tacaíonn sé le roghnú na réimsí téacs sa phictiúr. Tá sé seo an-úsáideach nuair a bhíonn tú sa phictiúr ní amháin i réimsí téacs, ach freisin i gceantair ghrafacha nach gá duit a aithint.
Tá cáilíocht aitheantais os cionn an mheáin, ní gá clárú.
4) //www.free-ocr.com/
Seirbhís an-simplí le haghaidh aitheantais: íomhá a uaslódáil, sonraigh an teanga, cuir isteach captcha (dála an scéil, an t-aon seirbhís san alt seo ina gcaithfidh tú é a dhéanamh), agus brúigh an cnaipe chun an íomhá a aistriú go téacs. I ndáiríre gach rud!
Formáidí tacaithe: PDF, JPG, GIF, TIFF, BMP.
Is toradh meánach é an toradh aitheantais. Tá botúin ann, ach ní leor. Mar sin féin, dá mbeadh cáilíocht an scáileáin bhunaidh níos airde, bheadh ord méadaíochta níos lú ann.
PS
Sin é an lá atá inniu ann. Má tá seirbhísí níos spéisiúla ar eolas agat maidir le haitheantas téacs a fháil - glac páirt sna tuairimí, beidh mé buíoch. Coinníoll amháin: tá sé inmhianaithe nach bhfuil aon ghá le clárú agus bhí an tseirbhís saor in aisce.
Dea-mhéin!