Téacs a aithint i gcomhad PDF ar líne.


Ní féidir téacs a bhaint as comhad PDF i gcónaí ag baint úsáide as cóipeáil thraidisiúnta. Is minic gurb iad leathanaigh na ndoiciméad sin an t-ábhar scanta dá leaganacha páipéir. Chun comhaid den sórt sin a thiontú ina sonraí téacs atá in-eagarthóireacht go hiomlán, úsáidtear cláir speisialta leis an bhfeidhm um Aithint Carachtar Optúil (OCR).

Tá sé an-deacair a leithéid de réitigh a chur i bhfeidhm agus, dá bhrí sin, cosnaíonn siad a lán airgid. Más gá duit téacs le PDF a aithint go rialta, moltar an clár cuí a cheannach. I gcás cásanna neamhchoitianta, bheadh ​​sé níos loighciúla ceann de na seirbhísí ar líne a bhfuil feidhmeanna comhchosúla acu a úsáid.

Conas téacs a aithint ó PDF ar líne

Ar ndóigh, tá an tacar gné seirbhísí ar líne OCR níos teoranta i gcomparáid le réitigh iomlána deisce. Ach is féidir leat oibriú leis na hacmhainní sin saor in aisce, nó ar tháille ainmniúil. Is é an rud is mó ná go dtéann na feidhmchláir ghréasáin chomhfhreagracha i ngleic lena bpríomhthasc, mar shampla aitheantas téacs, chomh maith.

Modh 1: ABBYY FineReader Ar Líne

Tá an chuideachta forbartha seirbhíse ar cheann de na ceannairí i réimse aitheantais doiciméad optúil. Is réiteach cumhachtach é ABBYY FineReader do Windows agus Mac chun PDF a thiontú go téacs agus oibriú leis.

Níl an contrapháirtí gréasáin den chlár, ar ndóigh, níos lú ná é i bhfeidhmiúlacht. Mar sin féin, is féidir leis an tseirbhís téacs ó scans agus grianghraif a aithint i níos mó ná 190 teanga. Tacaíonn sé le comhaid PDF a thiontú ina ndoiciméid Word, Excel, etc.

ABBYY FineReader Seirbhís ar líne ar líne

  1. Sula dtosaíonn tú ag obair leis an uirlis, cruthaigh cuntas ar an suíomh nó logáil isteach ag baint úsáide as do chuntas Facebook, Google nó Microsoft.

    Chun dul go dtí an fhuinneog logála isteach, cliceáil ar an gcnaipe. "Logáil isteach" sa bharra roghchláir barr.
  2. Nuair a bheidh tú logáilte isteach, allmhairigh an doiciméad PDF atá ag teastáil isteach sa FineReader ag baint úsáide as an gcnaipe "Uaslódáil Comhaid".

    Ansin cliceáil "Roghnaigh uimhreacha leathanaigh" agus sonraigh an réise inmhianaithe d'aitheantas téacs.
  3. Ansin, roghnaigh na teangacha atá sa doiciméad, formáid an chomhaid a thig as agus cliceáil ar an gcnaipe "Aithin".
  4. Tar éis na próiseála, braitheann a ré go hiomlán ar mhéid an doiciméid, is féidir leat an comhad críochnaithe a íoslódáil le sonraí téacs ach trí chliceáil ar a ainm.

    Nó é a onnmhairiú chuig ceann de na seirbhísí scamall atá ar fáil.

Tá an tseirbhís éagsúil, is dócha, leis na halgartaim aitheantais téacs is cruinne in íomhánna agus i gcomhaid PDF. Ach, ar an drochuair, tá a úsáid saor in aisce teoranta do chúig leathanach a phróiseáiltear in aghaidh na míosa. Ní mór duit síntiús aon bhliana a cheannach le hobair a dhéanamh ar dhoiciméid atá níos toirtiúla.

Mar sin féin, má tá an fheidhm OCR ag teastáil go hannamh, is rogha iontach é ABBYY FineReader Online chun téacs a bhaint as comhaid PDF bheaga.

Modh 2: Saor in Aisce ar líne OCR

Seirbhís simplí agus áisiúil chun téacs a dhigitiú. Gan an gá le clárú, ceadaíonn an acmhainn duit 15 leathanach PDF iomlán in aghaidh na huaire a aithint. Saor in aisce ar líne Oibríonn OCR go hiomlán le doiciméid i 46 teanga agus gan údarú tacaíonn sé le trí bhformáid onnmhairithe téacs - DOCX, XLSX agus TXT.

Nuair a chláraíonn tú, tá an t-úsáideoir in ann doiciméid il-leathanach a phróiseáil, ach níl ach 50 aonad i gceist le saoruimhir na leathanach seo.

Seirbhís ar líne saor in aisce OCR

  1. Chun an téacs ó na PDF mar “aoi” a aithint, gan údarú ar an acmhainn, bain úsáid as an bhfoirm chuí ar phríomhleathanach an tsuímh.

    Roghnaigh an doiciméad atá ag teastáil ag baint úsáide as an gcnaipe "Comhad", sonraigh an phríomhtheanga téacs, an fhormáid aschuir, fan ansin chun an comhad a luchtú agus cliceáil "Tiontaigh".
  2. Ag deireadh an phróisis digitithe, cliceáil “Íoslódáil an Comhad Aschuir” chun an doiciméad críochnaithe a shábháil leis an téacs ar an ríomhaire.

I gcás úsáideoirí údaraithe, tá seicheamh na ngníomhaíochtaí beagán difriúil.

  1. Bain úsáid as an gcnaipe "Clárú""Logáil isteach" cruthaigh cuntas saor in aisce OCR ar líne sa bharra roghchlár barr, faoi seach, nó téigh isteach ann.
  2. Tar éis údarú a fháil sa phainéal aitheantais, coinnigh síos an eochair "CTRL", roghnaigh suas le dhá theanga den doiciméad foinse ón liosta a sholáthraítear.
  3. Sonraigh roghanna breise chun téacs a bhaint as PDF agus cliceáil ar an gcnaipe. "Roghnaigh Comhad" an doiciméad a luchtú isteach sa tseirbhís.

    Ansin, chun aitheantas a thosú, cliceáil "Tiontaigh".
  4. Tar éis an doiciméad a phróiseáil, cliceáil ar an nasc le hainm an chomhaid aschuir sa cholún comhfhreagrach.

    Stórálfar an toradh aitheantais láithreach i gcuimhne do ríomhaire.

Má theastaíonn uait téacs a bhaint as cáipéis bheag PDF, is féidir leat leas a bhaint as an uirlis thuasluaite go sábháilte. Chun oibriú le comhaid mhóra, beidh ort siombailí breise a cheannach in OCR Saor in Aisce nó teacht ar réiteach eile.

Modh 3: NewOCR

Seirbhís OCR-saor in aisce a ligeann duit téacs a bhaint as beagnach aon doiciméid ghrafacha agus leictreonacha ar nós DjVu agus PDF. Ní chuireann an acmhainn srianta ar mhéid agus ar líon na gcomhad so-aitheanta, ní gá clárú, agus cuireann sé réimse leathan feidhmeanna gaolmhara ar fáil.

Tacaíonn NewOCR le 106 teanga agus tá sé in ann scanadh doiciméad fiú ísealcháilíochta a láimhseáil i gceart. Is féidir an limistéar le haitheantas téacs a roghnú de láimh ar an leathanach comhaid.

NewOCR seirbhíse ar líne

  1. Mar sin, is féidir leat tosú ag obair leis an acmhainn láithreach, gan an gá le gníomhaíochtaí neamhriachtanacha a dhéanamh.

    Tá foirm ar an bpríomhleathanach chun an doiciméad a iompórtáil chuig an suíomh. Chun comhad a uaslódáil chuig NewOCR, bain úsáid as an gcnaipe "Roghnaigh comhad" sa roinn "Roghnaigh do chomhad". Ansin sa pháirc "Teanga / teangacha aitheanta" roghnaigh teanga amháin nó níos mó den doiciméad foinse, ansin cliceáil “Uaslódáil + OCR”.
  2. Socraigh na socruithe aitheantais is fearr leat, roghnaigh an leathanach atá ag teastáil chun an téacs a bhaint amach, agus cliceáil ar an gcnaipe. "OCR".
  3. Scrollaigh síos beagán agus faigh an cnaipe. Íoslódáil.

    Cliceáil air agus sa liosta anuas roghnaigh an fhormáid doiciméid riachtanach le híoslódáil. Ina dhiaidh sin, íoslódálfar an comhad críochnaithe leis an téacs eastósctha chuig do ríomhaire.

Tá an uirlis áisiúil agus aithníonn sé na carachtair uile ar ardchaighdeán. Mar sin féin, ní mór gach leathanach den doiciméad PDF allmhairithe a phróiseáil go neamhspleách agus a thaispeáint i gcomhad ar leith. Ar ndóigh, is féidir leat na torthaí a chóipeáil láithreach chuig an ghearrthaisce agus iad a chumasc le daoine eile.

Mar sin féin, mar gheall ar an méid thuas, tá sé an-deacair sliocht mór téacs a úsáid ag úsáid NewOCR. Leis an tseirbhís comhad beag céanna a dhéileálann le "bang."

Modh 4: OCR.Space

Ceadaíonn acmhainn shimplí agus intuigthe chun téacs a dhigitiú duit doiciméid PDF a aithint agus an toradh a aschur i gcomhad TXT. Níl aon teorainn le líon na leathanach. Is é an t-aon teorannú ná nár cheart méid an doiciméid ionchuir a bheith níos mó ná 5 mheigibheart.

OCR.Space seirbhís ar líne

  1. Ní gá clárú chun oibriú leis an uirlis.

    Cliceáil ar an nasc thuas agus uaslódáil an doiciméad PDF ar an láithreán gréasáin ó do ríomhaire ag baint úsáide as an gcnaipe "Roghnaigh comhad" nó ón líonra - trí thagairt.
  2. Sa liosta anuas "Roghnaigh teanga OCR" roghnaigh teanga an doiciméid allmhairithe.

    Ansin cuir tús leis an bpróiseas aitheantais téacs trí chliceáil ar an gcnaipe. "Tosaigh OCR!".
  3. Ag deireadh na próiseála comhad, féach an toradh sa phróiseas "Toradh OCR'ed" agus cliceáil Íoslódáilan doiciméad TXT críochnaithe a íoslódáil.

Más gá duit an téacs a bhaint as an PDF agus mura bhfuil an fhormáidiú deiridh tábhachtach ar chor ar bith, is rogha mhaith é OCR.Space. Ní mór an t-aon cháipéis a bheith “aonteangach”, ós rud é nach gcuirtear aitheantas ar fáil do dhá theanga nó níos mó sa tseirbhís ag an am céanna.

Féach freisin: analógacha saor in aisce FineReader

Measúnú a dhéanamh ar na huirlisí ar líne a chuirtear i láthair san alt, ba cheart a thabhairt faoi deara go láimhseálann FineReader Online ó ABBYY an fheidhm OCR ar an mbealach is cruinne agus is cruinne. Má tá cruinneas uasta aitheantais téacs tábhachtach duitse, is fearr an rogha seo a mheas go sonrach. Ach chun íoc as, is dócha go gcaithfidh sé freisin.

Más gá duit doiciméid bheaga a dhigitiú agus má tá tú réidh le hearráidí a cheartú ag an tseirbhís féin, moltar duit úsáid a bhaint as NewOCR, OCR.Space nó OCR ar líne.