Žodynėlis

A B D I J K L M P R S T U V

A

ABBYY FineReader dokumentas – tai su programa ABBYY FineReader sukurtas objektas, skirtas taikant struktūrinę analizę apdoroti vieną pradinį dokumentą. Jame yra puslapių vaizdai su atitinkamu atpažintu tekstu (jei tokio yra) bei programos nuostatos (nuskaitymo, atpažinimo, įrašymo parinktys ir pan.).

ABBYY Hot Folder – tai planavimo priemonė, leidžianti pasirinkti aplanką su vaizdais ir nustatyti laiką šio aplanko vaizdams apdoroti. Pasirinkto aplanko vaizdai bus apdorojami automatiškai nurodytu laiku.

ABBYY Screenshot Reader – tai programa, skirta sukurti ekrano nuotraukas ir atpažinti jose esantį tekstą.

Abejotini simboliai - tai simboliai, kurie galimai buvo atpažinti neteisingai. Programa ABBYY FineReader paryškina abejotinus simbolius.

Abejotini žodžiai - tai žodžiai, kuriuose yra vienas arba keli abejotini simboliai.

ADRT® (adaptyvioji dokumentų atpažinimo technologija) – tai technologija, kuri leidžia padidinti daugiapuslapių dokumentų konvertavimo kokybę. Pavyzdžiui, ji gali atpažinti tokius struktūrinius elementus kaip antraštes ir poraštes, puslapių išnašas, puslapių numerius ir parašus.

Aktyvi sritis – tai vaizde pasirinkta sritis, kurią galima naikinti, perkelti arba modifikuoti. Norėdami, kad sritis būtų aktyvi, spustelėkite ją. Aktyviąją sritį apimantis rėmelis yra paryškintas, o jame yra maži kvadratėliai, kuriuos velkant galima keisti srities dydį.

Aktyvinimas – tai procesas, kurio metu iš ABBYY gaunamas specialus kodas, leidžiantis naudotojui duotajame kompiuteryje naudotis įsigyta programinės įrangos kopija pilnu režimu.

Aktyvinimo kodas – tai kodas, kurį programos aktyvinimo procedūros metu ABBYY išduoda kiekvienam ABBYY FineReader 10 naudotojui. Aktyvinimo kodo reikia norint aktyvinti ABBYY FineReader kompiuteryje, kuris sugeneravo Produkto ID.

Atpažinimo sritis – tai rėmeliu apribota vaizdo sritis, kurią ABBYY FineReader turi analizuoti automatiškai.

Automatinis dokumentų tiektuvas (ADT) – tai įtaisas, kuris į skaitytuvą automatiškai tiekia lapus. Skaitytuvas su ADT gali nuskaityti daugiapuslapius dokumentus be naudotojo pagalbos. ABBYY FineReader dera su daugiapuslapių dokumentų nuskaitymo funkcija.

Automatizavimo tvarkytuvė – tai įdėtoji tvarkytuvė, leidžianti vykdyti automatizuotas užduotis, jas kurti ir modifikuoti bei naikinti nebenaudojamas tinkintas automatizuotas užduotis.

Finereader backtotop Žodynėlis Atgal į viršų

B

Bendra šriftų sistema – tai atpažinimo sistema, atpažįstanti bet kurio šrifto ir šrifto dydžio nustatytus simbolius be išankstinio apmokymo.

Brūkšninio kodo sritis – tai sritis, kurioje yra brūkšninis kodas.

D

Dokumento analizė – tai procedūra, kurios metu dokumente parenkami loginės struktūros elementai ir skirtingi sričių tipai. Dokumento analizė gali būti vykdoma automatiškai arba rankiniu būdu.

Dokumento atvėrimo slaptažodis – tai priemonė, neleidžianti naudotojams atverti PDF dokumento neturint autoriaus slaptažodžio.

Dokumento parinktys – tai parinkčių rinkinys, kurį galima pasirinkti dialogo lange Parinktys (Įrankiai > Parinktys). Parinkčių rinkiniuose yra ir naudotojo kalbos, ir šablonai. Parinkčių rinkiniai gali būti įrašomi ir po to naudojami (įkeliami) kituose ABBYY FineReader dokumentuose.

Draudžiami simboliai - jei atpažintame tekste nerandate tam tikrų simbolių, gali būti, kad kalbos grupės ypatybėse jie nurodyti draudžiamų simbolių rinkinyje. Nurodžius šiuos simbolius, padidėja OCR sparta ir kokybė.

I

Ignoruojami simboliai – tai žodžiuose esantys bet kokie neraidiniai simboliai (pvz., skiemenų simboliai arba kirčių ženklai). Šie simboliai tikrinant rašybą yra ignoruojami.

Invertuotas vaizdas – tai vaizdas su baltais simboliais juodame fone.

J

Jungtinis žodis – tai žodis, kurį sudaro du arba keli kamienai (bendroji reikšmė); žodis, kurio žodyne nėra, tačiau kuris galimai yra sudarytas iš dviejų arba daugiau žodyne esančių terminų (ABBYY FineReader reikšmė).

K

Kodų puslapis – tai lentelė, nustatanti simbolių kodų ir pačių simbolių tarpusavio ryšius. Naudotojai gali pasirinkti reikiamus simbolius iš kodų puslapyje esančio rinkinio.

Finereader backtotop Žodynėlis Atgal į viršų

L

Leidimų slaptažodis – tai slaptažodis, neleidžiantis kitiems naudotojams spausdinti ir redaguoti PDF dokumento neįvedus autoriaus nurodyto slaptažodžio. Jeigu dokumentui parinktos kelios saugos nuostatos, kiti naudotojai negalės jų pakeisti, kol neįves autoriaus nurodyto slaptažodžio.

Lentelės sritis – tai lentelėms arba į jas panašioms teksto struktūroms atpažinti naudojama sritis. Programai perskaičius šio tipo sritį, ji srities viduje nubrėžia vertikalius ir horizontalius skyriklius bei taip suformuoja lentelę. Ši sritis išvesties tekste yra traktuojama kaip lentelė.

Licencijos tvarkytuvė – tai priemonė, naudojama valdyti ABBYY FineReader licencijas ir aktyvinti ABBYY FineReader 10 Corporate Edition.

Ligatūra – tai dviejų arba kelių sulipusių simbolių junginys (pvz., fi, fl, ffi). Šiuos simbolius sunku atskirti, nes jie dažniausiai suklijuojami spausdinimo metu. Traktuojant juos kaip vieną jungtinį simbolį, padidėja OCR tikslumas.

M

Mokymas – tai atitikimo tarp simbolio vaizdo ir paties simbolio nustatymas (išsamesnės informacijos rasite skyriuje Atpažinimas su mokymu).

P

Papildomas brūkšnelis – tai brūkšnelis (¬), nurodantis, kurioje vietoje žodis ar jų junginys turi būti perskeltas, jei jis atsiras eilutės pabaigoje (pvz., autoformatas turi būti perskeltas taip: auto–formatas). ABBYY FineReader visus žodyno žodžiuose rastus brūkšnelius pakeičia papildomais brūkšneliais.

Paradigma – tai visų gramatinių žodžio formų rinkinys.

Paveikslėlio sritis – tai sritis, naudojama vaizdo zonoms su paveikslėliais apibrėžti. Šio tipo srityje gali būti faktinis paveikslėlis arba bet koks kitas objektas, kuris turi būti rodomas kaip paveikslėlis (pvz.: teksto segmentas).

Pažymėtas PDF failas – tai PDF dokumentas, kuriame yra informacijos apie dokumento struktūrą, pvz.: jo logines dalis, paveikslėlius, lenteles ir t. t. Ši stru
ktūra koduojama PDF žymomis. PDF failas su žymomis gali būti pritaikytas įvairių dydžių ekranams ir yra puikiai skaitomas nešiojamuosiuose įrenginiuose.

PDF saugos nuostatos – tai apribojimai, kurie gali neleisti atverti, redaguoti, kopijuoti arba spausdinti PDF dokumento. Šioms nuostatoms priklauso dokumento atvėrimo slaptažodžiai, leidimų slaptažodžiai ir šifravimo lygiai.

Pirminė forma – tai pagrindinio žodžio forma žodyno įraše.

Produkto ID – tai parametras, kuris yra automatiškai sugeneruojamas pagal techninės įrangos konfigūraciją aktyvinant ABBYY FineReader konkrečiame kompiuteryje.

Puslapio išdėstymas – tai teksto, lentelių, paveikslėlių, pastraipų ir stulpelių išdėstymas puslapyje bei šriftai, šriftų dydžiai, šriftų spalvos, teksto fonas ir teksto orientacija.

Puslapio išdėstymo analizė – tai procesas, kurio metu puslapio vaizde aptinkamos sritys. Sritys gali būti penkių tipų: teksto, paveikslėlio, lentelės, brūkšninio kodo ir atpažinimo. Puslapio išdėstymo analizė gali būti vykdoma automatiškai, spustelėjus mygtuką Skaityti arba prieš vykdant OCR procedūrą ją rankiniu būdu gali atlikti naudotojas.

Finereader backtotop Žodynėlis Atgal į viršų

R

Raiška – tai nuskaitymo parametras, nustatantis, kiek t. c. naudoti nuskaitymo metu. 10 taškų ir didesnio šrifto tekstams turėtų būti naudojama 300 t. c. raiška, 400–600 t. c. raiška skirta mažesnio šrifto dydžio tekstams (9 taškų ir mažesniems).

S

Santrumpa – tai sutrumpinta žodžio ar frazės forma, naudojama pastariesiems perteikti. Pavyzdžiui, MS–DOS (Microsoft Disk Operating System – Microsoft disko operacinė sistema), UN (United Nations – Jungtinės Tautos) ir t. t.

Skaitytuvas – tai įrenginys, kuriuo į kompiuterį įvedami vaizdai.

Skyrikliai - tai simboliai, galintys atskirti žodžius (pvz.: /, \, brūkšnys), o patys nuo žodžių yra atskiriami tarpais.

Spalvų režimas – tai nuskaitymo parametras, apibrėžiantis, ar vaizdas turi būti nuskaitomas juodai baltas, pilkio mastelio ar spalvotas.

Spausdinimo tipas – tai parametras, atspindintis, kaip pradinis tekstas buvo išspausdintas (lazeriniu ar analogišku spausdintuvu, rašomąja mašinėle ar pan.). Lazeriniu spausdintuvu išspausdintiems tekstams reikia parinkti Aptikti automatiškai, rašomąja mašinėle surinktiems tekstams – Rašomoji mašinėlė, o faksogramoms – Faksograma.

Srities ruošinys – tai ruošinys, kuriame yra informacijos apie sričių dydį ir išdėstymą panašiai atrodančiuose dokumentuose.

Sritis – tai rėmeliu apribota vaizdo išranka. Prieš pradėdama OCR, programa ABBYY FineReader aptinka teksto, paveikslėlių, lentelių ir brūkšninių kodų sritis, kad galėtų nustatyti, kurios vaizdo dalys turi būti atpažintos ir kokia tvarka.

Šablonas – tai porų rinkinys (kiekvienoje poroje yra simbolio vaizdas ir pats simbolis), kuris sukuriamas šablono apmokymo metu.

Šrifto efektai – tai šrifto išvaizda (pvz., pusjuodis, kursyvas, pabrauktas, perbrauktas, apatinis indeksas, viršutinis indeksas, mažos didžiosios raidės).

Šviesumas – tai nuskaitymo parametras, nurodantis kontrastą tarp vaizdo juodos ir baltos sričių. Nustačius tinkamą šviesumą, padidėja atpažinimo kokybė.

Finereader backtotop Žodynėlis Atgal į viršų

T

Taškai colyje (t. c.) – tai vaizdų raiškos mato standartas.

Teksto sritis – tai sritis, kurioje yra teksto. Atkreipkite dėmesį, kad teksto srityse turėtų būti tik vienas teksto stulpelis.

Tvarkyklė – tai programa, valdanti kompiuterio periferinę įrangą (pvz., skaitytuvą, monitorių ar kt.).

U

Unicode – tai standartas, kurį sukūrė Unicode konsorciumas (Unicode, Inc.). Standartas – tai 16 bitų tarptautinė kodavimo sistema, skirta apdoroti tekstus, parašytus pagrindinėmis pasaulio kalbomis. Standartą lengva išplėsti. Unicode standartas nustato simbolių kodavimą bei tam tikromis kalbomis parašytų tekstų apdorojimo ypatybes ir procedūras.

V

Viengubo tarpo šriftas – tai šriftas (pvz., Courier New), kuriame tarpai tarp visų simbolių yra vienodi. Siekiant geresnių OCR rezultatų naudojant viengubo tarpo šriftus, reikia pasirinkti Įrankiai > Parinktys…, spustelėti skirtuką Dokumentas ir srityje Dokumento spausdinimo tipas pasirinkti Rašomoji mašinėlė.

Finereader backtotop Žodynėlis Atgal į viršų

Žodynėlis