Ordlista

A B D F I K L M O P S T U V

A

ABBYY FineReader-dokument är ett objekt som har skapas med programvaran ABBYY FineReader för att bearbeta ett källdokument med strukturanalys. Det innehåller bilder av sidor med motsvarande tolkad text (om det finns text) och programinställningar (inläsning, tolkning, sparalternativ osv.).

ABBYY Hot Folder är en schemaläggningsfunktion där du kan välja en mapp med bilder och ange tidpunkt för behandling av bilderna i mappen. Bilderna i den valda mappen kommer att bearbetas automatiskts vid angiven tidpunkt.

ABBYY Screenshot Reader är ett program för att skapa skärmdumpar och tolka texter i dem.

ADRT® (Adaptive Document Recognition Technology) är en anpassningsbar dokumenttolkningsteknik som ökar konverteringskvaliteten på flersidiga dokument. Det kan till exempel tolka strukturella element som rubriker, sidhuvuden och sidfötter, fotnoter, sidnumrering och signaturer.

Aktivering är processen att hämta en särskild kod från ABBYY för att kunna använda programvaran i fullständigt läge på en given dator.

Aktiveringskod är en kod som utfärdas av ABBYY till varje användare av ABBYY FineReader 10 under aktiveringsproceduren. Aktiveringskoden krävs för att kunna aktivera ABBYY FineReader på datorn som har genererat produkt-ID:t.

Aktivt område är ett markerat område i en bild som kan tas bort, flyttas eller ändras. Klicka på ett område om du vill aktivera det. Ramen omkring ett aktivt område är fet och med små fyrkanter som man kan dra i för att ändra storleken på området.

Automatiseringsverktyg är ett integrerat verktyg som du använder för att köra, skapa och ändra automatiska uppgifter och ta bort anpassade automatiska uppgifter som du inte längre använder.

Automatisk dokumentmatare (ADF) är en enhet som matar in dokument automatiskt i en skanner. En skanner med en ADF kan läsa in flera sidor utan att användaren behöver involveras. ABBYY FineReader stöder även inläsning av flersidiga dokument.

Avgränsare är symboler som kan avgränsa ord (t.ex. /, \, tankstreck) och som omges av mellanslag.

Finereader backtotop Ordlista Upp

B

Bildområde används för områden som innehåller bilder. Denna typ av områden kan innehålla en faktiskt bild eller ett annat objekt som ska visas som en bild (t.ex. ett textavsnitt).

D

Dokumentalternativ är en uppsättning alternativ som kan väljas i dialogrutan Alternativ (Verktyg>Alternativ). Alternativen innefattar även användarspråk och mönster. Alternativen kan sparas och sedan användas (laddas) i andra ABBYY FineReader-dokument.

Dokumentanalys är en process med val av logiska strukturelement och olika typer av områden i ett dokument. Dokumentanalysen kan utföras automatiskt eller manuellt.

DPI (Dots per inch) är ett standardmått med punkter per tum för bildupplösning.

Drivrutin är ett program som styr kringutrustning till en dator (t.ex. en skanner, en bildskärm osv.).

F

Färgläge är en inläsningsparameter som avgör om en bild ska läsas in i svartvitt, gråskala eller färg.

Förkortning är en kortare form av ett ord eller en fras som används för att representera hela ordet eller frasen. Exempelvis MS–DOS (för Microsoft Disk Operating System), FN (för Förenta nationerna), osv.

Finereader backtotop Ordlista Upp

I

Ignorerade tecken är andra tecken än bokstäver som hittas i ord (t.ex. stavelsetecken eller betoningstecken). Dessa tecken ignoreras under stavningskontrollen.

Inverterad bild är en bild med vita tecken mot en mörk bakgrund.

K

Kodsida är en tabell som anger det inbördes förhållandet mellan teckenkoderna och själva tecknen. Användare kan markera de tecken de behöver från en uppsättning som är tillgänglig på kodsidan.

L

Licenshanteraren är en funktion som används för att hantera licenser till ABBYY FineReader och aktivera ABBYY FineReader 10 Corporate Edition.

Ligatur är en kombination av två eller fler “hopsatta” tecken (som fi, fl, ffi). Sådana tecken är svåra att separera eftersom de vanligen sitter ihop i utskriften. När de behandlas som ett enda sammansatt tecken blir OCR mer korrekt.

Ljusstyrka är en inläsningsparameter som anger kontrasten mellan svarta och vita bildområden. Rätt inställning av ljusstyrkan förbättrar tolkningskvaliteten.

Lösenord för behörighet är ett lösenord som förhindrar att andra användare kan skriva ut och redigera ett PDF–dokument om de inte skriver det lösenord som författaren har angett. Om säkerhetsinställningar har valts för dokumentet kommer andra användare inte att kunna ändra dessa inställningar förrän de har skrivit det lösenord som författaren har angett.

Lösenord för öppning av dokument är ett lösenord som förhindrar att användare kan öppna ett PDF-dokument om de inte skriver det lösenord som har angetts av författaren.

M

Mönster är en uppsättning par (där varje par innehåller en teckenbild och själva tecknet) som skapas vid mönsterinlärningen.

Finereader backtotop Ordlista Upp

O

Omnifont-system är ett tolkningssystem som tolkar alla teckensnitt och alla teckenstorlekar utan föregående inlärning.

Område är ett stycke som omsluts av en ram i bilden. Före OCR identifierar ABBYY FineReader områden med text, bilder, tabeller och streckkoder för att avgöra vilka avsnitt av bilden som ska tolkas, och i vilken ordning de ska tolkas.

Områdesmall är en mall som innehåller information om storlek och placering av områden för en uppsättning liknande dokument.

Osäkra ord är med ett eller flera osäkra tecken.

Osäkra/otydliga/okända tecken är tecken som kan ha feltolkats. Med ABBYY FineReader markeras osäkra tecken.

Otillåtna tecken – om vissa tecken aldrig kommer att hittas i den tolkade texten kan de läggas till i en uppsättning av otillåtna tecken i egenskaperna för språkgruppen. Genom att ange sådana tecken ökas OCR-hastigheten samtidigt som OCR-kvaliteten förbättras.

P

Paradigm är uppsättningen med alla grammatiska former av ett ord.

PDF–säkerhetsinställningar är begränsningar som kan
förhindra att ett PDF–dokument kan öppnas, redigeras, kopieras eller skrivas ut. Dessa inställningar innefattar lösenord för öppning av dokumentet, lösenord för behörighet och krypteringsnivåer.

Primär form är formen av ett huvudord i ordboken.

Produkt–ID är en parameter som genereras automatiskt baserat på maskinvarukonfigurationen vid aktiveringen av ABBYY FineReader på en dator.

S

Sammansatt ord är ett ord med två eller fler stammar (allmän betydelse). Ordet finns inte i ordlistan men kan bestå av två eller flera termer som finns i ordlistan (betydelse i ABBYY FineReader).

Sidlayout är ordningen av text, tabeller, bilder, stycken och kolumner på en sida men även teckensnitt, teckenstorlekar, teckenfärger, textbakgrund och textriktning.

Sidlayoutanalys är processen med identifiering av områden i en sidbild. Det finns fem olika slags områden: text, bild, tabell, streckkod och tolkningsområde. Sidlayoutanalys kan utföras automatiskt med knappen Läs eller manuellt av användaren före OCR.

Skanner är en enhet för inläsning av bilder i en dator.

Streckkodsområde är ett område som används för streckkodsbilder.

Finereader backtotop Ordlista Upp

T

Tabellområde är ett område som används för tabellbilder eller texter som har strukturerats i tabellform. När programmet tolkar denna typ av områden ritas vertikala och horisontella avgränsare upp i området så att de formar en tabell. Detta område återges som en tabell i utdata.

Taggad PDF är ett PDF-dokument som innehåller information om dokumentets struktur, t.ex. logiska delar, bilder, tabeller osv. Strukturen är kodad med PDF–taggar. En PDF-fil med sådana taggar kan återströmmas för att passa olika skärmstorlekar och kan t.ex. med fördel visas på handhållna enheter.

Teckeneffekter är utseendet på ett teckensnitt (dvs. fetstil, kursiverat, understruket, genomstruket, nedsänkt, upphöjt, kapitäler).

Teckensnitt med fast teckenindelning är ett teckensnitt (som Courier New) där alla tecken har samma avstånd. För bättre OCR-resultat från teckensnitt med fast teckenindelning kan du välja Verktyg>Alternativ…, klicka på fliken Dokument och välja Skrivmaskin under Dokumentutskriftstyp.

Textområde är ett område som innehåller text. Observera att textområden endast bör innehålla text i en spalt.

Tolkningsområde är ett område runt ett stycke i en bild som ska analyseras automatiskt i ABBYY FineReader.

Träning (inlärning) är kopplingen mellan en teckenbild och själva tecknet. (Mer information finns i stycket Tolkning med inlärning.)

U

Unicode är en standard som har utvecklats av Unicode Consortium (Unicode, Inc.). Standarden är ett 16–bitars internationellt kodningssystem för bearbetning av texter på de större världsspråken. Standarden kan enkelt utökas. Unicode-standarden anger teckenkodningen samt egenskaper och processer som används vid bearbetning av texter skrivna på ett visst språk.

Upplösning är en inläsningsparameter som bestämmer antalet dpi som ska användas vid inläsning. En upplösning på 300 dpi bör användas på texter med teckenstorlek på lägst 10pt, 400 till 600 dpi är lämpligast på texter med lägre teckenstorlek (9pt och lägre).

Utskriftstyp är en parameter som visar hur källtexten har skrivits ut (på laserskrivare eller liknande, skrivmaskin osv.). För laserutskrifter ska läget Automatisk igenkänning väljas, för maskinskrivna texter väljs Skrivmaskin och för fax väljs Fax.

V

Valfritt bindestreck är ett bindestreck (¬) som anger exakt var ett ord eller en ordkombination ska delas om det hamnar i slutet av en rad (t.ex. “autoformat” ska avstavas till i “auto–format”). I ABBYY FineReader ersätts alla bindestreck i ord som finns i ordlistan med valfria bindestreck.

Finereader backtotop Ordlista Upp

Ordlista