Oprettelse af et OCR sprog

Når der udføres OCR på et dokument, anvender ABBYY FineReader nogle af oplysningerne om dokumentsproget (dette sprog skal vælges fra rullelisten Dokumentsprog i vinduet Dokument). Hvis der er for mange usædvanlige forkortelser eller ord i teksten, kan programmet muligvis ikke genkende dem korrekt. Hvis dette er tilfældet, vil du måske oprette dit eget genkendelsessprog for dette dokument.

  1. I menuen Funktioner vælges Sprogredigering….
  2. I dialogboksen Sprogredigering skal du klikke på Ny….
  3. I dialogboksen Nyt sprog eller gruppe skal du vælge Oprette et nyt sprog baseret på et eksisterende, og vælg det ønskede sprog på rullelisten nedenfor. Klik OK.
  4. I dialogboksen Sprogegenskaber angives egenskaber for det nye OCR sprog.
    1. Sprognavn — Indtast et navn for dit OCR sprog i dette felt.
    2. Kildenavn — Sproget dit nye OCR sprog skal baseres på. (Viser det sprog du valgte i dialogboksen Nyt sprog eller gruppe. Klik på pilen i højre side for at vælge et andet sprog.)
    3. Alfabet — Viser tegn i kildesprogets alfabet. Klik på Finereader dotbutton Oprettelse af et OCR sprog for at tilføje eller fjerne tegn.
    4. Ordbog — Ordbogen som ABBYY FineReader vil anvende for at udføre OCR på dine dokumenter og for at tjekke den genkendte tekst. De følgende indstillinger er tilgængelige:

      • Ingen
        Ingen ordbog bliver anvendt.
      • Indbygget ordbog
        Ordbogen leveret med ABBYY FineReader bliver anvendt.
      • Brugerordbog
        En brugerordbog bliver anvendt. Klik på knappen Redigere… for at tilføje ord i ordbogen eller importere en eksisterende brugerordbog eller tekst i Windows (ANSI) eller Unicode-kodning. Ordene i den tekstfil, du vil importere, skal være adskilt af mellemrum eller andre ikke-alfabetiske tegn.

        Bemærkning. Ordene fra brugerordbogen kan forekomme i den genkendte tekst med følgende skrivning af store og små bogstaver: 1) kun små bogstaver, 2) kun store bogstaver, 3) Første bogstav stort, 4) som stavet i brugerordbogen. De fire muligheder er opsummeret i tabellen nedenfor.

        Ord som stavet i ordbogen Mulige forekomster af ordet i teksten
        abc abc, Abc, ABC
        Abc abc, Abc, ABC
        ABC abc, Abc, ABC
        aBc aBc, abc, Abc, ABC
      • Almindeligt udtryk
        Du kan anvendeet almindeligt udtryk til at oprette et nyt sprog.
        Finereader listpicture Oprettelse af et OCR sprog For detaljer, se Almindelige udtryk.
    5. Avanceret… — Åbner dialogboksen Avancerede egenskaber for sprog, hvor du kan angive mere avancerede egenskaber for dit sprog:

      • Ikke-bogstavstegn, der kan fremkomme i begyndelsen eller slutningen af ord
      • Enkeltstående ikke-bogstavstegn (punktummer mv.)
      • Tegn, der skal ignoreres, hvis de fremkommer indeni ord.
      • Ikke-tilladte tegn, der aldrig må fremkomme i tekster skrevet i dette sprog
      • Alle de tegn for sproget der skal genkendes
      • Teksten kan indeholde arabiske tal, romertal og forkortelser.
  5. Når du har afsluttet oprettelsen af dit nye sprog, skal du vælge det som genkendelsessprog for dit dokument.

    Finereader listpicture Oprettelse af et OCR sprog Yderligere oplysninger finder du i Dokumentsprog.

Som standard gemmes brugersprog i dokumentmappen i ABBYY FineReader. For at ændre denne mappe skal du vælge Funktioner>Indstillinger…, klikke på fanen Avanceret og angive en ny mappe under Brugersprogmappe.

Oprettelse af et OCR sprog