Optikai szövegfelismerési nyelv létrehozása

Egy dokumentum optikai szövegfelismerése során az ABBYY FineReader felhasznál néhány információt a dokumentum nyelvéről (ezt a nyelvet a Dokumentum ablakban a Dokumentum nyelvei legördülő listából választhatja ki). Ha túl sok szokatlan rövidítés vagy szó fordul elő a szövegben, akkor lehet, hogy a program nem ismeri fel őket pontosan. Ebben az esetben saját felismerési nyelvet hozhat létre ehhez a dokumentumhoz.

  1. Az Eszközök menüben kattintson a Nyelvszerkesztő… menüpontra.
  2. A Nyelvszerkesztő párbeszédpanelen kattintson az Új… gombra.
  3. Az Új nyelv vagy csoport párbeszédpanelen jelölje be az Új nyelvet hozok létre egy meglévő alapján beállítást, s az alatta lévő legördülő listából válassza ki a használni kívánt nyelvet. Nyomja meg az OK gombot.
  4. A Nyelv tulajdonságai párbeszédpanelen adja meg az új felismerési nyelv tulajdonságait.
    1. A nyelv neve — Ebbe a mezőbe írja be a felismerési nyelv nevét.
    2. Forrásnyelv — A nyelv, mely az új felismerési nyelv alapja lesz. (Az Új nyelv vagy csoport párbeszédpanelen kiválasztott nyelvet mutatja. Kattintson a jobb oldalt látható nyílra, ha másik nyelvet kíván kiválasztani.)
    3. Ábécé — A forrásnyelv ábécéjének betűit listázza ki. Karakterek hozzáadásához vagy eltávolításához kattintson a Finereader dotbutton Optikai szövegfelismerési nyelv létrehozása gombra.
    4. Szótár — Az ABBYY FineReader által felhasználandó szótár a dokumentum optikai szövegfelismerése és a felismert szöveg helyesírásának ellenőrzése során. Az alábbi lehetőségek állnak rendelkezésre:

      • Nincs
        Egy szótár sem kerül felhasználásra.
      • Beépített szótár
        Az ABBYY FineReaderhez adott szótár kerül felhasználásra.
      • Felhasználói szótár
        Egy felhasználói szótár kerül felhasználásra. Nyomja meg a Szerkesztés… gombot, ha szavakat kíván felvenni a szótárba, vagy egy meglévő felhasználói szótárat, ill. egy Windows (ANSI) vagy Unicode kódolású szövegfájlt akar importálni. Az importálni kívánt szövegfájlban szóközzel vagy más, nem betű karakterrel kell a szavakat elválasztania.

        Megjegyzés: A felhasználói szótárban szereplő szavak a felismert szövegben a következő írásmódokkal fordulhatnak elő: 1) csak kisbetűk, 2) CSAK NAGYBETŰK, 3) Az Első Betű Nagybetű, 4) a felhasználói szótár írásmódja szerint. A négy lehetőséget az alábbi táblázatban összegezzük.

        A felhasználói szótár írásmódja szerint A szó lehetséges előfordulásai a szövegben
        abc abc, Abc, ABC
        Abc abc, Abc, ABC
        ABC abc, Abc, ABC
        aBc aBc, abc, Abc, ABC
      • Reguláris kifejezés
        Az új nyelvet reguláris kifejezéssel is létrehozhatja.
        Finereader listpicture Optikai szövegfelismerési nyelv létrehozása Részletek a Reguláris kifejezések témakörben.
    5. Speciális… — Megnyitja Nyelv speciális tulajdonságai párbeszédpanelt, ahol megadhatja a nyelv több speciális tulajdonságát:

      • A szavak elején vagy végén előforduló nem betű karaktereket
      • Az önálló, nem betű karaktereket (írásjelek, stb.)
      • A figyelmen kívül hagyandó karaktereket, ha szavakban fordulnak elő
      • Az ilyen nyelvű szövegekben lehet, hogy sohasem előforduló tiltott karakterek
      • A nyelv mindazon karaktereit, melyek felismerésre fognak kerülni
      • A szöveg tartalmazhat arab és római számokat, ill. rövidítéseket
  5. Az új nyelv létrehozása után válassza ki azt a dokumentum felismerési nyelveként.

    Finereader listpicture Optikai szövegfelismerési nyelv létrehozása Részletek A dokumentum nyelvei témakörben.

A felhasználói nyelvek alapértelmezésként az ABBYY FineReader-dokumentum mappájában kerülnek mentésre. A mappa átváltásához kattintson az Eszközök>Beállítások… menüpontra, váltson át a Speciális fülre, és a Felhasználói nyelvek mappája részben adja meg az új mappa elérési útját.

Optikai szövegfelismerési nyelv létrehozása