Vytvoření jazyka OCR

Během provádění funkce OCR v dokumentu aplikace ABBYY FineReader používá některé informace o jazyku dokumentu (tento jazyk by měl být vybrán v rozevíracím seznamu Jazyky dokumentu v okně Dokument). Pokud je v textu příliš mnoho neobvyklých zkratek nebo slov, nemusí je program rozpoznat správně. V tom případě může být vhodné pro tento dokument vytvořit vlastní jazyk rozpoznávání.

  1. V nabídce Nástroje vyberte položku Jazykový editor….
  2. V otevřeném dialogovém okně Jazykový editor klepněte na položku Nový….
  3. V dialogovém okně Nový jazyk nebo skupina zvolte Vytvořit nový jazyk na základě existujícího jazyka a v níže uvedeném rozevíracím seznamu požadovaný jazyk vyberte. Klepněte na OK.
  4. V dialogovém okně Vlastnosti jazyků určete vlastnosti nového jazyka OCR.
    1. Název jazyka – Do tohoto pole zadejte název jazyka OCR.
    2. Zdrojový jazyk – Jazyk, na jehož základě bude vytvořen nový jazyk OCR. (Zobrazí jazyk vybraný v dialogovém okně Nový jazyk nebo skupina. Pokud chcete vybrat jiný jazyk, klepněte na šipku vpravo.)
    3. Abeceda – Uvádí znaky abecedy vybraného zdrojového jazyka. Klepnutím na tlačítko Finereader dotbutton Vytvoření jazyka OCR přidejte nebo odeberte znaky.
    4. Slovník – Slovník, který aplikace ABBYY FineReader použije k provádění rozpoznávání OCR na dokumentu a ke kontrole rozpoznaného textu. K dispozici jsou následující možnosti:

      • Žádné
        Nebude použit žádný slovník.
      • Vestavěný slovník
        Bude použit slovník dodaný s aplikací ABBYY FineReader.
      • Uživatelský slovník
        Bude použit uživatelský slovník. Pokud chcete přidat slova do slovníku nebo importovat existující uživatelský slovník nebo textový souboru v kódování Windows (ANSI) nebo Unicode, klepněte na Upravit…. Slova v textovém souboru, který chcete importovat, musí být oddělena mezerami nebo jinými neabacedními znaky.

        Poznámka.Slova z uživatelského slovníku se mohou v rozpoznaném textu objevit s následující velikostí písmen: 1) pouze malá písmena, 2) pouze velká písmena, 3) první velké písmeno,  4) jako v uživatelském slovníku. Tyto čtyři možnost shrnuje níže uvedená tabulka.

        Slovo napsané jako v uživatelském slovníku Možné výskyty slova v textu
        abc abc, Abc, ABC
        Abc abc, Abc, ABC
        ABC abc, Abc, ABC
        aBc aBc, abc, Abc, ABC
      • Běžný výraz
        Regulární výraz lze použít k vytvoření nového jazyka.
        Finereader listpicture Vytvoření jazyka OCR Podrobnosti naleznete v části Regulární výrazy.
    5. Zdokonalený… – Otevře dialogové okno Zdokonalené vlastnosti jazyka, v němž můžete určit další rozšířené vlastnosti svého jazyka:

      • nepísmenné znaky, které se mohou objevit na začátku nebo na konci slov,
      • samostatné nepísmenné znaky (interpunkční znaménka apod.),
      • ignorování znaků uprostřed slova
      • zakázané znaky, které se nesmí objevit v textu napsaném v tomto jazyce,
      • všechny znaky jazyka, který bude rozpoznáván.
      • Text může obsahovat arabské číslice, římské číslice a zkratky.
  5. Nově vytvořený jazyk vyberte jako jazyk rozpoznávání dokumentu.

    Finereader listpicture Vytvoření jazyka OCRPodrobnosti naleznete v částiJazyky dokumentu.

Ve výchozím nastavení jsou uživatelské jazyky uloženy ve složce dokumentů aplikace ABBYY FineReader. Chcete-li složku změnit, vyberte položky Nástroje>Možnosti…, klepněte na kartu Pokročilé nastavení a určete novou složku v nabídce Složka jazyků uživatele.

Vytvoření jazyka OCR