Tworzenie języka OCR

Przy wykonywaniu rozpoznawania OCR dokumentu program ABBYY FineReader korzysta z informacji na temat języka dokumentu (język ten należy wybrać z listy rozwijanej Języki dokumentu w oknie Dokument). Jeśli w tekście znajduje się dużo nietypowych skrótów lub wyrazów, program może nie rozpoznać ich poprawnie. W tym przypadku może być wymagane utworzenie własnego języka rozpoznawania dla dokumentu.

  1. W menu Narzędzia wybierz polecenie Edytor języków….
  2. W otwartym oknie dialogowym Edytor języka kliknij przycisk Nowy….
  3. W otwartym oknie dialogowym Nowy język lub grupa wybierz opcję Utworzyć nowy język na bazie istniejącego i z listy rozwijanej poniżej wybierz żądany język. Kliknij OK
  4. W otwartym oknie dialogowym Właściwości języka określ właściwości nowego języka OCR.
    1. Nazwa języka – w tym polu wpisz nazwę języka OCR.
    2. Język źródłowy – określa język, na podstawie którego zostanie utworzony nowy język OCR. (Wyświetla język wybrany w oknie dialogowym Nowy język lub grupa. Kliknij strzałkę z prawej strony, aby zmienić język.)
    3. Alfabet - zawiera listę liter języka źródłowego. Kliknij przycisk Finereader dotbutton Tworzenie języka OCR, aby dodać lub usunąć litery.
    4. Słownik – słownik, którego program ABBYY FineReader użyje podczas rozpoznawania OCR dokumentu oraz sprawdzania rozpoznanego tekstu. Dostępne są następujące opcje:

      • Brak
        Nie będzie używany żaden słownik.
      • Słownik wbudowany
        Będzie używany słownik dostarczony z programem ABBYY FineReader.
      • Słownik użytkownika
        Będzie używany słownik użytkownika. Kliknij przycisk Edytuj…, jeśli chcesz dodać wyrazy do słownika lub zaimportować istniejący słownik użytkownika, albo plik tekstowy w kodowaniu Windows (ANSI) lub Unicode. Wyrazy w importowanym pliku tekstowym muszą być oddzielone spacjami lub innymi znakami spoza alfabetu.

        Uwaga: Wyrazy ze słownika użytkownika mogą występować w rozpoznanym tekście tylko w następujących formach: 1) tylko małe litery, 2) tylko wielkie litery, 3) pierwsza wielka litera, 4) zgodnie z pisownią w słowniku użytkownika. W poniższej tabeli zostały przedstawione cztery możliwości.

        Wyraz zgodnie z pisownią w słowniku użytkownika. Możliwe wystąpienia wyrazu w tekście
        abc abc, Abc, ABC
        Abc abc, Abc, ABC
        ABC abc, Abc, ABC
        aBc aBc, abc, Abc, ABC
      • Wyrażenie regularne
        Można użyćwyrażenia regularnego do utworzenia nowego języka.
        Finereader listpicture Tworzenie języka OCR Szczegółowe informacje są dostępne w rozdziale Wyrażenia regularne.
    5. Zaawansowane… – Otwiera okno dialogowe Zaawansowane właściwości języka, w którym można określić zaawansowane właściwości języka:

      • Znaki spoza alfabetu, które mogą występować na początku lub końcu słów
      • Samodzielne znaki spoza alfabetu (przestankowe itp.)
      • Znaki, które należy pominąć wewnątrz słów
      • Znaki zabronione, które nie mogą wystąpić w tekstach pisanych w tym języku
      • Rozpoznane zostaną wszystkie znaki tego języka
  5. Po zakończeniu tworzenia nowego języka wybierz go jako język rozpoznawania dla dokumentu.

    Finereader listpicture Tworzenie języka OCR Szczegółowe informacje są dostępne w rozdziale Języki dokumentu.

Domyślnie języki użytkownika są zapisywane w folderze dokumentu programu ABBYY FineReader. Aby zmienić ten folder, wybierz menu Narzędzia>Opcje…, kliknij kartę Zaawansowane i określ nowy folder w obszarze Folder języków użytkownika.

Tworzenie języka OCR