Tworzenie języka OCR

Przy wykonywaniu rozpoznawania OCR dokumentu program ABBYY FineReader korzysta z informacji na temat języka dokumentu (język ten należy wybrać z listy rozwijanej Języki dokumentu w oknie Dokument). Jeśli w tekście znajduje się dużo nietypowych skrótów lub wyrazów, program może nie rozpoznać ich poprawnie. W tym przypadku może być wymagane utworzenie własnego języka rozpoznawania dla dokumentu.

 1. W menu Narzędzia wybierz polecenie Edytor języków….
 2. W otwartym oknie dialogowym Edytor języka kliknij przycisk Nowy….
 3. W otwartym oknie dialogowym Nowy język lub grupa wybierz opcję Utworzyć nowy język na bazie istniejącego i z listy rozwijanej poniżej wybierz żądany język. Kliknij OK
 4. W otwartym oknie dialogowym Właściwości języka określ właściwości nowego języka OCR.
  1. Nazwa języka – w tym polu wpisz nazwę języka OCR.
  2. Język źródłowy – określa język, na podstawie którego zostanie utworzony nowy język OCR. (Wyświetla język wybrany w oknie dialogowym Nowy język lub grupa. Kliknij strzałkę z prawej strony, aby zmienić język.)
  3. Alfabet - zawiera listę liter języka źródłowego. Kliknij przycisk Finereader dotbutton Tworzenie języka OCR, aby dodać lub usunąć litery.
  4. Słownik – słownik, którego program ABBYY FineReader użyje podczas rozpoznawania OCR dokumentu oraz sprawdzania rozpoznanego tekstu. Dostępne są następujące opcje:

   • Brak
    Nie będzie używany żaden słownik.
   • Słownik wbudowany
    Będzie używany słownik dostarczony z programem ABBYY FineReader.
   • Słownik użytkownika
    Będzie używany słownik użytkownika. Kliknij przycisk Edytuj…, jeśli chcesz dodać wyrazy do słownika lub zaimportować istniejący słownik użytkownika, albo plik tekstowy w kodowaniu Windows (ANSI) lub Unicode. Wyrazy w importowanym pliku tekstowym muszą być oddzielone spacjami lub innymi znakami spoza alfabetu.

    Uwaga: Wyrazy ze słownika użytkownika mogą występować w rozpoznanym tekście tylko w następujących formach: 1) tylko małe litery, 2) tylko wielkie litery, 3) pierwsza wielka litera, 4) zgodnie z pisownią w słowniku użytkownika. W poniższej tabeli zostały przedstawione cztery możliwości.

    Wyraz zgodnie z pisownią w słowniku użytkownika. Możliwe wystąpienia wyrazu w tekście
    abc abc, Abc, ABC
    Abc abc, Abc, ABC
    ABC abc, Abc, ABC
    aBc aBc, abc, Abc, ABC
   • Wyrażenie regularne
    Można użyćwyrażenia regularnego do utworzenia nowego języka.
    Finereader listpicture Tworzenie języka OCR Szczegółowe informacje są dostępne w rozdziale Wyrażenia regularne.
  5. Zaawansowane… – Otwiera okno dialogowe Zaawansowane właściwości języka, w którym można określić zaawansowane właściwości języka:

   • Znaki spoza alfabetu, które mogą występować na początku lub końcu słów
   • Samodzielne znaki spoza alfabetu (przestankowe itp.)
   • Znaki, które należy pominąć wewnątrz słów
   • Znaki zabronione, które nie mogą wystąpić w tekstach pisanych w tym języku
   • Rozpoznane zostaną wszystkie znaki tego języka
 5. Po zakończeniu tworzenia nowego języka wybierz go jako język rozpoznawania dla dokumentu.

  Finereader listpicture Tworzenie języka OCR Szczegółowe informacje są dostępne w rozdziale Języki dokumentu.

Domyślnie języki użytkownika są zapisywane w folderze dokumentu programu ABBYY FineReader. Aby zmienić ten folder, wybierz menu Narzędzia>Opcje…, kliknij kartę Zaawansowane i określ nowy folder w obszarze Folder języków użytkownika.

Tworzenie języka OCR