OCR 언어 만들기

문서에 OCR을 수행할 때 ABBYY FineReader는 문서 언어 정보를 사용합니다(이 언어는 문서 창의 문서 언어 드롭다운 목록에서 선택한 언어이어야 함). 이상한 약어나 단어가 텍스트에 너무 많으면 제대로 인식하지 못할 수 있습니다. 이런 경우 해당 문서에 대한 고유한 인식 언어를 만들 수 있습니다.

  1. 도구 메뉴에서 언어 편집기…를 선택합니다.
  2. 언어 편집기 대화 상자에서 새로 만들기…를 클릭합니다.
  3. 새 언어 또는 그룹 대화 상자에서 기존 언어를 바탕으로 새 언어 만들기를 선택하고 아래 드롭다운 목록에서 원하는 언어를 선택합니다. 확인을 클릭합니다.
  4. 언어 속성 대화 상자에서 새 OCR 언어의 속성을 지정합니다.
    1. 언어 이름 — 이 필드에 OCR 언어 이름을 입력합니다.
    2. 원본 언어 — 새 OCR 언어의 기본 언어입니다. (선택한 언어가 새 언어 또는 그룹 대화 상자에 표시됩니다. 다른 언어를 선택하려면 오른쪽의 화살표를 클릭합니다.)
    3. 알파벳 — 원본 언어의 알파벳 문자를 나열합니다. 문자를 추가하거나 제거하려면 Finereader dotbutton OCR 언어 만들기을 클릭하십시오.
    4. 사전 — 문서에 OCR을 수행하고 인식된 텍스트를 확인하기 위해 ABBYY FineReader에서 사용하는 사전입니다. 다음 옵션을 사용할 수 있습니다.

      • 없음
        사용할 수 있는 사전이 없습니다.
      • 기본 제공 사전
        ABBYY FineReader에 기본적으로 제공되는 사전이 사용됩니다.
      • 사용자 사전
        사용자 사전이 사용됩니다. 편집… 단추를 클릭하여 단어를 사전에 추가하거나 기존 사용자 사전 또는 Windows (ANSI) 또는 유니코드 인코딩 형식으로 텍스트 파일을 가져옵니다. 가져올 텍스트 파일의 단어는 공백이나 알파벳이 아닌 문자로 구분되어 있어야 합니다.

        참고. 사용자 사전의 단어는 사용자 사전에서 1) 소문자로만, 2) 대문자로만, 3) 첫 문자가 대문자로, 4) 등록된 대로와 같은 범주의 인식된 텍스트에 포함될 수 있습니다. 이런 4가지의 가능성은 아래 표에 요약되어 있습니다.

        사용자 사전에 등록된 상태의 단어 텍스트 내에 발생 가능한 단어
        abc abc, Abc, ABC
        Abc abc, Abc, ABC
        ABC abc, Abc, ABC
        aBc aBc, abc, Abc, ABC
      • 정규식
        정규식을 사용하여 새 언어를 만들 수 있습니다.
        Finereader listpicture OCR 언어 만들기 자세한 내용은 정규식을 참조하십시오.
    5. 고급… — 고급 언어 속성 대화 상자를 엽니다. 여기에서 언어에 대한 고급 속성을 다양하게 지정할 수 있습니다.

      • 단어 앞뒤에 올 수 있는 비문자 기호
      • 독립형 비문자 기호(구두점 등)
      • 단어에 포함된 경우 무시되는 문자
      • 이 언어로 기록된 텍스트에 절대로 있어서는 안 되는 금지 문자
      • 인식되는 언어의 모든 문자
      • 텍스트에 아랍 숫자, 로마 숫자 및 약어가 포함될 수 있습니다.
  5. 새 언어를 만들었으면 이 언어를 문서의 인식 언어로 선택합니다.

    Finereader listpicture OCR 언어 만들기 자세한 내용은 문서 언어를 참조하십시오.

기본적으로 사용자 언어는 ABBYY FineReader 문서 폴더에 저장됩니다. 이 폴더를 변경하려면 도구>옵션…을 선택한 후 고급 탭을 클릭한 다음 사용자 언어 폴더에서 새 폴더를 지정합니다.

OCR 언어 만들기