Crear un idioma de OCR

Al realizar el reconocimiento sptico de caracteres en un documento, ABBYY FineReader utiliza informacisn acerca del idioma del documento, idioma que debe seleccionarse en la lista desplegable Idiomas de documento de la ventana Documento. Si hay demasiadas abreviaturas o palabras poco comunes en el texto, es posible que el programa no pueda reconocerlos correctamente. De ser asm, le recomendamos crear su propio idioma de reconocimiento para este documento.

  1. En el menz Herramientas, seleccione Editor de idiomas.
  2. En el cuadro de dialogo Editor de idiomas, haga clic en Nuevo.
  3. En el cuadro de dialogo Nuevo idioma o grupo, seleccione Crear un nuevo idioma basado en uno existente y, en la lista desplegable que aparece debajo, seleccione el idioma deseado. Haga clic en Aceptar.
  4. En el cuadro de dialogo Propiedades de idioma, especifique las propiedades del nuevo idioma de reconocimiento sptico de caracteres.
    1. Nombre de idioma: en este campo, escriba un nombre para el idioma de OCR.
    2. Idioma de origen: idioma en el cual se basara el nuevo idioma de OCR. (El idioma seleccionado se muestra en el cuadro de dialogo Nuevo idioma o grupo. Haga clic en la flecha ubicada a la derecha para seleccionar un idioma diferente.)
    3. Alfabeto: enumera los caracteres del alfabeto del idioma de origen. Haga clic en Finereader dotbutton Crear un idioma de OCR para agregar o eliminar caracteres.
    4. Diccionario: diccionario que utilizara ABBYY FineReader para realizar el reconocimiento sptico de caracteres en el documento y revisar la ortografma del texto reconocido. Puede elegir entre las siguientes opciones:

      • Ninguno
        No se usara ningzn diccionario.
      • Diccionario incorporado
        Se usara el diccionario suministrado con ABBYY FineReader.
      • Diccionario de usuario
        Se usara un diccionario de usuario. Haga clic en el botsn Editar si desea agregar palabras al diccionario o importar un diccionario de usuario existente o un archivo de texto con codificacisn Windows (ANSI) o Unicode. Las palabras del archivo de texto que desee importar deben estar separadas por espacios u otros caracteres no alfabiticos.

        Nota: Las palabras del diccionario de usuario pueden aparecer en el texto reconocido como: 1) sslo minzsculas, 2) sslo mayzsculas, 3) primera letra en mayzscula, 4) tal como aparecen en el diccionario de usuario. Las cuatro posibilidades se resumen en la tabla que figura a continuacisn.

        Palabra tal y como aparece en el diccionario de usuario Posibles ocurrencias de la palabra en el texto
        abc abc, Abc, ABC
        Abc abc, Abc, ABC
        ABC abc, Abc, ABC
        aBc aBc, abc, Abc, ABC
      • Expresisn regular
        : puede utilizaruna expresisn regular para crear un nuevo idioma.
        Finereader listpicture Crear un idioma de OCR Para obtener mas detalles, consulte Expresiones regulares.
    5. Avanzada: abre el cuadro de dialogo Propiedades avanzadas de idioma, en el que puede especificar mas propiedades avanzadas para el idioma:

      • Caracteres no alfabiticos que puedan aparecer al inicio o al final de las palabras
      • Caracteres no alfabiticos independientes (signos de puntuacisn, etc.)
      • Caracteres que deben ignorarse si aparecen dentro de palabras
      • Caracteres prohibidos que nunca pueden aparecer en textos escritos en este idioma
      • Todos los caracteres del idioma que se reconocera
      • El texto puede contener nzmeros arabigos, nzmeros romanos y abreviaturas.
  5. Una vez que haya acabado de crear el nuevo idioma, seleccisnelo como idioma de reconocimiento del documento.

    Finereader listpicture Crear un idioma de OCR Para obtener mas detalles, consulte Idiomas de documento.

De manera predeterminada, los idiomas de usuario se guardan en la carpeta de documentos de ABBYY FineReader. Para cambiar esta carpeta, seleccione Herramientas>Opciones, haga clic en la ficha Avanzada y especifique una nueva carpeta en Carpeta de idiomas de usuario.

Crear un idioma de OCR