Creazione di una lingua di riconoscimento

Durante l’esecuzione del riconoscimento, ABBYY FineReader si serve di informazioni relative alla lingua del documento (la lingua dovrà essere selezionata nell’elenco a discesa Lingue del documento, nella finestra Documento). Se il testo contiene un numero eccessivo di abbreviazioni o di parole insolite, il programma potrebbe non riconoscerle correttamente. In tal caso è possibile creare una lingua personalizzata per il riconoscimento del documento.

  1. Nel menu Strumenti, selezionare Editor lingue….
  2. Fare clic su Nuovo… nella finestra di dialogo Editor lingue.
  3. Nella finestra di dialogo Nuova lingua o gruppo, selezionare Crea nuova lingua basata su una esistente, quindi selezionare la lingua desiderata nell’elenco a discesa. Fare clic su OK.
  4. Nella finestra di dialogo Proprietà lingua indicare le proprietà della nuova lingua di riconoscimento.
    1. Nome lingua – In questo campo, immettere un nome per la lingua di riconoscimento
    2. Lingua di origine - Si tratta della lingua su cui si basa la nuova lingua di riconoscimento. (Consente di visualizzare la lingua selezionata nella finestra di dialogo Nuova lingua o gruppo. Fare clic sulla freccia destra per selezionare un’altra lingua.)
    3. Alfabeto - Elenca i caratteri dell’alfabeto della lingua di origine. Fare clic su Finereader dotbutton Creazione di una lingua di riconoscimento per aggiungere o rimuovere i caratteri.
    4. Dizionario - Il dizionario utilizzato da ABBYY FineReader per il riconoscimento del documento e per il controllo del testo riconosciuto. Sono disponibili le opzioni seguenti:

      • Nessuno
        Non verrà utilizzato alcun dizionario.
      • Dizionario incorporato
        Verrà utilizzato il dizionario fornito con ABBYY FineReader.
      • Dizionario utente
        Verrà utilizzato un dizionario utente. Fare clic sul pulsante Modifica… per aggiungere parole al dizionario, o per importare un dizionario utente già esistente o un file di testo con codifica Windows (ANSI) o Unicode. Le parole contenute nel file di testo da importare dovranno essere separate da spazi o da altri caratteri non alfabetici.

        Nota. Le parole contenute nel dizionario utente potrebbero figurare nel testo riconosciuto con le seguenti caratteristiche: 1) solo minuscolo, 2) solo maiuscolo, 3) prima lettera maiuscola, 4) come nel dizionario utente. Le quattro possibilità sono riassunte nella tabella riportata di seguito.

        Parola come da dizionario utente Possibili occorrenze della parola del testo
        abc abc, Abc, ABC
        Abc abc, Abc, ABC
        ABC abc, Abc, ABC
        aBc aBc, abc, Abc, ABC
      • Espressione regolare
        È possibile servirsi di un’espressione regolare per la creazione di una nuova lingua.
        Finereader listpicture Creazione di una lingua di riconoscimento Per ulteriori informazioni consultare la sezione Espressioni regolari.
    5. Avanzate… - Consente di aprire la finestra di dialogo Proprietà avanzate lingua, nella quale è possibile specificare proprietà avanzate per la lingua:

      • Caratteri non alfabetici che possono presentarsi all’inizio o alla fine delle parole
      • Caratteri non alfabetici indipendenti (punti esclamativi, ecc.)
      • Caratteri da ignorare se si trovano all’interno di parole
      • Caratteri non consentiti che potrebbero non essere presenti nei testi redatti in questa lingua
      • Tutti i caratteri della lingua da riconoscere
      • Il testo può contenere numeri arabi, numeri romani e abbreviazioni
  5. Una volta creata la nuova lingua, selezionarla come lingua di riconoscimento per il documento.

    Finereader listpicture Creazione di una lingua di riconoscimento Per ulteriori informazioni consultare la sezione Lingue del documento.

Per impostazione predefinita, le lingue vengono salvate nella cartella documenti di ABBYY FineReader. Per utilizzare una cartella diversa, selezionare Strumenti>Opzioni…, fare clic sulla scheda Avanzate e specificare una nuova cartella in Cartella lingue definite dall’utente.

Creazione di una lingua di riconoscimento