Δημιουργία γλώσσας OCR

Κατά την εκτέλεση της οπτικής αναγνώρισης χαρακτήρων σε ένα έγγραφο, το ABBYY FineReader χρησιμοποιεί ορισμένες πληροφορίες σχετικά με τη γλώσσα του εγγράφου (αυτή η γλώσσα θα πρέπει να επιλεγεί από την αναπτυσσόμενη λίστα Γλώσσες εγγράφου στο παράθυρο Έγγραφο). Εάν υπάρχει υπερβολικά μεγάλο πλήθος ασυνήθιστών συντομογραφιών ή κειμένων στο κείμενο, το πρόγραμμα ενδέχεται να μην τις αναγνωρίσει σωστά. Σε αυτή την περίπτωση, μπορεί να θελήσετε να δημιουργήσετε τη δική σας γλώσσα αναγνώρισης για το έγγραφο αυτό.

  1. Από το μενού Εργαλεία, επιλέξτε Επεξεργαστής γλώσσας….
  2. Στο πλαίσιο διαλόγου Επεξεργαστής γλώσσας, κάντε κλικ στην επιλογή Νέο….
  3. Στο πλαίσιο διαλόγου Νέα γλώσσα ή ομάδα, επιλέξτε Δημιουργία νέας γλώσσας με βάση μια υπάρχουσα γλώσσα και από την παρακάτω αναπτυσσόμενη λίστα, επιλέξτε την επιθυμητή γλώσσα. Κάντε κλικ στην επιλογή OK.
  4. Κάντε κλικ στην επιλογή Ιδιότητες γλώσσας, καθορίστε τις ιδιότητες της νέας γλώσσας OCR.
    1. Όνομα γλώσσας — Πληκτρολογήστε ένα όνομα για τη γλώσσα OCR σε αυτό το πεδίο.
    2. Γλώσσα πηγή — Η γλώσσα στην οποία θα βασίζεται η νέα σας γλώσσα OCR. (Εμφανίζει τη γλώσσα που επιλέξατε στο πλαίσιο διαλόγου Νέα γλώσσα ή ομάδα. Κάντε κλικ στο βέλος της δεξιάς πλευράς για να επιλέξετε μια διαφορετική γλώσσα.)
    3. Αλφάβητο — Εμφανίζει τη λίστα των χαρακτήρων του αλφαβήτου της γλώσσας πηγής. Κάντε κλικ στην επιλογή Finereader dotbutton Δημιουργία γλώσσας OCR για να προσθέσετε ή να καταργήσετε χαρακτήρες.
    4. Λεξικό — Το λεξικό που θα χρησιμοποιήσει το ABBYY FineReader για την εκτέλεση της οπτικής αναγνώρισης χαρακτήρων στο έγγραφό σας και για τον έλεγχο του αναγνωρισμένου κειμένου. Διατίθενται οι ακόλουθες επιλογές:

      • Κανένα
        Δεν θα χρησιμοποιηθεί κανένα λεξικό.
      • Ενσωματωμένο λεξικό
        Θα χρησιμοποιηθεί το λεξικό που παρέχεται με το ABBYY FineReader.
      • Λεξικό χρήστη
        Θα χρησιμοποιηθεί ένα λεξικό χρήστη. Κάντε κλικ στο πλήκτρο Επεξεργασία… για να προσθέσετε λέξεις στο λεξικό ή για να εισάγετε ένα υπάρχον λεξικό χρήστη ή ένα αρχείο κειμένου σε κωδικοποίηση Windows (ANSI) ή Unicode. Οι λέξεις στο αρχείο κειμένου που επιθυμείτε να εισάγετε πρέπει να διαχωρίζονται με διαστήματα ή άλλους μη αλφαβητικούς χαρακτήρες.

        Σημείωση. Οι λέξεις από το λεξικό χρήστη μπορεί να εμφανίζονται στο αναγνωρισμένο κείμενο με τα ακόλουθα πεζά ή κεφαλαία γράμματα: 1) μόνο πεζά, 2) μόνο κεφαλαία, 3) με το πρώτο γράμμα κεφαλαίο, 4) σύμφωνα με την ορθογραφία του λεξικού χρήστη. Οι τέσσερις πιθανότητες συνοψίζονται στον παρακάτω πίνακα.

        Λέξεις σύμφωνα με την ορθογραφία του λεξικού χρήστη Πιθανές εμφανίσεις της λέξεις στο κείμενο
        αβγ αβγ, Αβγ, ΑΒΓ
        Αβγ αβγ, Αβγ, ΑΒΓ
        ΑΒΓ αβγ, Αβγ, ΑΒΓ
        αΒγ αΒγ, αβγ, Αβγ, ΑΒΓ
      • Κανονική έκφραση
        Μπορείτε να χρησιμοποιήσετε μια κανονική έκφραση για να δημιουργήσετε μια νέα γλώσσα.
        Finereader listpicture Δημιουργία γλώσσας OCR Για λεπτομέρειες, δείτε Κανονικές εκφράσεις.
    5. Προηγμένη… — Ανοίγει το πλαίσιο διαλόγου Προηγμένες ιδιότητες γλώσσας , όπου μπορείτε να καθορίσετε προηγμένες ιδιότητες για τη γλώσσα σας:

      • Χαρακτήρες εκτός γραμμάτων οι οποίοι μπορεί να εμφανίζονται στην αρχή ή στο τέλος των λέξεων
      • Αυτόνομοι χαρακτήρες εκτός γραμμάτων (σημεία στίξης, κλπ.)
      • Χαρακτήρες που θα αγνοούνται εάν εμφανίζονται στο εσωτερικό των λέξεων
      • Απαγορευμένοι χαρακτήρες που ενδέχεται να μην εμφανιστούν ποτέ στα κείμενα τα οποία είναι γραμμένα σε αυτή τη γλώσσα
      • Όλοι οι χαρακτήρες της γλώσσας που θα αναγνωριστεί
      • Το κείμενο ενδέχεται να περιέχει Αραβικά αριθμητικά ψηφία, Λατινικά αριθμητικά ψηφία και συντομογραφίες.
  5. Όταν ολοκληρώσετε τη δημιουργία της νέας σας γλώσσας, επιλέξτε την ως τη γλώσσα αναγνώρισης για το έγγραφό σας.

    Finereader listpicture Δημιουργία γλώσσας OCR Για λεπτομέρειες, δείτε Γλώσσες εγγράφου.

Σύμφωνα με τις προεπιλεγμένες ρυθμίσεις, οι γλώσσες χρήστη αποθηκεύονται στο φάκελο του εγγράφου ABBYY FineReader. Για να αλλάξετε αυτό το φάκελο, επιλέξτε Εργαλεία&g
t;Επιλογές…
, κάντε κλικ στην καρτέλα Προηγμένη και καθορίστε ένα νέο φάκελο στο Φάκελος γλωσσών χρήστη.

Δημιουργία γλώσσας OCR