Glossar

A B C D E F H I L M N O P S T U Z

A

ABBYY FineReader-Dokument – Ein Objekt, dass durch die ABBYY FineReader Software erstellt wurde, um ein Ausgangsdokument mit der Strukturanalyse zu bearbeiten. Es enthält Seitenbilder mit dem entsprechend erkannten Text (falls vorhanden) und Programmeinstellungen (Scannen, Erkennung, Speicheroptionen, etc.).

ABBYY Hot Folder – Ein Planungs-Agent, mit dem Sie einen Ordner mit Bildern und den Verarbeitungszeitpunkt für diese gespeicherten Bilder festlegen können. Die Bilder im Ordner werden dann zum angegebenen Zeitpunkt automatisch verarbeitet.

ABBYY Screenshot Reader – Eine Anwendung, um Screenshots zu erstellen und Texte in ihnen zu erkennen.

Abkürzung – Die verkürzte Form eines Wortes oder einer Wendung, die anstelle der ausgeschriebenen Variante verwendet wird. Beispiele: MS DOS (für Microsoft Disk Operating System), BRD (für Bundesrepublik Deutschland) usw.

ADRT® (Adaptive Document Recognition Technology) – Eine Technologie, die die Konvertierungsqualität bei mehrseitigen Dokumenten erhöht. Sie erkennt zum Beispiel Strukturelemente, wie Überschriften, Kopf- und Fußzeilen, Fußnoten, Seitennummerierung und Signaturen.

Aktiver Bereich – Ein Bereich, der auf einem Bild markiert wurde und nun gelöscht, verschoben oder bearbeitet werden kann. Um einen Bereich zu aktivieren, klicken Sie darauf. Der Rahmen des aktiven Bereichs ist fett formatiert und enthält kleine Quadrate, die zur Änderung der Größe des Bereichs an eine andere Position gezogen werden können.

Aktivierung – Vorgang, in dessen Rahmen ein bestimmter Code von ABBYY abgerufen wird, der dem Benutzer ermöglicht, seine Version der Software auf dem gegebenen Computer im vollen Umfang zu nutzen.

Aktivierungscode – Ein Code, den ABBYY jedem Benutzer von ABBYY FineReader 10 Professional Edition während der Aktivierung ausstellt. Der Aktivierungscode wird benötigt, um ABBYY FineReader auf dem Computer zu aktivieren, der die Produkt-ID generiert hat.

Auflösung – Ein Scanparameter, der angibt, wie hoch der beim Scannen verwendete dpi-Wert ist. Texte mit einer Schriftgröße ab 10 pt sollten mit einer Auflösung von 300 dpi, kleinere Schriftgrößen (9 pt und kleiner) mit einer Auflösung von 400 – 600 dpi gescannt werden.

Automatische Dokumentzufuhr (ADF) – Ein Gerät, das einem Scanner die Dokumente automatisch zuführt. Scanner mit ADF können ohne manuellen Eingriff mehrere Seiten verarbeiten. ABBYY FineReader unterstützt auch das Scannen mehrseitiger Dokumente.

Automatisierungsmanager – Integriertes Verwaltungsmodul, mit dem Sie eine automatisierten Task ausführen, erstellen oder bearbeiten sowie nicht mehr benötigte benutzerdefinierte automatisierte Tasks löschen können.

Finereader backtotop GlossarNach oben

B

Berechtigungskennwort – Ein Kennwort, das bewirkt, dass andere Benutzer ein PDF-Dokument nur nach Eingabe des vom Autor angegebenen Kennworts drucken oder bearbeiten können. Wenn Sicherheitseinstellungen für das Dokument festgelegt wurden, können diese von anderen Benutzern nur nach Eingabe des vom Autor angegebenen Kennworts geändert werden.

Bereich – Ein Teil eines Bilds, der von einem Rahmen eingeschlossen wird. Vor dem OCR-Vorgang unterteilt ABBYY FineReader das Dokument in Text-, Bild-, Tabellen- und Strichcodebereiche, um festzulegen, welche Teile des Bildes erkannt werden sollen und in welcher Reihenfolge.

Bereichsvorlage – Eine Vorlage mit Informationen zu Größe und Position der Bereiche in einer Gruppe ähnlich gestalteter Dokumente.

Bildbereich – Bereich, der für Bildbereiche mit Abbildungen verwendet wird. Dieser Bereichstyp kann richtige Bilder oder andere als Bild darzustellende Objekte enthalten (z. B. Textabschnitte).

C

Codepage – Eine Tabelle, die die Beziehung zwischen Zeichencodes und den Zeichen selbst festlegt. Die benötigten Zeichen können von den Benutzern aus dem Zeichensatz der Codepage ausgewählt werden.

D

Dokumentanalyse – Ein Prozess zur Auswahl logischer Strukturelemente und verschiedener Bereichsarten in einem Dokument. Dokumentanalysen können automatisch oder manuell ausgeführt werden.

Dokumentoptionen – Eine Gruppe von Optionen, die im Dialogfeld Optionen ausgewählt werden können (Extras>Optionen). Zu diesen Optionen gehören auch benutzerdefinierte Sprachen und Muster. Die Einstellungen für diese Optionen können gespeichert und dann für andere ABBYY FineReader-Dokumente geladen und wiederverwendet werden.

Dots per inch (dpi/Punktdichte) – Ein Standardmaß für die Auflösung der Bilder.

Drucktyp – ist ein Parameter, der angibt, wie der Quelltext gedruckt wurde (auf einem Laserdrucker oder vergleichbaren Gerät, auf einer Schreibmaschine o.a.). Wählen Sie bei mit Laserdruckern gedruckten Texten Automatisch erkennen; bei mit Schreibmaschine erstellten Schreibmaschine; und bei Faxen Fax.

Drucktyp des Dokuments – Ein Parameter, der angibt, wie der Quelltext gedruckt wurde (auf einem Laserdrucker oder vergleichbaren Gerät, auf einem Matrixdrucker oder einer Schreibmaschine). Für Texte, die auf Laserdruckern gedruckt wurden, legen Sie den Modus Automatisch fest; für Schreibmaschinentexte den Modus Schreibmaschine und für auf Punktmatrixdruckern gedruckte Texte den Modus Punktmatrixdrucker.

Finereader backtotop GlossarNach oben

E

Erkennungsbereich – Bereich mit dem Abschnitt eines Bilds, der von ABBYY FineReader automatisch analysiert werden soll.

F

Farbmodus – Ein Scanparameter, der angibt, ob ein Bild schwarzweiß, in Graustufen oder farbig gescannt wird.

H

Helligkeit – Ein Scanparameter, der den Kontrast zwischen schwarzen und weißen Bildbereichen angibt. Durch Einstellen der richtigen Helligkeit wird die Erkennungsqualität verbessert.

I

Ignorierte Zeichen – In Wörtern erkannte Zeichen, die keine Buchstaben sind (z. B. Silbenzeichen oder Betonungszeichen). Diese Zeichen werden bei der Rechtschreibprüfung ignoriert.

Invertiertes Bild – Ein Bild mit hellen Zeichen vor dunklem Hintergrund.

L

License Manager – Ein zur Verwaltung von ABBYY FineReader-Lizenzen und zur Aktivierung von ABBYY FineReader 10 Corporate Edit
ion verwendetes Hilfsprogramm.

Ligatur – Eine Kombination aus mindestens zwei scheinbar “zusammengeklebten” Zeichen (z. B. fi, fl, ffi usw.). Diese Zeichen können nur schwer in alleinstehende Buchstaben getrennt werden, da sie beim Druck “zusammenfließen”. Darum lassen sich genauere OCR-Ergebnisse erzielen, wenn diese Buchstabenkombinationen gleich als eigenständige Zusammensetzungen behandelt werden.

M

Muster – Ein Satz paarweiser Zuordnungen (Zuordnungen von Zeichenabbild und tatsächlichem Zeichen), der während des Mustertrainings erstellt wird.

N

Nicht eindeutige Wörter – Wörter mit einem oder mehreren nicht eindeutigen Zeichen.

Nicht eindeutige Zeichen – Zeichen, die u. U. nicht richtig erkannt wurden. Solche nicht eindeutigen Zeichen werden von ABBYY FineReader hervorgehoben.

Nicht proportionale (dicktengleiche) Schrift – Eine Schriftart (wie Courier New) mit gleichen Zeichenbreiten. Zur Verbesserung der OCR-Qualität wählen Sie bei nicht proportionalen Schriftarten unter Extras>Optionen… die Registerkarte Dokument und aktivieren dann unter Drucktyp des Dokuments die Option Schreibmaschine.

O

Öffnungskennwort – Kennwort, das zum Öffnen kennwortgeschützter PDF-Dokumente eingegeben werden muss. Ohne Kennwort kann das Dokument nicht geöffnet werden.

Omnifont-System – Ein Erkennungssystem, das Zeichen in jeder Schriftart und Schriftgröße ohne vorheriges Trainieren erkennt.

Optionaler Trennstrich – Ein Trennstrich (¬), der anzeigt, wo genau ein Wort oder ein zusammengesetzter Ausdruck getrennt werden soll, wenn es am Zeilenende auftritt (z. B. muss “automatisch” “auto-matisch” getrennt werden). ABBYY FineReader ersetzt alle Trennstriche in Wörtern, die im Wörterbuch enthalten sind, durch optionale Trennstriche.

Finereader backtotop GlossarNach oben

P

Paradigma – Der Satz aller grammatikalischen Formen eines Worts.

PDF-Sicherheitseinstellungen – Beschränkungen für das Öffnen, Bearbeiten, Kopieren oder Drucken von PDF-Dokumenten. Dazu gehören Kennwörter zum Öffnen oder für Zugriffsrechte sowie Verschlüsselungsstufen.

Primärform – Die Form des Stichworts eines Wörterbucheintrags.

Produkt-ID – Parameter, der bei Aktivierung von ABBYY FineReader auf einem Computer auf der Grundlage der Hardwarekonfiguration automatisch erzeugt wird.

Finereader backtotop GlossarNach oben

S

Scanner – Ein Gerät zum Einlesen von Bildern in einen Computer.

Schriftarteneffekte – Die Formatierung einer Schriftart (z. B. fett, kursiv, unterstrichen, durchgestrichen, tiefgestellt, hochgestellt, Kapitälchen usw.).

Seitenlayout – Die Anordnung von Text, Tabellen, Bildern, Absätzen und Spalten auf einer Seite sowie Schriftarten, Schriftgrößen, Schrift- und Hintergrundfarben und Textausrichtung.

Seitenlayoutanalyse – Die Erkennung von Bereichen auf einem Seitenbild. Es gibt fünf Bereichstypen: Text-, Bild-, Tabellen-, Strichcode- und Erkennungsbereiche. Die Seitenlayoutanalyse kann automatisch ausgeführt werden, wenn Sie auf die Schaltfläche Lesen klicken; oder manuell vor dem OCR-Vorgang.

Strichcodebereich – Ein Bereich, der für Strichcodedarstellungen verwendet wird.

T

Tabellenbereich – Bereich, der für Abbilder von Tabellen oder für als Tabelle gegliederte Textbereiche verwendet wird. Beim Einlesen dieses Bereichstyps zeichnet die Anwendung innerhalb des Bereichs automatisch vertikale und horizontale Trennlinien, die die Tabelle bilden. Im Ausgabetext wird der Bereich dann wieder als Tabelle dargestellt.

Tagged PDF – Ein PDF-Dokument, das Informationen zur Dokumentstruktur – logische Bestandteile, Bilder, Tabellen – enthält. Diese Informationen sind als PDF-Tags kodiert. PDF-Dateien, die solche Tags enthalten, können an unterschiedliche Bildschirmgrößen angepasst und problemlos auf Handheld-Geräten angezeigt werden.

Textbereich – Ein Bereich, der Text beinhaltet. Beachten Sie, dass Textbereiche nur einspaltigen Text enthalten dürfen.

Training – Im Rahmen des Trainings werden die Zeichenabbilder den tatsächlichen Zeichen zugeordnet. (Detaillierte Informationen dazu finden Sie unter Erkennung mit Training.)

Treiber – Ein Softwareprogramm, das ein Peripheriegerät steuert (z. B. Scanner, Bildschirm usw.).

Trennzeichen – Symbol, das zur Trennung von Wörtern verwendet werden kann (z. B. “/”, “\”, “-” ) und selbst durch Leerstellen vom Wort getrennt ist.

U

Unicode – Ein Standard, der von The Unicode Consortium (Unicode, Inc.) entwickelt wurde. Der Standard ist ein internationales 16-Bit-Verschlüsselungssystem zur Verarbeitung von Text, der in einer der Weltsprachen verfasst wurde. Dieser Standard kann auf einfache Weise erweitert werden. Der Unicode-Standard legt die Zeichenverschlüsselung sowie die Eigenschaften und Verfahren fest, die bei der Verarbeitung von Texten verwendet werden, die in einer bestimmten Sprache verfasst wurden.

Unzulässige Zeichen – Wenn bestimmte Zeichen im erkannten Text mit Sicherheit nicht vorkommen werden, können sie in den Sprachgruppeneigenschaften als unzulässig definiert werden. Auf diese Weise lassen sich die Geschwindigkeit und Genauigkeit des OCR-Vorgangs erhöhen.

Z

Zusammengesetztes Wort – Ein Wort, das mindestens zwei Wortstämme hat (allgemeine Bedeutung); ein Wort, das nicht im Wörterbuch zu finden ist, aber aus zwei oder mehreren im Wörterbuch enthaltenen Ausdrücken zusammengesetzt sein kann (Definition laut ABBYY FineReader).

Finereader backtotop GlossarNach oben

Glossar