Глосарій

А Д Е З І К Л М Н О П Р С Т Ш Я

ABBYY Hot Folder — додаток-планувальник, за допомогою якого можна призначити час обробки документів з вибраної папки. Відкривання файлів та розпізнавання зображень можуть бути виконані у той час, коли комп’ютер найменше завантажений, наприклад, уночі.

ABBYY Screenshot Reader — додаток, який дозволяє зробити знімок вибраної зони екрана і розпізнати текст, що міститься на знімку.

ADF (Automatic Document Feeder) — пристрій автоматичного подавання паперу, який дозволяє відсканувати велику кількість документів без ручного втручання. ABBYY FineReader підтримує сканування багатосторінкових документів.

ADRT® (Adaptive Document Recognition Technology) — технологія адаптивного розпізнавання документів, яка підвищує якість конвертування багатосторінкових документів. Зокрема, вона дозволяє визначати такі елементи структури документа, як заголовки, колонтитули, виноски, нумерацію сторінок, підписи.

dpi (dots per inch) — кількість точок на дюйм; одиниця вимірювання роздільної здатності.

Product ID — параметр, який створюється на підставі даних про конфігурацію комп’ютера в момент активації.

Unicode — стандарт, розроблений концерном Unicode. Керує процесом кодування символів і надає шістнадцятибітну міжнародну розширювану систему кодування символів для обробки інформації більшістю мов народів світу. Стандарт Unicode визначає кодування символу, а також властивості та алгоритми, які використовуються під час реалізації цього процесу.

А

Абревіатура — скорочення, утворене з перших літер слів. Наприклад, МДУ, MS-DOS тощо.

Активація — процес отримання користувачем у компанії ABBYY спеціального коду, необхідного для забезпечення роботи програми у повнофункціональному режимі на конкретному комп’ютері.

Активаційний код — код, який видається користувачеві після проходження процедури активації ABBYY FineReader 10. Призначений для активації продукту на машині, на якій був отриманий Product ID.

Активна зона — виділена зона, над якою виконуються такі дії, як видалення, зміна типу тощо. Щоб зробити зону активною, достатньо клацнути на ній курсором миші. Товщина рамки такої зони — напівжирна, а на її кутах є «квадратики».

Аналіз документа — процес виділення елементів логічної структури та зон різних типів у документі. Аналіз документа може виконуватися автоматично або вручну.

Finereader backtotop Глосарій На початок

Д

Документ ABBYY FineReader — це об’єкт, який створюється програмою ABBYY FineReader для роботи з одним вхідним документом з урахуванням його цілісної структури. Він містить зображення сторінок, відповідний їм розпізнаний текст (якщо є), налаштування програми (опції сканування, розпізнавання, збереження тощо).

Драйвер — програма, яка керує пристроєм (наприклад, сканером, монітором тощо).

Е

Еталон — набір пар «усереднене точкове зображення символу» — його назва, яка створюється у процесі навчання системи на конкретному тексті.

З

Заборонені символи — як заборонені символи для поточної мови вказуються ті, які явно не можуть зустрічатися в текстах, що розпізнаються з підключенням цієї мови. Зазначення таких символів може суттєво збільшити швидкість і надійність розпізнавання.

Зображення — зона, яка використовується для виділення зображень. Вона може містити зображення або будь-яку іншу частину тексту, яку ви хочете передати у розпізнаний текст як зображення.

Зона — ділянка зображення, поміщена в рамку. Перед розпізнаванням програма виділяє зони з текстом, малюнками, таблицями та штрих-кодами. Зони виділяються для того, щоб вказати системі, які ділянки зображення потрібно розпізнавати і в якому порядку.

Зона розпізнавання — зона, яка використовується для розпізнавання та автоматичного аналізу частини зображення. Після натиснення кнопки Розпізнати виділена зона автоматично аналізується та розпізнається.

І

Ігноровані символи — як ігноровані символи вказуються ті, які можуть зустрічатися всередині слова, наприклад, знаки складоподілу або наголосу у словниках. Під час перевірки по словнику програма не зважає на ці знаки. У розпізнаному тексті ці символи зберігаються, але під час перевірки орфографії не враховуються.

Інвертоване зображення — зображення, текст якого надрукований на темному фоні світлими літерами.

К

Кодова сторінка — таблиця, в якій задано відношення між кодами символів та їх написанням. У системі ABBYY FineReade кодова сторінка подана як набір символів, з якого можна вибрати потрібні символи.

Finereader backtotop Глосарій На початок

Л

Лігатура — дві або три літери, які через особливості написання склеюються між собою. Наприклад, ге, го, fe, ffi, tt тощо.

М

Менеджер ліцензій — додаток, у якому здійснюється керування ліцензіями та активація ABBYY FineReader 10 Corporate Edition.

Менеджер сценаріїв — вбудований менеджер, який дозволяє запускати виконання сценаріїв, створювати сценарії та налаштовувати їх, а також видаляти сценарії користувача, які не використовуються.

Моноширинний шрифт — будь-який шрифт, літери якого мають однакову ширину (моно). Наприклад, шрифт Courier New. Для покращення якості розпізнавання моноширинних шрифтів на закладці Документ діалогу Параметри у пункті Тип друку встановіть перемикач у положення Друкарська машинка.

М’який перенос — перенос (¬) показує, в якому саме місці має бути розірване слово або словосполучення (наприклад, «Автоформат»), якщо воно потрапляє на кінець рядка (наприклад, «Авто-формат»). Всі переноси у словникових словах ABBYY FineReader замінює на м’який перенос.

Н

Навчання — створення пар «растрове зображення — назва символу». Докладніше див. у розділі «Розпізнавання з навчанням».

Налаштування документа — сукупність значень опцій, розміщених на закладках діалогу Опції (меню Сервіс>Опції…). До набору опцій також входять мови та еталони користувача. Набір опцій можна зберегти і потім використовувати (завантажувати) в інші документи ABBYY FineReader.

Написання шрифта — спосіб виділення в тексті (напівжирний, похилий, з підкресленням, перекреслений, верхній індекс, нижній індекс, малі великі літери).

Невпевнено розпізнані символи — символи, які можуть бути розпізнані неправильно.

Невпевнено розпізнані слова — слова, які містять невпевнено розпізнані символи.

Finereader backtotop Глосарій На початок

О

Омніфонтова система — система розпізнавання, яка розпізнає символи практично будь-яких розмірів та написання.

Оформлення сторінки — розміщення тексту, таблиць і малюнків у документі, розбиття на абзаци, гарнітура та розмір шрифту, колонки, напрямок тексту, колір літер та фон тексту.

П

Парадигма — сукупність усіх граматичних форм слова.

Параметри захисту PDF — обмеження на відкривання, редагування, копіювання та друк PDF-документа. У ці параметри входять пароль відкривання документа, пароль для зміни прав доступу та рівень шифрування.

Пароль відкривання документа — пароль, який надається PDF-документам. Користувачі можуть відкрити PDF-документ тільки після введення пароля, заданого автором документа.

Пароль для зміни прав доступу — пароль, який надається PDF-документам. Користувачі можуть роздрукувати або внести зміни у PDF-документ тільки після введення пароля, заданого автором документа. При використанні захисту PDF-документа користувачі також мають вказати цей пароль, щоб змінити параметри захисту PDF.

Початкова форма — форма, у якій слова подаються у словнику. Для іменників це форма називного відмінка однини; для прикметників — форма чоловічого роду називного відмінка однини; для дієслів, прислівників та дієприслівників — неозначена форма (інфінітив).

Finereader backtotop Глосарій На початок

Р

Розділювачі — символи, які можуть розділяти слова, наприклад, /, \, тире тощо, і які пишуться окремо від слів.

Роздільна здатніс
ть
 — параметр сканування, який показує, яка кількість точок припадає на одиницю довжини. Од. 300 dpi відповідає розміру шрифта 10 та більше пунктів, 400–600 dpi — для текстів, які набрані дрібним шрифтом (9 і менше пунктів).

С

Сканер — пристрій, призначений для введення зображень у комп’ютер.

Складне слово — слово, утворене шляхом складання двох основ (коренів), якого немає у словнику. Воно може складатися з наявних у словнику слів.

Сценарій ABBYY FineReader — це набір послідовних кроків, кожен з яких відповідає одному етапу обробки документа. У програмі ABBYY FineReader 10 передбачені вбудовані сценарії, повністю готові до використання. Також можна створювати власні — сценарії користувача. Запуск вбудованого сценарію здійснюється з вікна Основні сценарії.

Т

Таблиця — зона, яка використовується для виділення таблиць або тексту, що має табличну структуру. Під час розпізнавання програма розбиває цю зону на рядки та стовпці і формує табличну структуру. У вихідному тексті ця зона передається таблицею.

Теги PDF — спеціальні теги, які використовуються для виділення логічних частин та розмітки таблиць і малюнків у PDF-документі. Теги, які вбудовуються у PDF-документ, забезпечують зручність перегляду документа на екранах різного розміру, наприклад, на екранах кишенькових комп’ютерів.

Текст — зона, яка використовується для виділення тексту. Вона повинна містити тільки одноколонковий текст.

Тип друку вхідного документа — особливість у написанні символів вхідного тексту залежно від того, яким чином він надрукований (у друкарні, на друкарській машинці тощо). Для друкарського тексту слід встановлювати режим Авто, для машинописного — режим Друкарська машинка, для роздрукованого факсимільного повідомлення — режим Факс.

Тип зображення — параметр сканування; зображення може бути чорно-білим, сірим або кольоровим.

Ш

Шаблон зон — у шаблоні описано положення та розміри зон на сторінці.

Штрих-код — зона, яка використовується для виділення ділянок зображення, які містять штрих-код.

Я

Яскравість — параметр сканування, визначає контрастність, тобто різницю між чорними і білими ділянками тексту. При правильному налаштуванні якість розпізнавання зростає.

Finereader backtotop Глосарій На початок

Глосарій