詞彙

A L P U

A

ABBYY FineReader 文件是 ABBYY FineReader 軟體建立的使用結構分析來處理來源文件的物件。它包含帶有對應已辨識文字 (如有) 的頁面影像與程式設定 (掃描、辨識、儲存選項等)。

ABBYY Hot Folder 是排程代理程式,可讓您選取具有影像的資料夾並為在此資料夾中處理影像設定時間。將在指定的時間自動處理來自選取資料夾的影像。

ABBYY Screenshot Reader 是建立螢幕擷取畫面並辨識當中的文字的應用程式。

ADRT® (適應性文件辨識技術) 是提高多頁文件轉換品質的技術。例如,它能夠辨識諸如標題、標頭與標尾、腳註、頁碼及簽章等結構元素。

L

License Manager 是用於管理 ABBYY FineReader 授權並啟動 ABBYY FineReader 9.0 Corporate Edition 的公用程式。

P

PDF 安全性設定是可防止開啟、編輯、複製或列印 PDF 文件的限制。這些設定包括文件開啟密碼、權限密碼和加密層級。

Product ID 是在特定電腦上啟動 ABBYY FineReader 時,根據硬體組態自動收集的參數。

U

Unicode 是由 Unicode Consortium (Unicode, Inc.) 所開發的標準。此標準為 16 位元國際編碼系統,用於處理世界上主要語言書寫的文字。 此標準可輕易擴充。Unicode Standard 可決定處理以某種語言書寫文字時所使用的字元編碼、屬性和程序。

Finereader backtotop 詞彙回到頁首

標記型 PDF 是包含有關文件結構,如其邏輯部份、圖片、表格等資訊的 PDF 文件。此結構已設定為 PDF 標記的編碼。可反流具有標記的 PDF 檔案以符合不同的螢幕大小並正確顯示於掌上裝置上。

複合字詞是由兩個或多個詞幹 (一般意義) 組成的字詞; 字典中找不到,但是可能由兩個或多個在字典 (ABBYY FineReader 意義) 中找到的詞彙組成的字詞。

禁止使用的字元 — 如果某些字元在已辨識文字中無法找到,可能其已指定於語言群組屬性的禁止使用的字元組中。指定這些字元會提高 OCR 的速度及品質。

列印類型是 (在雷射印表機或類似印表機上或打字機上) 反映來源文字的列印方式的參數。對於雷射印表機文字,請選取自動偵測;對於打字機文字,請選取打字機;對於傳真,請選取傳真

連字是兩個或多個「黏在一起」的字元組合 (例如 fi、fl、ffi)。很難分隔這些字元,因為其在列印中通常是「黏在一起」的。將其視為可改善 OCR 正確性的單一複合字元。

亮度是表示黑白影像區域之間對比的掃描參數。設定正確的亮度會增加辨識品質。

解析度是決定掃描時使用多少 dpi 的掃描參數。300 dpi 的解析度應用於字型大小為 10pt  或更大的文字,400 至 600 dpi 適合字體較小的文字 (9pt 或更小)。

模式是在模式定型期間建立的組的集合 (每組包含一個字元影像和字元本身)。

每英吋點數 (dpi) 是影像解析度的測量標準。

啟動碼是在啟動程序期間,由 ABBYY 核發給每一位 ABBYY FineReader 10 使用者的代碼。在已生成 Product ID 的電腦上,需要啟動碼才能啟動 ABBYY FineReader。

啟動是從 ABBYY 獲得特殊代碼的程序,能讓使用者在特定電腦上以完整模式使用軟體副本。

Finereader backtotop 詞彙回到頁首

表格區域是表格影像區域所使用的區域,或結構成表格的文字所使用的區域。 當應用程式讀取這類區域時,它會在區域內描繪垂直與水平分隔符號以形成表格。 此區域會在輸出文字中形成表格。

啟用中區域是可在影像上刪除、移動或修改的已選取區域。要啟動區域,請按一下該區域。包圍啟用中區域的框架為粗體,且有可拖曳變更區域大小的小方括弧 。

區域範本是在一組外觀相似的文件內,包含有關區域的大小和位置的資訊的範本。

區域是指以外框包圍的影像區域。執行 OCR 之前,ABBYY FineReader 會偵測文字、圖片、表格和條碼區域,以決定要辨識哪一個影像區域及辨識次序。

驅動程式是控制電腦周邊設備 (例如,掃描器、螢幕等) 的軟體程式。

全字體系統是沒有事先訓練,可辨識任何字型和字型大小中設定的字元的辨識系統。

權限密碼是可防止其他使用者列印和編輯 PDF 文件的密碼,除非他們鍵入作者指定的密碼。如果選取文件的部份安全性設定,除非其他使用者鍵入作者指定的密碼,否則將無法變更這些設定。

色彩模式是決定是否以黑白、灰色或彩色色階掃描影像的掃描參數。

掃描器是將影像輸入電腦的裝置。

縮寫是用於表示整個字詞或片語的縮短形式。例如,MS–DOS (Microsoft 磁碟作業系統的縮寫)、UN (聯合國的縮寫) 等。

條碼區域是條碼影像區域所使用的區域。

Finereader backtotop 詞彙回到頁首

辨識區域是ABBYY FineReader 應自動分析的包圍影像區域的區域。

圖片區域是包含圖片的影響區域所使用的區域。此類區域可能包含實際圖片或任何其他應會顯示為圖片的物件 (例如所選文字)。

文件分析是在文件中選取邏輯結構元素和不同類型的區域的過程。文件分析可以自動或者手動進行。

文件開啟密碼是防止使用者開啟 PDF 文件的密碼,除非使用者鍵入作者指定的密碼。

文件選項是可在選項對話方塊 (工具>選項) 中選取的選項集合。選項設定也包括使用者語言和模式。可儲存,然後在其他 ABBYY FineReader 文件中使用/載入選項設定。

文字區域是包含文字的區域。注意,文字區域應僅包含單欄文字。

選擇性的連字號是當字詞或字詞組合出現在行尾而需要分割時,表示應分割的確實位置的連字號 (¬) (例如,「autoformat」應分割成「auto–format」)。 ABBYY FineReader 可取代在具有選擇性的連字號的字典字詞中找到的所有連字號。

訓練是在字元影像和字元本身間建立對應。(欲瞭解詳細資訊,請參閱透過訓練辨識部分。)

頁面配置分析是偵測頁面影像上的區域的程序。區域可屬於五種類型:文字、圖片、表格、條碼和辨識區域。頁面配置分析可在按一下讀取按鈕后自動執行或先於 OCR 由使用者手動執行。

頁面配置是頁面上文字、表格、圖片、段落和資料行的排

詞彙