產品中心

OCR 圖形辨識

OCR圖形辨識Java應用

陳志祥 2017/12/13 15:30:58

0 3802

OCR圖形辨識Java應用

簡介	將OCR運用在程式上，將圖形轉成文字供系統使用
作者	陳志祥

1. 關於OCR

什麼是OCR

OCR是光學文字辨識，是從英文 Optical Character Recognition 翻譯而來，而OCR取自這三個英文字的第一個英文字，OCR的主要目的是將圖像中文字轉化成電腦能夠識別的電子訊號

OCR應用範圍

- 建立各種知識資料庫：輸入大量各種報紙、中文書刊、雜誌等。
- 節省人力個別打字的時間：如早期出版或發行的文章及圖書，利用OCR輸入至電腦，文字也可重新編排。
- 結合語言輸出：將文字利用OCR辨識之後，利用電腦的語音輸出，可以讓不識字、視覺障礙、年長使用者以聽覺方式聽到文章。如Plustek Book Reader。
-文字翻譯：使用者可以利用 OCR，將希望翻譯的文字段落或文章輸入電腦，另外再配合翻譯的軟體等，快速地將文字翻譯成其他語言。

2. 目的

本文將介紹如何使用Java 程式，搭配OCR 套件，將圖形轉成文字供系統使用

3. 開始前準備

本測試架構建立於以下版本的環境：

l JDK6

l STS 3.1.0.RELEASE

l tesseract-ocr-3.0.2

先至https://sourceforge.net/projects/tesseract-ocr-alt/files/ 下載Tesseract-OCR安裝包

解壓縮至自訂路徑

4. 設定與測試

首先建立一張英數字圖片

至tesseract 資料夾，cmd tesseract 可以看到參數說明

將以下程式透過Java Process執行，並將結果輸出到控制台

結果輸出，成功辨識

5. 結語

至目前為止，OCR辨識正確率還不夠精準，尤其是用在中文字上，因此在實質上的應用不大，通常修正後還需要人工來確認準確性，即便可以透過訓練修正來提高辨識的精準度，準確率仍是一大難題，可以期盼有朝一日能夠克服這個難關，套用於各種應用上。

陳志祥

相關文章

IntelliJ IDEA 配置 Maven 內網開發環境

使用 Bootify 快速生成 Spring Boot 程式架構

使用 JPA Support 套件簡化 JPA 架構建置

使用 Entity Graph 防止 N+1 問題

使用 i18n 設計多語系 API 資訊

Kafka Connect Elasticsearch Sink Connector 與 Elasticsearch 複合、聚合查詢

最新文章

Figma 無痛轉 Power Point

Linux Ubuntu環境架設RTSP Server

RabbitMQ技術說明與應用

如何讓AI成為設計師最強的工作夥伴 - 掌握 AI 指令技巧

Prompt Engineering: CoT, Structured Output, Delimiters

上線後的UX測試