문서 처리가 많은 업무 환경에서 효율성을 달성하는 중요한 기능 중 하나로 OCR(Optical Character Recognition)이라고 하는 문자 인식을 들 수 있다. 요즘 꽤 많은 문서들이 애초부터 전자 파일 형태로 만들어지기 때문에 활용 빈도가 줄 것 같기는 하지만, 은근히 절실하게 필요하면서도 불편한 것이 또 이 OCR 기능이다.

초창기 스캐너가 보급되기 시작할 때에는 번들로 OCR 프로그램을 끼워주기도 했고, 시간이 지나면서 더 완벽한 기능이 나올 것으로 예상도 했지만, 특히 한글 환경에서는 아직도 아쉬움이 많다. 

아무튼, 특정 문서에 OCR 기능을 적용해 컴퓨터에서 인식 가능한 문자 형태로 변환할 때 기본적으로 스캐너(scanner)를 이용하게 된다. 간혹 디지털카메라(디카)로 문서를 촬용해 적용하기도 하지만, 결과물의 질이 아주 좋지 않다.

최근 보급이 많이 되고 있는 아이폰(iPhone) 등 스마트폰에서 사용할 수 있도록 OCR 앱도 여러 개 있다. 그런데 대부분 성능이 좋지 않고, 그나마 영어 등 몇 가지 국제적 언어만 지원하기 때문에 한글(Korean)을 처리하는 앱은 거의 없다. 있는 경우도 제한적으로 몇 글자나 한두 단어 정도만을 처리하는 것이 고작이다.

ABBYY TextGrabber
그래도 조금 쓸만한 아이폰 앱(4와 3GS 지원)으로 TextGrabber가 있다. 이 분야에서 꽤 유명한 ABBYY 에서 만든 것으로 내가 PC에서 사용하는 OCR 프로그램도 이 회사의 제품이다. 약 한 달 전인 6월 3일 1.0 버전이 처음 출시되었고, 현재 최신 버전은 1.5이다. 1.99달러.

iTunes Preview의 TextGrabber 페이지로 가기

바로 문서를 촬영해 인식할 수도 있고, 찍어 놓은 사진을 불러와 처리할 수도 있다. 영어와 한글 문서를 동시에 처리할 뿐만 아니라 그 이상 여러 개의 언어를 동시에 지정해 인식하게 할 수도 있다.

한글도 지원하는 OCR용 아이폰 앱 TextGrabber한글도 지원하는 OCR용 아이폰 앱 TextGrabber
한글도 지원하는 OCR용 아이폰 앱 TextGrabber한글도 지원하는 OCR용 아이폰 앱 TextGrabber

한글도 지원하는 OCR용 아이폰 앱 TextGrabber한글도 지원하는 OCR용 아이폰 앱 TextGrabber
한글도 지원하는 OCR용 아이폰 앱 TextGrabber한글도 지원하는 OCR용 아이폰 앱 TextGrabber

한글도 지원하는 OCR용 아이폰 앱 TextGrabber한글도 지원하는 OCR용 아이폰 앱 TextGrabber
한글도 지원하는 OCR용 아이폰 앱 TextGrabber한글도 지원하는 OCR용 아이폰 앱 TextGrabber

같은 이미지여도 잘라내는 영역의 크기에 따라 결과가 달라지기도 한다.

빛이 잘 드는 밝은 곳에서 문서와 평행하게 사진을 찍는 것이 중요하다. 비교적 잘 된다. PC에서 사용하는 왠만한 프로그램에 뒤지지 않아 보인다.  원본 사진과 변환한 결과는 자동으로 저장되어 나중에 다시 찾아볼 수 있으며, 이메일이나 문자로 전송할 수도 있다. 단, 원본에 표(table)가 있는 경우는 포기하는 것이 좋다. 표 안에 있는 내용은 인식하지만 표 형태를 유지할 수는 없다.

현재 한글, 영어, 독일어, 불어 등 60개 이상의 언어를 지원한다.

"iPod Touch, iPhone, iPad" 분류의 다른 글
아이팟 터치 2세대와 아이폰 3GS 사양 비교표 (7)2009/11/29  
내가 탈옥한 아이패드에 설치하는 주요 시디아 앱 목록(iOS 5 GM 기준) v1.1 (0)2011/10/10  
탈옥 아이팟 터치를 USB 메모리 드라이브로 만들기 (12)2009/10/08  
내가 탈옥한 아이패드에 설치하는 주요 시디아 앱 목록(iOS 4.2.1 기준) v1 (0)2010/12/01  
아이폰을 다운그레이드하려면 알아야 하는 사항 (0)2010/07/16  

2011/07/07 12:44 2011/07/07 12:44
관련 글
100일간 인기 글
Creative Commons License 이 저작물은 크리에이티브 커먼즈 코리아 저작자 표시-비영리-변경 금지 2.0 대한민국 라이선스에 따라 이용하실 수 있습니다.


트랙백 주소 :: http://pakcw.cafe24.com/trackback/1926

댓글을 달아 주세요.




인터넷에 연결된 웹 브라우저로 다양한 문서를 작성하고 활용할 수 있도록 하는 Google Docs(구글 문서 도구) 는 처음 시작할 때보다 많은 기능이 도입되어 이런 저런 기능을 많이 포함하고 있다.

이 서비스에 2월 28일 자로 새로운 기능이 하나 추가되었는데 바로 스캔한 문서를 텍스트 데이터로 변환해주는 OCR 기능이다. 이번에 처음 들어간 기능은 아니고, 기존에는 영어만 가능했으나 한글(Korean)을 비롯해 총 29개 언어를 추가로 지원하게 된 것 이다.

그래서 한 번 써봤다.

아래와 같은 스캔 파일(PDF)을 원본으로 사용했다.

구글 문서 도구의 한국어 OCR 기능, 어느 정도일까

Goole 문서 도구 에 접속하고 해당 파일을 올린다.

[Google 문서도구] 파일 업로드
[Google 문서도구] 파일 업로드

변환된 파일을 보면 간단한 설명 문구와 원본 이미지가 나타나고 그 아래로 OCR 기능으로 변환된 텍스트가 정리되어 있다.

[Google 문서도구] OCR
[Google 문서도구] OCR
[Google 문서도구] OCR

원본의 상태에 따라 결과는 달라지겠지만, 못쓴다고 보면 된다.

같은 이미지를 OCR 기능을 제공하는 네이버의 서비스 로도 확인해 보았다. 네이버의 서비스는 JPG 파일만 지원한다. PDF 파일을 JPG로 변환해 올렸다.

NAVER LAB 이미지 문자 인식 OCR
NAVER LAB 이미지 문자 인식 OCR
NAVER LAB 이미지 문자 인식 OCR
NAVER LAB 이미지 문자 인식 OCR
NAVER LAB 이미지 문자 인식 OCR

구글보다는 괜찮은 결과를 보여준다.

이번에는 PDF 파일을 주로 다루는 Adobe Acrobat 프로그램 자체의 OCR 기능으로 텍스트를 인식한 다음 이를 MS Word 파일로 변환해 보았다.

Adobe Acrobat OCR

주로 스캔한 자료로 만든 PDF 파일에 검색 기능을 추가하기 위해 사용하므로 크게 기대하지는 않았다.

마지막으로 내가 이런 용도로 사용하고 있는 ABBYY FineReader 10으로 같은 원본을 확인해 보았다.

ABBYY FineReader 10
ABBYY FineReader 10

그냥 이걸 쓰는 것이 제일 낫다.
"Google" 분류의 다른 글
[Google Logo] 2011년 성탄 연휴 (0)2011/12/23  
[Google Logo] 영국의 작가이자 삽화가인 로저 하그리브스 생일 기념 (0)2011/05/09  
[Google Logo] 아서 코넌 도일의 생일 (0)2006/05/22  
[Google Logo] 핼러윈 (0)2008/11/01  
[Google Calendar] 구글 일정 관리 베타 서비스 개시 (0)2006/04/14  

2011/03/01 21:55 2011/03/01 21:55
관련 글
100일간 인기 글
Creative Commons License 이 저작물은 크리에이티브 커먼즈 코리아 저작자 표시-비영리-변경 금지 2.0 대한민국 라이선스에 따라 이용하실 수 있습니다.


트랙백 주소 :: http://pakcw.cafe24.com/trackback/1834

댓글을 달아 주세요.

  1. 루나리안 2011/03/14 11:08  댓글주소  수정/삭제  댓글쓰기

    흥미로운 실험이네요~ 잘 봤습니다.
    구글이 행하는 많은 작업들을 좋아하는 편인데~
    성능이 더 나아지길 기대해봅니다.ㅎㅎ




아이팟 터치(iPod Touch)에서 아쉬운 기능 중 하나는 바로 필기 인식이다. 다른 PDA에서는 스타일러스나 손끝으로 글자를 그려 넣으면 글자로 변화되어 입력되는 기능이 있는데, 아이팟 터치에서는 한글이든 영어든 이 기능이 상당히 미약하다. 일본어나 중국어의 경우는 어쩔 수 없는 이유도 있겠지만, 이것이 가능하다.

아무튼, 조금 긴 내용을 입력하고자 할 때에는 자판의 키를 하나하나 누르는 것이 여간 불편한 일이 아니다. FastFinga라는 앱은 화면 위에 손가락으로 글자를 그리면 된다. 그러면 그린 모양 그대로 축소되어 입력된다.

사용자 삽입 이미지

최신 버전은 1.3이며 0.99달러짜리 유료 앱이다.

사용자 삽입 이미지

처음으로 실행하면 아래와 같은 간단한 환영 메시지가 나타난다.

사용자 삽입 이미지
사용자 삽입 이미지
사용자 삽입 이미지

내용을 입력하려면 화면 하단 오른쪽의 연필 모양 아이콘을 클릭한다.

사용자 삽입 이미지
사용자 삽입 이미지

화면 위에 글자를 그리고 화면 하단 오른쪽의 [DONE]을 누르면 된다,

사용자 삽입 이미지
사용자 삽입 이미지

메모 내용에 그림도 끼워넣을 수 있다.

사용자 삽입 이미지

iPhone OS 3.0에 추가된 복사, 잘라내기 기능 등도 그대로 사용할 수 있다.

사용자 삽입 이미지

작성한 내용을 바로 이메일로 보낼 수도 있다.

사용자 삽입 이미지

최신 버전인 1.3부터는 여러 색상을 사용할 수도 있다.

사용자 삽입 이미지
사용자 삽입 이미지

아직 손글씨를 문자로 인식하는 기능이 없지만, OCR과 같은 문자 인식 기능만 들어간다면 더 유용할 것으로 생각된다. 물론 한글(Korean)을 포함해서.


2009/07/11 21:39 2009/07/11 21:39
관련 글
100일간 인기 글
Creative Commons License 이 저작물은 크리에이티브 커먼즈 코리아 저작자 표시-비영리-변경 금지 2.0 대한민국 라이선스에 따라 이용하실 수 있습니다.


트랙백 주소 :: http://pakcw.cafe24.com/trackback/1215

댓글을 달아 주세요.