Posted
Filed under Google
|| English || 中文 || view 15917 ||

인터넷에 연결된 웹 브라우저로 다양한 문서를 작성하고 활용할 수 있도록 하는 Google Docs(구글 문서 도구) 는 처음 시작할 때보다 많은 기능이 도입되어 이런 저런 기능을 많이 포함하고 있다.

이 서비스에 2월 28일 자로 새로운 기능이 하나 추가되었는데 바로 스캔한 문서를 텍스트 데이터로 변환해주는 OCR 기능이다. 이번에 처음 들어간 기능은 아니고, 기존에는 영어만 가능했으나 한글(Korean)을 비롯해 총 29개 언어를 추가로 지원하게 된 것 이다.

그래서 한 번 써봤다.

아래와 같은 스캔 파일(PDF)을 원본으로 사용했다.

구글 문서 도구의 한국어 OCR 기능, 어느 정도일까

Goole 문서 도구 에 접속하고 해당 파일을 올린다.

[Google 문서도구] 파일 업로드
[Google 문서도구] 파일 업로드

변환된 파일을 보면 간단한 설명 문구와 원본 이미지가 나타나고 그 아래로 OCR 기능으로 변환된 텍스트가 정리되어 있다.

[Google 문서도구] OCR
[Google 문서도구] OCR
[Google 문서도구] OCR

원본의 상태에 따라 결과는 달라지겠지만, 못쓴다고 보면 된다.

같은 이미지를 OCR 기능을 제공하는 네이버의 서비스 로도 확인해 보았다. 네이버의 서비스는 JPG 파일만 지원한다. PDF 파일을 JPG로 변환해 올렸다.

NAVER LAB 이미지 문자 인식 OCR
NAVER LAB 이미지 문자 인식 OCR
NAVER LAB 이미지 문자 인식 OCR
NAVER LAB 이미지 문자 인식 OCR
NAVER LAB 이미지 문자 인식 OCR

구글보다는 괜찮은 결과를 보여준다.

이번에는 PDF 파일을 주로 다루는 Adobe Acrobat 프로그램 자체의 OCR 기능으로 텍스트를 인식한 다음 이를 MS Word 파일로 변환해 보았다.

Adobe Acrobat OCR

주로 스캔한 자료로 만든 PDF 파일에 검색 기능을 추가하기 위해 사용하므로 크게 기대하지는 않았다.

마지막으로 내가 이런 용도로 사용하고 있는 ABBYY FineReader 10으로 같은 원본을 확인해 보았다.

ABBYY FineReader 10
ABBYY FineReader 10

그냥 이걸 쓰는 것이 제일 낫다.
"Google " 분류의 다른 글
[Google Logo] 에스파냐 화가 후안 그리스의 생일 기념  (0)2012/03/23  
[Google Logo] 2008년 설날  (0)2008/02/08  
[Google Logo] 2014 월드컵(#39)  (0)2014/06/29  
[Google Logo] 2006~2015년 설날  (0)2015/02/19  
[Google Logo] 누중법칙으로 유명한 덴마크 지질학자 스테노 생일 기념  (0)2012/01/11  
  ◐ 관련 글 ◑   ◐ 100일간 인기 글 ◑
 
Creative Commons License 이 저작물은 크리에이티브 커먼즈 코리아 저작자 표시-비영리-변경 금지 2.0 대한민국 라이선스에 따라 이용하실 수 있습니다.


RSS 2.0 feed
ATOM 1.0 feed
Tag , , , , , , , ,
Response
You can track responses via RSS / ATOM feed
RSS 2.0 feed
ATOM 1.0 feed
루나리안

흥미로운 실험이네요~ 잘 봤습니다.
구글이 행하는 많은 작업들을 좋아하는 편인데~
성능이 더 나아지길 기대해봅니다.ㅎㅎ