본문 바로가기
IT_활용/사이트활용

OCR - PDF, 이미지에서 글자 추출 / onlineocr.net

by 고코더 2018. 1. 26.


이미지 PDF에서 텍스트 뽑아내기 

갤럭시 노트의 기능중 하나가 펜으로 초점을 갖다 대면 이미지 속에 있는 글자를 텍스트로 바꿔줘
자동으로 번역을 한다거나 복사를 할 수 있게 해줍니다. 
이러한 기능들을 OCR(Optical Character Recognition) 이라고 합니다. 

OCR기능은 최근의 떠오르는 기기들은 필수적으로 구현하며 활용하고 있는 기능입니다.
에버노트나 원노트에도 검색을 하면 내가 첨부한 이미지와 PDF에 글자까지 검색해
찾아주기도 합니다.

PC프로그램은 편리하게 제공하는 OCR이 없어서
OCR을 가볍고 빠르게 사용가능한 사이트를 소개하자고 합니다.

▼바로 온라인 OCR이라는 사이트 입니다.
도메인도 외우기 쉽네요

▼사용법은 매우 간단합니다.

  1. 파일을 선택하고
  2. 언어를 선택(text로 바꿀 언어)
  3. output 데이터를 선택합니다.
  4. 그리고 컨버터를 누르면 바로 확인 가능


▼지정 가능한 양식은 3개입니다.
일상적으로 자주 사용하는 필요한 소스만 있습니다.


▼제 블로그의 한 부분을 이미지로 캡쳐했습니다.
이걸 한번 OCR로 텍스트만 찾아내겠습니다.
조금 어려울거 같지만 믿어보죠


▼ 텍스트로 컨버트를 했는데
기능이 좋네요 특수기호 부터 영어부터 한글까지 완벽히 추출했습니다.
제가 써본 OCR중 가장 기능이 좋아보입니다.



▼ 이번에는 워드프로세스로 추출해봤습니다.
해당 셀렉트 박스를 선택해야 하고


▼ 해당 링크를 눌러 다운로드 받습니다.


▼ 워드로 열어본 모습입니다. 
텍스트로 변환하고 이미지까지 남겨두었네요
그럴듯하게 잘변환합니다.


▼ 이번에는 엑셀로 추출해봤습니다.


▼ 엑셀로 표시되는 다운버튼을 클릭하요 
열어보니


▼ 엑셀로 각 행에 이쁘게 정리가 되어있습니다.
상당히 좋네요





마무리


굉장히 기능이 좋은 사이트 같습니다.
OCR 프로그램을 설치하지 않아도 될거 같네요




댓글