pdf 텍스트 추출방법 몇가지

작성자: 정보교수 | 발행일: 2017년 07월 20일


pdf 텍스트 추출은 뭘로 하는게 효과적인가?




pdf는 어떤기기와 다른환경에서도 같은 형식으로 문서를 볼수 있기 때문에 많은 사람들이 이용하고 있는 전자문서양식 입니다. 이 pdf파일을 수정해야 하거나 다른포멧에 가져다 쓰려고 하면 텍스트 추출을 해야하는 경우가 생기는데요, 몇가지 방법을 알아보려고 합니다. 




1. 이지피디에프에디터(ezPDF Editor)을 사용합니다. 

한달 체험판을 이용하실수 있으며 문서를 열고 파일탭메뉴중에서 Text로 저장을 누르시면 글자추출이 가능해집니다.


pdf글자추출



2. 폴라리스 오피스 사용

퐆라리스 오피스는 pdf수정외에도 워드, 엑셀, 한글등 다양한 문서작업이 한번에 가능하다는것이 큰 장점중의 하나인 유틸입니다. 모바일 사용이 가능하고 pc버전에 기간제한이 있는줄 알았는데 최근에보니 제한이 없어졌다는 글을 봤는데 한번 확인해 봐야겠습니다.


pdf수정하기



3. 웹사이트 이용

http://ocr.retia.co.kr/ocr_intro.aspx


무료로 제공되는 문서인식 ocr서비스로 별도의 가입없이 sns나 네이버, 구글아이디로 로그인이 가능합니다. 

복사방지 보안설정이 된 문서에서 pdf 텍스트 추출을 해볼수 있습니다. 인식률은 사용자마다 평이 다른걸로 보면 문서나 pc환경에 따라 달라지는듯 합니다. 




pdf 텍스트 추출방법으로 3가지 요약해봤는데 도움이 되시면 좋겠네요.

pdf 텍스트 추출방법 몇가지 목차