알PDF로 스캔한 문서의 문자(TEXT) 추출하기
스캔한 PDF파일이나 이미지파일은 문서 전체가 하나의 이미지로 인식하기 때문에 편집이나 문자 검색을 할 수 없다.
하지만 문자인식(OCR) 처리를 해주면 PDF에 포함된 이미지나 TEXT를 편집 또는 검색 가능하게 만들어준다.
자! 그럼 PDF파일의 문자인식(OCR) 방법을 해결해 보자.
우리가 자주 접하는 알PDF로 간단하게 해결할 수 있다.
알PDF는 무료 프로그램이다.
다운로드 방법은 다음검색창에 [알툴즈]를 입력한 다음 공식다운로드 페이지에서 [알PDF]를 선택 후 설치하면 된다.
알PDF를 설치했다면 이제 스캔작업한 PDF파일의 TEXT를 추출해 보자.
1. 우선, 알PDF를 실행시키면 문자인식(OCR) 메뉴가 있다. 이 메뉴를 사용하기 위해서는 문자인식(OCR) 플러그인을 설치해야 한다. 문자인식(OCR) 메뉴를 클릭하면 ALPDF_OCR_Plugin30.exe 파일 다운로드 창이 뜬다. 다운로드한 후 실행시킨다.
2. '동의'→'설치시작'을 눌러 설치를 시작한다. 설치가 완료되면 '확인'을 눌러 설치를 종료한다.
3. 알PDF 메인화면에서 문자인식(OCR)을 클릭한 후 TEXT를 추출할 PDF파일을 연다.
4. 문서인식(OCR)은 다음과 같은 2가지 옵션이 나타난다.
첫번째는 '편집 가능한 텍스트로 스캔'으로 이미지에 포함된 텍스트를 편집 가능한 텍스트로 변환하는 기능이다.
두번째는 '이미지에서 검색 가능한 텍스트로 스캔'으로 이미지에 포함된 텍스트를 검색할 수 있는 기능이다.
두가지 옵션중 사용할 옵션을 선택한다.
5. 스캔옵션을 선택했다면 다음은 '언어 바꾸기' 기능이다. 알PDF에서 지원되는 23개의 언어로 변환이 가능하다.
6. '적용'을 클릭하면 PDF문서의 텍스트를 문서인식(OCR) 처리가 진행된다. 파일 용량에 따라 변환되는 시간이 길어질 수 있다.
7. 문서인식(OCR) 처리가 끝났다면 다른 이름으로 저장한다.
8. [일괄편집] 메뉴를 이용하면 여러 개의 PDF파일을 한꺼번에 변환할 수 있다.
이때는 다른 이름으로 저장할 필요 없이 바탕화면>알PDF>OCR 폴더에 자동 저장된다. (저장경로는 반드시 확인한다.)
'컴퓨터' 카테고리의 다른 글
PDF프로그램 무료 다운로드 (0) | 2024.06.16 |
---|---|
노트북 비밀번호 설정 및 해제 방법 (0) | 2024.02.14 |
이미지파일(JPG,PNG) 용량 줄이기 (0) | 2023.11.08 |
PDF파일 엑셀로 변환하는 방법 (0) | 2023.11.05 |
네이버 이미지 검색: PC에서 스마트렌즈로 이미지 찾기 (0) | 2023.09.12 |