스캔한 문서 번역: OCR + AI 설명

Q: OCR 번역의 정확도는 얼마나 됩니까?

깨끗하고 고해상도 스캔의 인쇄된 텍스트의 경우, OCR 정확도는 99%를 초과하며, 전체 번역 정확도는 일반적으로 95% 이상입니다. 저품질 스캔, 특이한 글꼴 또는 손글씨는 정확도를 감소시킵니다.

Q: OCR이 손글씨에 작동합니까?

상황에 따라 다릅니다. 깔끔한 인쇄 손글씨는 적당한 정확도로 처리될 수 있습니다. 필기체는 현재 모든 OCR 시스템에서 신뢰할 수 없습니다. 손글씨 문서를 번역해야 하는 경우, 먼저 수동으로 필사한 다음 타이핑된 텍스트에 AI 번역 도구를 사용하는 것이 가장 좋습니다.

Q: 지원되는 이미지 형식은 무엇입니까?

Doclingo는 PDF, JPG, PNG 및 TIFF 파일을 수락합니다. 스캔이 특이한 형식인 경우, 업로드하기 전에 PDF 또는 PNG로 변환하세요.

Q: 스캔한 문서를 업로드할 때 안전한가요?

네. Doclingo는 모든 업로드에 대해 암호화된 파일 전송을 사용하며, 처리 후 문서를 자동으로 삭제합니다. 파일은 장기적으로 저장되지 않으며 AI 모델 훈련에 사용되지 않습니다.

Q: OCR 번역은 얼마나 걸리나요?

대부분의 문서에 대해 전체 과정은 30초에서 120초가 걸립니다. 매우 긴 문서나 심하게 열화된 스캔은 몇 분이 걸릴 수 있습니다.

전 세계에는 스캔 또는 사진으로만 존재하는 수백만 개의 문서가 있습니다. 파일 캐비닛에 묻혀 있는 오래된 계약서. 디지털화되지 않은 1990년대의 연구 논문. 정부 증명서, 손으로 쓴 편지, 바랜 영수증, 촬영한 화이트보드. 이 모든 것은 대부분의 번역 도구가 읽을 수 없는 형식에 갇혀 있습니다.

그 이유는 간단합니다: 스캔한 PDF는 텍스트 문서가 아닙니다. 그것은 그림입니다. 그리고 단어를 바꿔서 그림을 번역할 수는 없습니다 — 컴퓨터가 찾을 수 있는 단어가 없습니다. 여기서 OCR이 등장합니다. 현대 AI 번역과 결합하여, 이제는 어떤 언어로 된 스캔한 문서에서 모든 단어를 추출하고, 번역하여, 목표 언어로 깔끔하고 형식이 갖춰진 문서를 생성하는 것이 가능해졌습니다 — 종종 2분 이내에.

이 가이드는 그 과정이 어떻게 작동하는지, 결과의 품질에 영향을 미치는 요소는 무엇인지, 그리고 어떤 스캔한 문서에서 최고의 번역을 얻는 방법을 정확히 설명합니다.

OCR이란 무엇이며 번역에 왜 필요합니까?
OCR 번역이 필요한 문서 유형
OCR + AI 번역이 작동하는 방식
단계별: Doclingo로 스캔한 문서 번역하기
OCR 번역 품질: 정확도에 영향을 미치는 요소
스캔한 문서 번역을 위한 대안
일반적인 OCR 번역 문제와 해결책
자주 묻는 질문

OCR이란 무엇이며 번역에 왜 필요합니까?

OCR은 광학 문자 인식을 의미합니다. 이는 스캔, 사진 또는 스크린샷에서 텍스트 이미지를 기계가 읽을 수 있는 텍스트로 변환하는 기술입니다.

이렇게 생각해 보세요. 스캔한 PDF를 보면 페이지에 단어가 보입니다. 하지만 컴퓨터는 픽셀 그리드를 봅니다 — 행으로 배열된 색 점들. 그것은 문자, 단어 또는 문장의 개념이 없습니다. OCR은 픽셀 패턴을 분석하고 문자 모양을 인식하며 텍스트를 재구성하여 그 간극을 메웁니다.

OCR이 없으면 스캔한 문서는 번역할 수 없습니다. 번역 엔진이 처리할 텍스트가 전혀 없습니다. 스캔한 PDF에서 복사-붙여넣기를 하루 종일 해도 — 아무것도 얻지 못하거나, 최악의 경우 엉망인 문자 문자열만 얻을 수 있습니다.

현대의 OCR은 2000년대 초의 투박하고 오류가 많은 시스템에서 많이 발전했습니다. 오늘날의 AI 기반 OCR 엔진은 수십 개의 스크립트에 걸쳐 수백만 개의 문서로 훈련된 딥 러닝 모델을 사용합니다. 깨끗하고 인쇄된 문서의 경우, 정확도는 99%를 초과합니다. 약간의 노이즈가 있는 문서 — 약간의 기울기, 가벼운 얼룩, 오래된 서체 — 도 높은 신뢰도로 처리할 수 있습니다.

스캔한 문서를 번역하는 파이프라인은 다음과 같습니다:

스캔한 문서 --> OCR (텍스트 추출) --> 구조 분석 (표, 열, 헤더) --> AI 번역 --> 형식화된 출력

각 단계가 중요합니다. 불량한 OCR은 번역가에게 엉망인 입력을 제공합니다. 구조 분석이 누락되면 표가 무너지고 열이 합쳐집니다. 약한 번역은 어색한 출력을 생성합니다. 형식 재구성이 없으면 원본과 유사한 것이 아닌 평범한 텍스트의 벽을 얻게 됩니다. 최고의 도구는 모든 다섯 단계를 단일 통합 워크플로로 처리합니다.

OCR 번역이 필요한 문서 유형

모든 PDF가 OCR을 필요로 하는 것은 아닙니다. PDF에서 텍스트를 선택하고 복사할 수 있다면, 그것은 네이티브(디지털로 생성된) PDF입니다 — OCR이 필요하지 않습니다. 그러나 텍스트 선택이 불가능하거나 "복사"가 의미 없는 결과를 낳는다면, 번역 전에 OCR이 필요한 이미지 기반 문서를 다루고 있는 것입니다.

가장 일반적인 유형은 다음과 같습니다:

스캔한 계약서 및 법적 문서. 법률 사무소, 정부 기관 및 기업은 종종 보관을 위해 서명된 종이 계약서를 스캔합니다. 이러한 문서가 번역이 필요할 때 — 국제 분쟁, 규제 준수 또는 파트너 검토를 위해 — OCR은 필수적인 첫 단계입니다.

오래된 인쇄된 책 및 학술 기사. 도서관과 아카이브는 수백만 페이지를 디지털화했지만, 많은 오래된 스캔은 이미지 전용 PDF입니다. 여러 언어로 작업하는 연구자들은 이러한 문서에 자주 직면합니다.

정부 양식 및 증명서. 출생 증명서, 결혼 허가증, 이민 서류, 학업 성적 증명서 — 이러한 문서는 거의 항상 종이 원본에서 스캔됩니다, 특히 외국 정부에서 발급된 경우에 그렇습니다.

팩스 문서. 네, 2026년에도 팩스는 여전히 존재합니다, 특히 의료, 법률 및 일본 비즈니스 문화에서. PDF로 저장된 팩스 문서는 기본적으로 이미지 기반입니다.

촬영한 문서. 때때로 스캐너가 없을 수 있습니다. 식당 메뉴, 거리 표지판, 제품 라벨 또는 게시판의 전화 사진 — 이 모든 것은 번역 전에 OCR이 필요한 이미지입니다.

역사적 문서 및 아카이브. 오래된 원고, 백 년 된 신문 또는 전시 통신을 연구하는 연구자들은 이러한 취약하고 종종 열화된 출처에서 텍스트를 잠금 해제하기 위해 OCR이 필요합니다.

손으로 쓴 메모. 이것은 가장 어려운 범주입니다. 현대 OCR은 일부 손글씨 — 특히 깔끔하고 일관된 인쇄체 — 를 처리할 수 있지만, 인쇄된 텍스트에 비해 정확도가 크게 떨어집니다. 필기체는 모든 OCR 시스템에 대한 주요 도전 과제로 남아 있습니다.

OCR + AI 번역이 작동하는 방식

스캔한 문서를 번역하는 전통적인 접근 방식은 여러 개의 분리된 단계를 요구했습니다: OCR 도구를 실행하고, 텍스트를 내보내고, 번역기에 붙여넣고, 출력을 수동으로 다시 형식화합니다. 각 단계는 오류를 도입하고 맥락을 잃게 만듭니다.

Doclingo와 같은 현대의 AI 기반 플랫폼은 이러한 모든 단계를 단일 파이프라인으로 통합합니다. 스캔한 PDF를 업로드할 때 배경에서 발생하는 일은 다음과 같습니다:

1단계: 이미지 전처리

OCR이 시작되기 전에 시스템은 이미지를 준비합니다. 여기에는 기울기 보정(기울어진 페이지를 곧게 펴기), 대비 및 밝기 조정, 노이즈 및 얼룩 제거, 해상도 정규화가 포함됩니다. 이러한 전처리 단계는 특히 저품질 스캔의 경우 OCR 정확도를 극적으로 향상시킵니다.

2단계: AI 기반 OCR

OCR 엔진은 전처리된 이미지를 분석하고 개별 문자, 단어 및 텍스트 줄을 식별합니다. 현대 시스템은 라틴어 및 키릴 문자에서 중국어, 일본어, 한국어, 아랍어, 데바나가리 및 태국어에 이르기까지 90개 이상의 언어 스크립트에서 텍스트를 인식하는 합성곱 신경망 및 변환기 모델을 사용합니다.

이전의 문자별로 작동하는 OCR 도구와 달리, AI 기반 OCR은 맥락을 이해합니다. 문자가 모호한 경우(그것이 "l"인지 "1"인지?), 모델은 주변 텍스트를 사용하여 올바른 결정을 내립니다.

3단계: 문서 구조 분석

원시 OCR 출력은 단순한 텍스트 스트림입니다. 그러나 문서에는 구조가 있습니다 — 제목, 단락, 표, 열, 각주, 페이지 번호. AI 구조 분석은 이러한 요소를 식별하고 그들 간의 공간적 관계를 매핑합니다.

이 단계는 표에 매우 중요합니다. 스캔한 문서에서 표는 단순히 페이지에 그려진 텍스트와 선입니다. AI는 어떤 텍스트가 어떤 셀에 속하는지 인식하고, 행과 열의 경계를 식별하며, 병합된 셀과 헤더를 감지해야 합니다.

4단계: AI 번역

깨끗하고 구조화된 텍스트를 손에 쥐고, 번역 엔진이 작업을 시작합니다. Doclingo는 언어 쌍 및 문서 유형에 따라 서로 다른 강점을 가진 여러 AI 엔진 — GPT-4o, Claude, Gemini 및 DeepSeek — 를 제공합니다.

번역은 단어별로 이루어지지 않고 맥락에서 이루어집니다. AI는 전체 문서, 도메인(법률, 의료, 기술) 및 문장 간의 관계를 고려하여 자연스럽고 정확한 출력을 생성합니다.

5단계: 형식 재구성

마지막 단계는 번역된 텍스트를 원본 레이아웃을 반영하는 문서로 재구성합니다. 헤더는 헤더로 유지됩니다. 표 셀은 번역된 텍스트로 채워집니다. 열은 그 위치를 유지합니다. 글꼴 크기와 스타일은 번역된 텍스트를 수용하기 위해 필요에 따라 보존되거나 조정됩니다.

결과: 원본과 유사하게 보이는 번역된 PDF가 생성됩니다.

단계별: Doclingo로 스캔한 문서 번역하기

실용적인 절차는 다음과 같습니다.

1단계: 스캔한 문서 업로드

doclingo.ai로 이동하여 스캔한 PDF 또는 이미지 파일을 업로드 영역으로 드래그합니다. 지원되는 형식에는 PDF, JPG, PNG 및 TIFF가 포함됩니다. 플랫폼은 문서가 스캔된 것인지 네이티브인지 자동으로 감지하고 그에 따라 OCR을 활성화합니다.

2단계: 언어 선택

원본 언어를 선택하거나 "자동 감지"로 설정합니다 — OCR 엔진이 언어 스크립트를 자동으로 식별합니다. 그런 다음 목표 언어를 선택합니다. Doclingo는 90개 이상의 언어 쌍을 지원합니다.

3단계: AI 엔진 선택

다양한 AI 모델은 언어 쌍에 따라 다르게 작동합니다:

GPT-4o — 비즈니스 및 기술 콘텐츠에 특히 뛰어난 전반적인 선택
Claude — 미묘하고 맥락이 풍부한 문서 및 긴 텍스트에 강함
Gemini — 다국어 콘텐츠 및 아시아 언어 쌍에서 잘 작동
DeepSeek — 중국어 쌍 및 학술 텍스트에 최적화됨

확실하지 않은 경우, GPT-4o가 좋은 기본 선택입니다.

4단계: 이중 언어 출력 활성화 (선택 사항)

번역을 원본과 비교하고 싶다면, 이중 언어 나란히 출력을 활성화합니다. 이렇게 하면 원본 텍스트와 번역된 텍스트가 함께 배치되어 정확성을 쉽게 확인할 수 있습니다 — 특히 OCR 오류가 번역에 영향을 미칠 수 있는 중요한 스캔 문서에 유용합니다.

5단계: 번역 및 다운로드

번역 버튼을 클릭합니다. OCR 처리 및 번역은 일반적으로 문서 길이와 스캔 복잡성에 따라 30초에서 120초 이내에 완료됩니다. 완료되면:

브라우저에서 번역된 문서를 직접 미리 봅니다.
형식이 보존된 번역된 PDF를 다운로드합니다.
필요에 따라 온라인 편집기를 사용하여 수동 조정을 합니다.
이중 언어 버전을 다운로드합니다(활성화한 경우).

이것이 전체 과정입니다 — 스캔한 이미지가 들어가고 번역된 문서가 나옵니다.

관련: PDF 번역: 완벽 가이드 (2026)에서는 네이티브 PDF에 대한 비OCR 접근 방식을 포함한 모든 번역 방법을 다룹니다.

OCR 번역 품질: 정확도에 영향을 미치는 요소

OCR 번역의 품질은 두 가지에 달려 있습니다: OCR이 텍스트를 얼마나 잘 추출하는지, AI가 얼마나 잘 번역하는지. 다음은 가장 중요한 요소입니다.

스캔 해상도

이것이 가장 큰 요소입니다. 300 DPI(인치당 도트) 이상의 스캔은 OCR 엔진이 문자를 신뢰성 있게 구별할 수 있는 충분한 픽셀 데이터를 제공합니다. 150 DPI에서는 정확도가 눈에 띄게 떨어집니다. 100 DPI 이하에서는 빈번한 오류가 발생할 것으로 예상됩니다.

추천: 항상 300 DPI로 스캔하세요. 전화로 문서를 촬영하는 경우, 텍스트가 선명하고 프레임의 대부분을 차지하도록 하세요.

이미지 품질

해상도 외에도 전체 이미지 품질이 중요합니다. 주요 고려 사항:

대비: 흰색 배경에 검은색 텍스트가 이상적입니다. 저대비 문서(회색 텍스트가 오프 화이트 종이에 인쇄된 경우)는 더 많은 오류를 발생시킵니다.
선명도: 흐릿한 이미지는 — 카메라 흔들림, 움직임 또는 초점 불량으로 인해 — OCR 정확도를 급격히 저하시킵니다.
기울기: 약간 기울어진 스캔은 자동으로 보정할 수 있지만, 심하게 기울어진 페이지(10-15도 이상)는 문제를 일으킬 수 있습니다.
노이즈: 얼룩, 커피 자국, 펜 자국, 형광펜 및 기타 아티팩트는 OCR 엔진을 혼란스럽게 합니다.

글꼴 유형

표준 인쇄 글꼴(타임스 뉴 로마, 아리얼 등)은 거의 완벽한 정확도로 인식됩니다. 장식용 글꼴, 매우 작은 텍스트(8pt 이하) 및 압축되거나 겹치는 문자는 더 어렵습니다. 손으로 쓴 텍스트는 여전히 가장 도전적인 부분입니다 — 현재의 OCR 시스템은 깔끔한 인쇄체 손글씨를 적당히 처리할 수 있지만, 필기체는 여전히 신뢰할 수 없습니다.

언어 스크립트

라틴 스크립트 언어(영어, 프랑스어, 독일어, 스페인어)는 대부분의 모델이 이러한 스크립트에 대해 많이 훈련되었기 때문에 가장 높은 OCR 정확도를 누립니다. CJK 문자는(중국어, 일본어, 한국어) 잘 지원되지만, 이러한 스크립트에 대해 특별히 훈련된 모델이 필요합니다. 아랍어와 히브리어는 오른쪽에서 왼쪽으로 읽는 텍스트 방향과 연결된 문자 형태로 인해 복잡성을 더합니다. 덜 일반적인 스크립트(티베트어, 크메르어, 미얀마어)는 정확도가 낮을 수 있습니다.

문서 상태

원본의 물리적 상태가 중요합니다. 누렇게 변색된 페이지, 바랜 잉크, 주름이 잡힌 종이, 찢어진 가장자리 및 물 손상은 모두 OCR 정확도를 감소시킵니다. 중요한 역사적 문서의 경우, OCR 번역을 시도하기 전에 전문적인 디지털화를 고려하세요.

스캔한 문서 번역을 위한 대안

Doclingo는 전체 파이프라인을 하나의 도구로 처리하지만, 알아둘 가치가 있는 다른 접근 방식도 있습니다.

도구	OCR 내장	번역 품질	레이아웃 보존	언어	워크플로
Doclingo	예 (AI 기반)	다중 엔진 AI	전체	90+	단일 단계
Google Translate + Google Lens	별도 도구	기본 NMT	없음	130+	두 단계
Adobe Acrobat OCR + DeepL	두 개의 별도 단계	좋음 (EU 언어)	부분적	33	다단계
ABBYY FineReader + 수동 번역	예 (OCR 전용)	N/A (번역 없음)	좋은 OCR 출력	200+ (OCR)	다단계
무료 온라인 OCR + 별도 번역기	별도 단계	가변적	없음	다양	다단계

Google Translate + Google Lens는 촬영한 텍스트의 빠르고 비공식적인 번역을 위한 무료 옵션입니다. Google Lens는 이미지에서 OCR을 수행하고 Google Translate는 텍스트를 처리합니다. 결과는 기능적이지만 모든 형식과 구조가 손실됩니다.

Adobe Acrobat OCR + DeepL은 이미 Acrobat Pro에 가입한 경우에 작동합니다($22.99/월). Acrobat에서 OCR을 실행하여 검색 가능한 PDF를 만든 다음 DeepL을 사용하여 번역합니다. 이는 좋은 OCR 품질과 강력한 유럽 언어 번역을 제공하지만, 이 과정에서 복잡한 형식이 손실되며 DeepL은 33개 언어만 지원합니다.

ABBYY FineReader는 뛰어난 정확도를 가진 전용 OCR 도구입니다. 그러나 번역하지 않으므로 OCR 텍스트를 내보내고 별도의 번역 도구를 사용해야 합니다. 이는 스캔한 문서를 대량으로 처리하고 자체 번역 워크플로를 가진 조직을 위한 전문적인 옵션입니다.

Doclingo와 같은 통합 플랫폼의 주요 장점은 단계 간의 간극을 없애는 것입니다. 각 핸드오프 — OCR 도구에서 텍스트 파일로, 번역 도구로, 형식화 소프트웨어로 — 는 맥락 손실, 구조 파괴 및 오류 누적의 잠재력을 도입합니다.

관련: PDF를 번역하고 원본 레이아웃을 유지하는 방법에서는 형식 보존에 대해 더 자세히 설명합니다.

일반적인 OCR 번역 문제와 해결책

최고의 도구를 사용하더라도 특정 상황에서는 추가적인 주의가 필요합니다. 다음은 가장 일반적인 문제와 이를 해결하는 방법입니다.

흐릿하거나 저해상도 스캔

문제: OCR 정확도는 200 DPI 이하에서 급격히 떨어지며, 번역 엔진이 처리할 수 없는 엉망인 텍스트를 생성합니다.

해결책: 원본 문서를 300 DPI 이상으로 다시 스캔합니다. 원본 종이가 없는 경우, 이미지 향상 소프트웨어를 사용하여 스캔을 선명하게 하고 대비를 높인 후 업로드합니다. Doclingo를 포함한 일부 도구는 자동 이미지 전처리를 적용하지만, 더 나은 스캔으로 시작하는 것이 항상 더 나은 결과를 생성합니다.

하나의 문서에 혼합된 언어

문제: 문서에 두 개 이상의 언어로 된 텍스트가 포함되어 있습니다 — 예를 들어, 영어와 중국어 조항이 있는 이중 언어 계약서 또는 여러 언어로 인용된 연구 논문.

해결책: Doclingo의 OCR은 문서 내에서 여러 언어를 자동으로 감지합니다. 번역 엔진은 각 언어 세그먼트를 적절하게 처리하여 기본 언어를 번역하고 보조 언어 요소를 지능적으로 처리합니다.

스캔한 문서의 표

문제: 표는 OCR을 올바르게 처리하기 가장 어려운 구조적 요소입니다. 셀 경계, 병합된 셀 및 정렬된 열은 추출 엔진을 혼란스럽게 할 수 있습니다.

해결책: AI 기반 구조 감지는 대부분의 표 형식을 처리합니다. 최상의 결과를 위해 스캔이 고대비로 명확한 그리드 선이 보이도록 하세요. 매우 복잡한 표(중첩된 헤더, 불규칙한 병합 셀)는 번역 후 약간의 수동 수정이 필요할 수 있습니다.

손으로 쓴 텍스트

문제: 손글씨 인식은 인쇄된 텍스트 OCR보다 정확도가 현저히 떨어집니다. 필기체, 일관되지 않은 문자 형태 및 개인적인 글쓰기 스타일은 현재 AI 모델에 도전 과제가 됩니다.

해결책: 중요한 손글씨 문서의 경우, 먼저 텍스트를 수동으로 필사한 다음 필사를 번역하는 것이 좋습니다. 손글씨가 깔끔하고 인쇄된 경우(필기체가 아닌 경우), 현대 OCR이 적절히 처리할 수 있지만, 항상 추출된 텍스트를 확인한 후 번역을 신뢰해야 합니다.

특이한 글꼴이 있는 역사적 문서

문제: 19세기 또는 그 이전의 문서는 현대 OCR 모델이 훈련되지 않은 글꼴, 문자 형태 또는 타이포그래픽 관습을 사용할 수 있습니다. 고딕/프락투르 스크립트, 고풍스러운 철자 및 구식 문자는 모두 도전 과제가 됩니다.

해결책: 결과는 상당히 다를 수 있습니다. 먼저 이미지 품질을 향상시키는 것으로 시작하세요 — 대비를 높이고 배경 노이즈를 제거하며 페이지를 곧게 펴세요. 중요한 역사적 문서의 경우, 번역하기 전에 Transkribus와 같은 전문 역사적 OCR 도구를 사용하는 것을 고려하세요.

관련: 인용을 잃지 않고 연구 논문을 번역하는 방법에서는 스캔한 출처 자료를 포함할 수 있는 학술 문서를 처리하는 방법을 다룹니다.

자주 묻는 질문

문서의 사진을 번역할 수 있나요?

네. 문서를 전화로 촬영한 경우, 해당 이미지를 Doclingo에 직접 업로드할 수 있습니다. OCR 엔진이 사진에서 텍스트를 추출하고 번역합니다. 지원되는 이미지 형식에는 JPG, PNG, TIFF 및 PDF가 포함됩니다.

OCR 번역의 정확도는 얼마나 됩니까?

깨끗하고 고해상도 스캔의 인쇄된 텍스트의 경우, OCR 정확도는 99%를 초과하며, 전체 번역 정확도(OCR + AI 번역 결합)는 일반적으로 95% 이상입니다. 저품질 스캔, 특이한 글꼴 또는 손글씨는 정확도를 감소시킵니다. 중요한 문서 — 법적 계약, 의료 기록, 공식 제출물 — 의 경우, 항상 출력을 수동으로 검토하거나 전문가에게 확인받는 것이 좋습니다.

OCR이 손글씨에 작동합니까?

상황에 따라 다릅니다. 깔끔한 인쇄 손글씨(블록 문자)는 적당한 정확도로 처리될 수 있습니다. 필기체는 현재 모든 OCR 시스템에서 신뢰할 수 없습니다. 손글씨 문서를 번역해야 하는 경우, 먼저 수동으로 필사한 다음 타이핑된 텍스트에 AI 번역 도구를 사용하는 것이 가장 좋습니다.

지원되는 이미지 형식은 무엇입니까?

Doclingo는 PDF, JPG, PNG 및 TIFF 파일을 수락합니다. PDF는 스캔한 문서의 가장 일반적인 형식입니다. 스캔이 특이한 형식(BMP, HEIC, WebP)인 경우, 업로드하기 전에 PDF 또는 PNG로 변환하세요 — 대부분의 운영 체제에서 이를 기본적으로 수행할 수 있습니다.

스캔한 문서를 업로드할 때 안전한가요?

네. Doclingo는 모든 업로드에 대해 암호화된 파일 전송(TLS/SSL)을 사용하며, 처리 후 문서를 자동으로 삭제합니다. 귀하의 파일은 장기적으로 저장되지 않으며 AI 모델 훈련에 사용되지 않습니다. 매우 민감한 문서의 경우, 데이터 처리 및 보존에 대한 전체 세부정보는 Doclingo의 개인정보 보호정책을 검토하세요.

OCR이 아랍어 또는 히브리어와 같은 오른쪽에서 왼쪽으로 읽는 언어를 처리할 수 있나요?

네. 현대 AI 기반 OCR은 아랍어, 히브리어, 우르두어 및 페르시아어를 포함한 오른쪽에서 왼쪽으로 읽는 스크립트를 지원합니다. 텍스트 추출은 올바른 읽기 방향을 정확하게 보존하며, 번역 출력은 재구성된 문서에서 적절한 오른쪽에서 왼쪽으로 형식을 유지합니다.

OCR 번역은 얼마나 걸리나요?

대부분의 문서에 대해 전체 과정 — OCR 추출, 구조 분석, 번역 및 형식 재구성 — 은 30초에서 120초가 걸립니다. 매우 긴 문서(50페이지 이상) 또는 광범위한 전처리가 필요한 심하게 열화된 스캔은 몇 분이 걸릴 수 있습니다.

결론

스캔한 문서는 번역의 막다른 길이었습니다. 텍스트가 이미지에 갇혀 있다면, 수동으로 다시 입력하거나 비싼 전문 서비스를 이용하는 것 외에는 선택의 여지가 없었습니다. 이제는 더 이상 그렇지 않습니다.

OCR + AI 번역은 전체 파이프라인을 처리합니다 — 픽셀 수준의 문자 인식에서 맥락 인식 번역, 형식화된 출력까지 — 단일 자동화된 워크플로로. 이 기술은 일상적인 사용에 충분히 정확하고, 문서를 처리하는 데 빠릅니다.

최고의 결과를 얻으려면 세 가지를 기억하세요: 가능한 한 높은 품질의 스캔(300 DPI, 좋은 대비, 기울기 없음)으로 시작하고, 언어 쌍에 적합한 AI 엔진을 선택하며, 중요한 문서의 경우 항상 출력을 검토하세요.

작동 방식을 가장 쉽게 확인하는 방법은 자신의 스캔한 문서 중 하나로 시도해 보는 것입니다.

Doclingo 무료로 사용해 보기 -->

문서 번역을 위한 더 많은 가이드:

스캔한 문서 번역: OCR + AI 설명 (2026)