PDFを翻訳して元のレイアウトを保持する方法 (2026)
PDFを翻訳して元のレイアウトを保持する方法
PDFを翻訳します。結果を開きます。テーブルが消えています。ヘッダーが本文に統合されています。画像が間違ったページに移動しています。2カラムのレイアウトが1つの未フォーマットのテキストの流れに崩れています。
聞き覚えがありますか?これはほとんどすべての翻訳ツールで起こります。翻訳された内容は正確かもしれませんが、文書は元のものとはまったく異なります。そして、その文書を同僚、クライアント、または政府機関と共有する必要がある場合、崩れたレイアウトは選択肢ではありません。
良いニュース:そうする必要はありません。元のフォーマットを保持しながらPDFを翻訳する方法と特定のツールがあります。この記事では、フォーマットが壊れる理由、「フォーマットを保持する」とは実際に何を意味するのか、2026年にレイアウトを保持するのに最適な方法を解説します。
目次
- ほとんどのPDF翻訳ツールがフォーマットを壊す理由
- 「フォーマットを保持する」とは実際に何を意味するのか
- PDFフォーマットを保持する5つの方法(ランキング)
- ステップバイステップ:レイアウトを保持しながらPDFを翻訳する
- 文書タイプ別のフォーマットの課題
- レイアウト保持のためのヒント
- FAQ
ほとんどのPDF翻訳ツールがフォーマットを壊す理由
翻訳されたPDFが壊れて見える理由を理解するには、PDFがどのように機能するかを理解する必要があります。
PDFはWord文書のようではありません。Wordでは、テキストは連続した流れで流れます — 一つの段落の後に別の段落が続き、上から下へ。PDFはテキストをキャンバス上の絶対位置に配置された断片として保存します。単一の文は、各自の座標、フォント、サイズを持つ5つの別々のテキストブロックとして保存されることがあります。固有の読み取り順序はなく、「段落」の概念もなく、流れるレイアウトもありません。
翻訳ツールがPDFを処理するとき、断片化された構造からテキストを抽出し、翻訳のために送信し、その後元に戻す必要があります。ほとんどのツールは最初の2つのステップを合理的にうまく処理しますが、3つ目で完全に失敗します。翻訳されたテキストは、元のレイアウトを再構築しようとせずに新しい文書にダンプされます。
フォーマットが壊れる具体的な理由は次のとおりです:
言語間で文の長さが変わる。 ドイツ語のテキストは英語の約30%長くなります。日本語はかなり短くなることがあります。翻訳されたテキストが元のスペースに収まらない場合、テキストボックスがオーバーフローし、カラムがずれ、ページブレークが移動します。
右から左への言語は全体の流れを反転させる。 アラビア語やヘブライ語は右から左に読みます。左から右への文書をこれらの言語に翻訳するには、単語を入れ替えるだけでなく、全体のレイアウトをミラーリングする必要があります。
テーブルはその構造を失う。 PDF内のテーブルは本物のテーブルではありません。特定の座標に配置されたテキストであり、その周りに描かれた線があります。ほとんどの翻訳ツールは各セルからテキストを抽出しますが、どのテキストがどのセル、どの行、どの列に属するかを見失います。
フォントがターゲット言語をサポートしていない場合がある。 元の文書は中国語の文字やアラビア語のグリフを含まないフォントを使用しているかもしれません。翻訳ツールは、文書の視覚スタイルを変更せずに互換性のあるフォントに置き換える必要があります。
マルチカラムレイアウトがフラット化される。 2カラムの学術論文、パンフレット、ニュースレターは特に脆弱です。翻訳ツールは両方のカラムを単一のストリームとして読み取り、混乱した出力を生成します。
これがまさに「PDFを翻訳してフォーマットを保持する」がオンラインで最も検索される翻訳クエリの1つである理由です。人々はフラストレーションを感じています — そしてそれは正当な理由です。
関連: PDF翻訳:完全ガイド (2026) では、フォーマットを保持しない方法を含むすべての翻訳方法を詳しく説明しています。
「フォーマットを保持する」とは実際に何を意味するのか
PDFをフォーマットを失わずに翻訳することについて話すとき、私たちは元の文書のすべての視覚要素を保持することを意味します。具体的には:
テキストの位置と整列。 翻訳されたテキストは、元のページと同じ位置に表示されます。見出しは上部に、脚注は下部に、サイドバーは余白に留まります。
フォントスタイルとサイズ。 太字のテキストは太字のまま、イタリックはイタリックのままです。フォントサイズは維持されるか、視覚的に一貫性を保つために比例的に調整されます。
テーブル構造。 行、列、ヘッダー、マージセル、セルの境界はすべてそのままです。翻訳された内容は正しいセル内に配置されます。
画像とグラフィックス。 画像は元の位置に留まります。画像の下または横にあるキャプションやラベルは翻訳されます。画像内に埋め込まれたテキストはOCRが必要で、別途処理されます。
ヘッダーとフッター。 すべてのページにわたってランニングヘッダー、フッター、ページ番号が保持されます。
ページレイアウト。 マルチカラムレイアウト、テキストボックス、コールアウトボックス、サイドバーは視覚的な配置を維持します。ページブレークは論理的な場所で発生します。
色と背景。 背景色、シェーディング、ハイライトされたテキストは変更されません。
すべてのツールがこれらすべてを提供するわけではありません。基本的なテキストフォーマット(太字、イタリック)を保持するが、テーブル構造を壊すものもあります。画像をそのまま保持するが、マルチカラムレイアウトをフラット化するものもあります。最良のツールは、これらすべての要素を一緒に処理します。
PDFフォーマットを保持する5つの方法(ランキング)
方法1: Doclingo(全体的に最良)
Doclingoは、元のレイアウトを保持しながら文書を翻訳するために特別に設計されています。テキストを抽出して文書をゼロから再構築するのではなく、最初にPDFの構造を分析します — テーブル、カラム、ヘッダー、フッター、画像、テキストブロックを特定し、その後その既存の構造内でコンテンツを翻訳します。
レイアウト保持: 元のフォーマットの95%以上が維持され、テーブル、マルチカラムレイアウト、画像、ヘッダー、フッターが含まれます。
動作方法:
- PDFをアップロードすると、システムが文書の完全な構造をマッピングします
- AI翻訳が各特定された要素内で適用されます
- 出力PDFは元の視覚的レイアウトを正確に保持します
- 原文と翻訳を並べて表示するバイリンガル出力が利用可能です
強み:
- 複雑な文書の完全なレイアウト保持
- スキャンされたPDF用の組み込みOCR
- マルチエンジンAI(GPT-4o、Claude、Gemini、DeepSeek) — 言語ペアに最適なエンジンを選択
- レビューと比較のためのバイリンガル出力
- 90以上の言語をサポート
- 翻訳後の調整用のオンラインエディタ
制限事項:
- 高度に専門的なコンテンツ(法的、医療的)はドメイン専門家によるレビューが必要
- 非常に複雑なレイヤーデザイン(重なり合うテキストボックス、装飾要素)は、若干の手動調整が必要な場合があります
最適な対象: 実際に元のように見える翻訳されたPDFが必要な人。
方法2: DeepL(部分的保持)
DeepLは、特にヨーロッパの言語ペアに対して強力な翻訳品質を提供する文書翻訳を提供します。基本的なフォーマット(太字、イタリック、段落構造)を保持しますが、より複雑なレイアウトには苦労します。
レイアウト保持: 基本的なフォーマットが維持されます。テーブル、マルチカラムレイアウト、複雑な構造はしばしば壊れるか、手動で修正が必要です。
強み:
- ヨーロッパの言語(ドイツ語、フランス語、スペイン語、オランダ語)に対する優れた翻訳品質
- クリーンなインターフェース
- 基本的なテキストフォーマット(太字、イタリック、段落)を保持
制限事項:
- テーブル構造が頻繁に壊れる
- マルチカラムレイアウトが単一のカラムにフラット化される
- 33の言語に制限 — 中国語、アラビア語、ヒンディー語、タイ語、ベトナム語は含まれない
- スキャンされた文書用のOCRなし
- 無料プランは月に3文書、5MBのファイルサイズに制限
- バイリンガル出力なし
最適な対象: ヨーロッパの言語間で翻訳されるシンプルな単一カラム文書。
関連: DeepL vs Doclingo: 文書翻訳の比較 では、詳細な比較を提供します。
方法3: DocTranslator
DocTranslatorはGoogle翻訳APIを使用し、いくつかの文書フォーマットを保持しようとします。結果は一貫性がなく、基本的なレイアウトは通過するかもしれませんが、複雑なものは壊れる傾向があります。
レイアウト保持: シンプルな文書の基本的なフォーマット。複雑なレイアウトは失敗します。
強み:
- Google翻訳を介して多くの言語をサポート
- シンプルなアップロードと翻訳のワークフロー
- 小さな文書は無料
制限事項:
- Google翻訳の品質に依存しており、適切ですがプレミアムではありません
- 複雑なテーブル、カラム、画像はしばしばずれます
- スキャンされた文書用のOCRサポートなし
- バイリンガル出力なし
- 文書の複雑さに応じて結果が一貫しない
最適な対象: おおよそのフォーマットが許容されるシンプルな単一カラムPDFの迅速な翻訳。
方法4: Adobe Acrobat + 翻訳プラグイン
すでにAdobe Acrobat Proに加入している場合、PDFをWordにエクスポートし、別のツールを使用してWordファイルを翻訳し、再度PDFに変換できます。一部のサードパーティプラグインは、Acrobat内で直接翻訳機能を追加します。
レイアウト保持: PDFからWordへの変換品質に大きく依存します。シンプルな文書はうまく変換されますが、複雑なレイアウトは変換中に壊れることがよくあります。
強み:
- 手動修正用のプロフェッショナルグレードのPDF編集ツール
- 出力のすべての要素を完全に制御
- すでにAdobeエコシステムにいるユーザーに適しています
制限事項:
- Adobe Acrobat Proのサブスクリプションが必要($22.99/月)
- 組み込みのAI翻訳なし — 別のツールまたはプラグインが必要
- 遅くて手動のマルチステップワークフロー
- 各変換ステップでフォーマットが壊れる可能性があります
- 学習曲線が急
最適な対象: Adobe Creative Cloudにすでに支払っているユーザーで、手動のマルチステッププロセスに慣れている人。
方法5: 手動Word変換
自分で行うアプローチ:PDFを任意のコンバータを使用してWordに変換し、Wordファイルを翻訳し、再度PDFにエクスポートします。
レイアウト保持: 不良。各変換ステップでフォーマットエラーが発生し、累積します。
ステップ:
- PDFをWordに変換(Adobe、オンラインツール、またはWordの組み込みコンバータを使用)
- Wordファイルを翻訳(任意の翻訳ツールを使用)
- 翻訳されたWordファイルのフォーマットの問題を修正
- 再度PDFにエクスポート
強み:
- 各ステップを完全に制御
- Wordファイルに任意の翻訳ツールを使用可能
- プロセス全体で手動編集が可能
制限事項:
- PDFからWordへの変換はしばしばテーブル、カラム、画像を壊します
- 複数の変換ステップは累積的なフォーマットの損失を意味します
- 長いまたは複雑な文書には非常に時間がかかります
- 各段階で手動のフォーマットクリーンアップが必要
最適な対象: 翻訳を大幅に編集する必要があり、フォーマットのクリーンアップにかなりの時間をかけることを気にしない人。
方法比較の概要
| 基準 | Doclingo | DeepL | DocTranslator | Adobe + Plugin | 手動Word |
|---|---|---|---|---|---|
| レイアウト保持 | 完全(95%+) | 部分的 | 基本 | 変動 | 不良 |
| テーブル構造 | 保持 | しばしば壊れる | しばしば壊れる | 変動 | しばしば壊れる |
| マルチカラム | 保持 | フラット化 | フラット化 | 変動 | フラット化 |
| OCRサポート | はい | いいえ | いいえ | プラグイン必要 | いいえ |
| バイリンガル出力 | はい | いいえ | いいえ | いいえ | いいえ |
| 言語 | 90+ | 33 | 130+ | 変動 | 変動 |
| 速度 | 速い(1-2分) | 速い | 速い | 遅い | 非常に遅い |
| コスト | フリーミアム | フリーミアム | フリーミアム | $23/月 | 無料-ish |
ステップバイステップ:レイアウトを保持しながらPDFを翻訳する
Doclingoを使用してPDFを翻訳し、フォーマットを保持する方法は次のとおりです:
ステップ1: PDFをアップロード
doclingo.aiにアクセスし、PDFをアップロードエリアにドラッグするか、ファイルを参照するためにクリックします。このプラットフォームは、テキストベースおよびスキャンされたPDFを受け入れます。スキャンされた文書が検出されると、OCRが自動的に有効になります。
ステップ2: システムに文書構造を分析させる
アップロードが完了すると、システムは自動的に文書のレイアウトをマッピングします — テーブル、カラム、ヘッダー、フッター、画像、テキストブロック、その他の構造要素を特定します。この構造分析が翻訳中のフォーマット保持を可能にします。
ステップ3: ターゲット言語とAIエンジンを選択
ソース言語を選択(または「自動検出」のままにします)し、ターゲット言語を選択します。次に、文書に最適なAIエンジンを選択します:
- GPT-4o — 技術的およびビジネスコンテンツに対する強力な全体的パフォーマンス
- Claude — ニュアンスのある、文脈重視の文書や長文に最適
- Gemini — 多言語コンテンツやアジア言語ペアに適しています
- DeepSeek — 中国語ペアや学術コンテンツに最適化されています
不明な場合は、GPT-4oが信頼できるデフォルトです。
ステップ4: バイリンガル出力を有効にする(オプション)
原文と翻訳されたテキストの両方を並べたPDFが必要な場合は、バイリンガル出力を有効にします。これは、レビュー、比較、言語学習、両方の当事者が翻訳とともに原文を参照する必要がある状況で特に便利です。
ステップ5: 翻訳してダウンロード
翻訳をクリックします。ほとんどの文書は30〜90秒で完了します。完了したら:
- ブラウザで翻訳されたPDFを直接プレビューします
- 元のフォーマットが保持された翻訳されたPDFをダウンロードします
- オンラインエディタを使用して微調整を行います
- バイリンガルバージョンを有効にした場合はダウンロードします
5つのステップ、2分未満、フォーマットはそのまま。
文書タイプ別のフォーマットの課題
異なるタイプの文書は異なるフォーマットの課題を提示します。以下はそれらの内訳です:
| 文書タイプ | 一般的なフォーマットの問題 | 注意すべき点 |
|---|---|---|
| 学術論文 | 2カラムレイアウト、引用、脚注、方程式 | 引用マーカーと方程式の配置を確認 |
| ビジネスレポート | チャート、データテーブル、グラフ、ブランドヘッダー | 数値データと通貨フォーマットが正しいことを確認 |
| 契約書 | 番号付き条項、定義された用語、署名ブロック | 条項番号が連続していることと用語が一貫していることを確認 |
| プレゼンテーション(PDF) | スライドレイアウト、箇条書き、画像、スピーカーノート | スライドの境界が維持されていることを確認 |
| パンフレット | マルチカラムレイアウト、画像、コールアウトボックス、プルクオート | 複雑なレイアウトでの画像とテキストの整列を確認 |
| マニュアル | ステップバイステップの指示、図、警告ボックス | 図のラベルと警告テキストが翻訳されていることを確認 |
どの文書タイプにおいても、最も影響力のあることは高品質のソースPDFから始めることです。埋め込まれたフォントを持つクリーンでテキストベースのPDFは、低解像度のスキャンよりも常に良い結果を生み出します。
関連: 引用を失わずに研究論文を翻訳する方法 では、学術文書翻訳についてさらに詳しく掘り下げています。
レイアウト保持のためのヒント
- スキャンではなくテキストベースのPDFから始める。 元のWord、InDesign、またはLaTeXソースファイルにアクセスできる場合は、そこから新しいPDFをエクスポートします。テキストベースのPDFは、スキャンされた文書よりもはるかに良いフォーマットで翻訳されます。
- スキャンされたPDFの場合は、高品質のスキャンを使用する。 スキャンが避けられない場合は、300DPI以上を使用します。文書がまっすぐで、均等に照らされ、影やしわがないことを確認します。白い背景に黒いテキストが最良のOCR結果を生み出します。
- 言語ペアに最適なAIエンジンを選択する。 異なるAIモデルには異なる強みがあります。GPT-4oは信頼できる一般的なモデルです。DeepSeekは中国語に優れています。Claudeは長くニュアンスのある文書に適しています。精度が重要な場合は、同じページで2つのエンジンをテストしてください。
- 品質レビューのためにバイリンガル出力を使用する。 原文と翻訳を並べて見ることは、エラーを見つける最も早い方法です。バイリンガルビューでは、フォーマットが保持されているかどうかもすぐに明らかになります。
- 出力を確認し、オンラインエディタを使用する。 最良のAI駆動ツールでも、時折小さな調整が必要な場合があります。テキストブロックがわずかにオーバーフローするか、テーブルセルに小さな調整が必要な場合があります。オンラインエディタを使用すれば、最初からやり直すことなく修正できます。
- 非常に複雑なレイヤーデザインのPDFを避ける。 重なり合うテキストボックス、テキストに対する透かし、または非常に装飾的なレイアウトを持つ文書は、どのツールでも扱いが難しくなります。可能であれば、ソースを簡素化してください。
関連: スキャンされた文書の翻訳:OCR + AIの説明 では、スキャンの翻訳に関するすべてをカバーしています。
FAQ
どの翻訳者がPDFフォーマットを最も保持しますか?
文書翻訳のために特別に設計されたAI駆動ツールは、最も多くのフォーマットを保持します。Doclingoは、テーブル、カラム、ヘッダー、画像、テキストスタイリングを含む元のレイアウトの95%以上を維持します。Google翻訳のような一般的な翻訳ツールは、すべてのフォーマットを完全に削除します。
Google翻訳はPDFフォーマットを保持しますか?
いいえ。Google翻訳の文書モードはテキストコンテンツを翻訳しますが、元のフォーマットを完全に壊します。出力は新しいレイアウトのプレーンテキストであり、元のテーブル、カラム、視覚構造はありません。フォーマットが重要な場合は、専門の文書翻訳ツールが必要です。
テーブルを含むPDFを翻訳してテーブル構造を保持できますか?
はい、ただし翻訳前に文書構造を分析するツールのみです。Doclingoはテーブルの行、列、ヘッダー、マージセルを特定し、その構造内でコンテンツを翻訳します。他のほとんどのツールはテーブルからテキストを抽出し、グリッドレイアウトを完全に失います。
画像を含むPDFはどうですか — 画像はそのままですか?
Doclingoのようなフォーマット保持ツールでは、画像は元の位置に留まります。画像の周りのテキストキャプションやラベルは翻訳されます。画像自体に埋め込まれたテキスト(ラベル付きの図など)がある場合は、OCRが必要です。
スキャンされたPDFを翻訳してフォーマットを保持できますか?
はい、ただし組み込みのOCRを持つツールが必要です。OCRエンジンがスキャンされた画像からテキストを抽出し、AIが翻訳し、その結果が元のレイアウトに戻されます。Doclingoはこれを自動的に処理します。最良の結果を得るには、300DPI以上の高品質のスキャンから始めてください。
翻訳されたPDFは元のPDFと同じページ数になりますか?
ほとんどの場合、はい。フォーマット保持ツールは同じページ構造を維持することを目指します。ただし、ターゲット言語がソースよりも大幅に長い場合(たとえば、中国語からドイツ語に翻訳する場合)、一部のページは追加のテキストを収容する必要があり、時折ページが追加されることがあります。
バイリンガル出力はフォーマットを追跡するのに役立ちますか?
絶対に。バイリンガルの並列出力は、原文と翻訳されたテキストを一緒に表示します。これにより、フォーマットが保持されているかどうかを簡単に確認でき、テーブル、ヘッダー、レイアウト要素が2つのバージョン間で一致しているかを一目で確認できます。また、レビューや承認のワークフローにも役立ちます。
結論
PDFを翻訳してフォーマットを壊さずに保つことは、かつてはほぼ不可能でした。2026年には、AI駆動のツールがこの問題を解決しましたが、すべてのツールが同じではありません。
文書にテーブル、カラム、画像、または単純なプレーンテキストの単一カラム以上のレイアウトがある場合、言語だけでなく文書構造を理解するツールが必要です。
以下は迅速な意思決定フレームワークです:
- シンプルな単一カラム文書をヨーロッパの言語間で翻訳する場合? DeepLは基本的なフォーマットを適切に処理します。
- レイアウトが重要な文書の場合? Doclingoは元のフォーマットの95%以上を保持し、スキャンされたPDFを処理し、バイリンガル出力を提供します。
- 完全な手動制御が必要で、時間に余裕がある場合? Adobeまたは手動のWord変換ルートは、かなりの労力をかけて完全な制御を提供します。
違いをすぐに確認する最も早い方法は、自分で試すことです。PDFをアップロードし、翻訳し、出力を比較してください。
Doclingoを無料で試す — 最初のPDFを60秒で翻訳
文書翻訳に関するその他のガイド:
- PDF翻訳:完全ガイド (2026)
- DeepL vs Doclingo: 文書翻訳の比較
- 引用を失わずに研究論文を翻訳する方法
- スキャンされた文書の翻訳:OCR + AIの説明
- 2026年のベストAI翻訳ツール
