同じPDFでもテキストをコピーできるものとできないもの、2種類あることをご存じですか?
テキストコピーできるのは、文書作成ソフトなどから作成されたPDFです。スキャナーやスマホカメラでスキャンされたPDFは、画像扱いとなるためテキストコピーができません。
しかし、スキャンされたPDFでもGoogleドキュメントで開くことで、簡単にテキスト化することができます。
ここでは、GoogleドキュメントでPDFをテキスト化する方法について紹介します。
またテキストに挿入された余分なスペースも取り除きます。
今まで「スキャンされたPDFはテキスト化できない」と諦めていた方、ぜひ最後までチェックしてください。。
PDFをテキスト化する方法
Googleドキュメントを使ってPDFをテキスト化する方法を紹介します。
Googleドキュメントは、Googleアカウントにログインしないと使用できません。
Googleアカウントをお持ちでない方は、Googleアカウントを作成しログインしてから、以下の手順にお進みください。
①Googleドライブを開く
Google検索画面、上部右に表示される点が並んだ「アプリ一覧」をクリックし、「ドライブ」をクリックすると
Googleドライブにアクセスできる。
②ドライブの中にPDFをドロップ
Googleドライブの中にテキスト化したいPDFを移動させます。PDFがGoogleドライブにアップロードされます。
③Googleドキュメントで開く
アップロードしたPDFをダブルクリックし、PDFを表示させます。上部にある「アプリで開く」から「Googleドキュメント」を選択しクリックします。
これでスキャンしたPDFを簡単にテキスト化することができました。
テキストに挿入された無駄なスペースを削除する
PDFのテキスト化は完了しましたが、まだ編集できる状態ではありません。
文字と文字との間に余分なスペースが入ってしまうことがあります。
ここでは、テキスト内に挿入された複数のスペースを一瞬で取り除く方法についてお伝えします。
①「置換と検索」をクリック
「編集」から「置換と検索」を選択し、クリックする。
②半角スペース「すべて置換」をクリック
「検索する文字列」に半角スペースを入力し、置換後の文字列には何も入力しません。
この状態で「すべて置換」をクリックすると、テキスト内のスペースがすべて削除されます。
PDFテキスト化まとめ
画像として保存されたスキャンPDFをテキスト化する方法についてお伝えしました。
PDFをGoogleドキュメントで開くという簡単な方法で、かなり精度高くテキストに変換することができます。
テキスト化の際に不要なスペースが入ることもありますが、「検索と置換」の機能を使えば一瞬で取り除くことが可能です。一から入力するより、はるかに楽で効率的な方法なので、ぜひお試しください。
そして最後は、人の目で確認することをお忘れなく。
コメント