<IT情報・ネットワーク編> IT情報TOPヘ

Google Drive で手書き文書を電子化(AI-OCR)

(2023年02月01日)

 みなさんは「手書きの文書」を電子化(テキスト化)する必要になったことはありませんか。手書き文書を電子化して欲しい、Wordが扱えない家族からのこんな願いが容易に叶えられる時代になりました。古くからあったOCR(Optical Character Recognition:光学文字認識)は長い間実用には遠かったのですが、現在のAIを活用した「AI-OCR」は高精度の電子化が可能になり本格的に実用化されています。
 AI-OCRは業務用の高価なものから、一般人が無料で手軽に使えるものまで多様化も進んでいます。税務署では送られてきた印刷や手書きの確定申告書を、電子化するのに使っていると聞いています。無料で一般向けの用途ではGoogleが一歩進んでいるようで、自社の複数のサービスに AI-OCRの機能を提供していますが、多くの人はその存在に気付いていないようです。
 今回はGoogleサービスの一つ「Googleドライブ」を使って、手書き文書を電子化する手順をたどってみました。GoogleドライブにGoogleアカウントでログインして、ファイルをアップするだけで普通の手書き文書がほぼ完ぺきに電子化できました。以下はその報告です。

Googleドライブにログインする方法>
 Googleドライブの本来の用途は最大15GBまでデータを、無料でアップロードできるクラウドの「ストレージサービス」です。まず、Googleドライブへログインする方法を説明します。GoogleドライブにアクセスするにはChromeのアプリ一覧から入るのが分かりやすいでしょう。
 それには下図左のように Googleのホーム画面(https://www.google.com)を開き、その右上にある「アプリ一覧」アイコンをクリックします。さらに、その下方にある「ドライブ」を選択すると、下図右の「Googleドライブ」のトップ画面になります。左列の項目は「マイドライブ」が選択されています。

 紙に書いた手書きの文章は、前以てプリンタの「スキャナ」機能などでスキャンして、画像ファイルにしておく必要があります。スキャナのOCR用の dpi(dot per inch:スキャンするドット密度)は、150dpi ほどでいいでしょう。
 以上でアップロードの準備は整いました。上図右の雲形マークの部分、すなわちドライブの「ストレージ」にスキャンした画像ファイルをアップロードすることで、ドライブのOCR 利用が可能になります。ファイルのアップロードには、上図右のように「ドラッグ&ドロップ」による方法と、同図左上の「新規」ボタンからする方法があります。

<手書き文字の電子化の手順>
 下図「Googleドライブ」にアップロードした画像ファイルを選択して、右クリック~「アプリで開く」~「Googleドキュメント」を選択します。この操作でGoogleドライブのOCRの読み取り機能が実行され、結果が「Googleドキュメント」に出力されます。

 GoogleドライブでのOCRによる文字の電子化(テキスト化)には少し時間を要します。その後、OCRの結果は下図のように新しいタブ「Googleドキュメント」を開いて、OCR対象の画像ファイルとともに出力されます。実は、この「Googleドキュメント」は「Googleドライブ」と同じく Googleサービス の一つです。


<OCR後のデータファイルの扱い>
 上図の手書き文字はきれいな字で書かれていますが、ネットで調べてみるとかなり個性的な文字でもOKのようです。下図はOCR後に「Googleドキュメント」に電子化(テキスト化)されて出力された文字をコピペして示したものです。ほぼ完璧に電子化されています。
 しかも、OCR後の文章をよく眺めてみると、画像ファイルの「、」が「。」に変換されており、「荘って」が意味?の「喋って」に変換されたところはアンダーラインが引かれるなど、しっかり構文チェックもされています。この構文チェックはクラウド上で文書を共有するサービス「Googleドキュメント」の機能です。

 上図のように「Googleドライブ」による手書き文字の電子化は十分に実用になります。ただ、若干の不明な書式があることも考えて、こんな文書を完全にテキスト化するにはメモ帳のようなテキストエディタに貼り付けるのがいいでしょう。また、Wordに貼り付けたときにはそのすべてを選択して、下図のようにリボンの「ホーム」タブ~「フォント」グループ~「すべての書式をクリア」アイコンとたどります。

 ちなみに、コンピュータを扱うとき「テキスト」という用語が頻繁に出てきます。コンピュータ上で「テキスト」とは 2進数「1,0」でコード化された文字をいい、文字の大きさ・形状・色などの書式を持たない文字のことをいいます。


ページ
トップ