紙の表を1秒でExcelに!Geminiに「写真」を渡すだけのデータ化術

こんにちは!「AIいっぽラボ」の所長です。

デジタル化が進んだ現代ですが、まだまだ「紙の資料」や「手書きのメモ」ってなくなりませんよね。

ひつじさん

そうなんですよね。さっき上司から『この紙の売上表、Excelに入力しておいて』って渡されたんです。数字を見ながらキーボードを叩くの、目が疲れるし打ち間違いも怖いし、本当に憂鬱です…。

所長

私も昔、名刺の束をひたすらExcelに転記する作業をしたことがありますが、あれこそ『不毛な時間』の代表格ですよね。
その紙をスマホで『写真』を撮ってGeminiに見せるだけで解決できるとしたら、画期的だと思いませんか?

えっ、写真を見せるだけでいいの?今回は、Geminiの「目(画像認識機能)」を使って、地獄の手入力作業をゼロにする検証です。

目次

Geminiは「文字」だけでなく「画像」も読める

私たちが普段使っているGeminiは、実は文字を読むだけでなく、画像の中身を理解する目を持っています。

しかも、ただ「何が写っているか」が分かるだけではありません。「表(テーブル)の構造」や「手書きの文字」まで、かなり正確に読み取ることができるんです。

所長

つまり、人間が目で見て『これは表だな』と認識してExcelに打ち込む作業を、AIが代わりにやってくれるということですね。それが本当なら、革命的に楽になります…!

検証1:紙の「表」をExcelデータにする

実際にやってみましょう。
今回は、あえて少し斜めから撮影した「紙に印刷された売上表」をGeminiに読み込ませてみました。

※本来であれば実際の写真をお見せしたいところですが、社外秘の情報が含まれるため実例をもとにしたサンプルデータで検証します。

手順は簡単

  1. Geminiのチャット欄にある「+(画像追加)」ボタンを押す。
  2. スマホで撮った「紙の表」の写真を選ぶ。
  3. 以下のプロンプトを入力する。

もちろん日本語で指示しても大丈夫ですが、表組みなどの構造的な処理はAIの母国語である「英語」で指示した方が精度が上がります。今回は両方のパターンを掲載しますので、お好きな方をコピペしてください。

Geminiへの指示(プロンプト)

日本語プロンプト

この画像を読み取って、表の中身を「CSV形式」で出力してください。

【条件】
・表の項目(列・行)を正確に再現すること。
・数字の間違いがないように注意すること。

英語プロンプト(推奨)

# Instruction
Extract data from this image and output it as CSV format.

# Constraints
- Maintain the exact table structure (rows and columns)
- Ensure high accuracy for numbers
- Output ONLY the CSV data

これを入力すると……?

Geminiの回答

画像からデータを抽出しました。以下のテキストをコピーして、メモ帳などに貼り付けて「.csv」で保存するか、Excelに直接貼り付けてください。

コード スニペット

日付,商品名,単価,数量,売上
4月1日,Aセット,1000,5,5000
4月2日,Bセット,1500,3,4500
...
ひつじさん

本当に数字がそのまま出てきました!これをExcelにコピペするだけで、もう表計算ができちゃうってことですか?

所長

私が1時間かけて手打ちしていた作業が、『撮影→アップロード』の数秒で終わってしまいました。斜めに撮った写真でも認識してくれる精度には驚きです。

検証2:汚いホワイトボードを「議事録」にする

次は、もっと難易度を上げてみましょう。 会議の後に残された「殴り書きのホワイトボード」です。

※こちらも実際の会議写真は社外秘のため、内容を模したサンプルで解説します。

いっぽくん

ホワイトボードって、後で写真を見返しても解読するのが大変だよね。そんな時は『内容を整理して』ってGeminiに頼んでみて!

Geminiへの指示(プロンプト)

日本語プロンプト

このホワイトボードの写真を読み取って、会議の「議事録」としてまとめてください。

【条件】
・手書き文字をテキスト化すること。
・「決定事項」と「To Do(誰が何をするか)」に分けて整理すること。

英語プロンプト(推奨)

# Instruction
Read this whiteboard image and summarize it as "Meeting Minutes".

# Constraints
- Transcribe handwritten text accurately
- Organize into "Decisions" and "To Do (Who/What)"
- Output in Japanese

Geminiの回答

【会議メモの要約】

■決定事項

  • 新サイトの公開日は12月1日に決定。
  • デザイン案はB案を採用(修正あり)。

■To Do

  • **田中さん:**サーバーの契約更新(来週まで)
  • **佐藤さん:**ロゴデータの修正
所長

これなら、会議が終わったらパシャッと撮ってGeminiに投げるだけで議事録が完成しますね。手書き文字の解読作業からも解放されます!

【重要】写真は「機密情報」に注意

ただし、ここでも注意が必要です。 前回までの記事と同様、「会社の重要な情報」の取り扱いには気をつけなければなりません。

いっぽくん

便利だけど、『個人情報(顧客リストなど)』や『社外秘の数値』が写っている写真をそのまま無料版GeminiにアップロードするのはNGだよ。AIの学習に使われてしまうリスクがあるからね。

所長

そうですね。『公開済みの資料』や『一般的なデータ』の入力作業を効率化するために使うのが、安全で賢い使い方と言えそうです。

まとめ:スマホカメラは「入力装置」になる

いかがでしたか?

  • 紙の資料 → 写真を撮ってExcelへ
  • ホワイトボード → 写真を撮って議事録へ

これまで「手入力しかない」と諦めていた作業も、「スマホカメラ」と「Gemini」を組み合わせれば一瞬で終わらせることができます。

所長

私も今日から、キーボードを叩く前に『これ、写真でいけるんじゃないか?』と考えるようにします。浮いた時間を自分のための時間に変えていきましょう!

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次