こんにちは!「AIいっぽラボ」の所長です。
デジタル化が進んだ現代ですが、まだまだ「紙の資料」や「手書きのメモ」ってなくなりませんよね。
ひつじさんそうなんですよね。さっき上司から『この紙の売上表、Excelに入力しておいて』って渡されたんです。数字を見ながらキーボードを叩くの、目が疲れるし打ち間違いも怖いし、本当に憂鬱です…。



私も昔、名刺の束をひたすらExcelに転記する作業をしたことがありますが、あれこそ『不毛な時間』の代表格ですよね。
その紙をスマホで『写真』を撮ってGeminiに見せるだけで解決できるとしたら、画期的だと思いませんか?
えっ、写真を見せるだけでいいの?今回は、Geminiの「目(画像認識機能)」を使って、地獄の手入力作業をゼロにする検証です。
Geminiは「文字」だけでなく「画像」も読める
私たちが普段使っているGeminiは、実は文字を読むだけでなく、画像の中身を理解する目を持っています。
しかも、ただ「何が写っているか」が分かるだけではありません。「表(テーブル)の構造」や「手書きの文字」まで、かなり正確に読み取ることができるんです。



つまり、人間が目で見て『これは表だな』と認識してExcelに打ち込む作業を、AIが代わりにやってくれるということですね。それが本当なら、革命的に楽になります…!
検証1:紙の「表」をExcelデータにする
実際にやってみましょう。
今回は、あえて少し斜めから撮影した「紙に印刷された売上表」をGeminiに読み込ませてみました。
※本来であれば実際の写真をお見せしたいところですが、社外秘の情報が含まれるため実例をもとにしたサンプルデータで検証します。
手順は簡単
- Geminiのチャット欄にある「+(画像追加)」ボタンを押す。
- スマホで撮った「紙の表」の写真を選ぶ。
- 以下のプロンプトを入力する。
もちろん日本語で指示しても大丈夫ですが、表組みなどの構造的な処理はAIの母国語である「英語」で指示した方が精度が上がります。今回は両方のパターンを掲載しますので、お好きな方をコピペしてください。
Geminiへの指示(プロンプト)
日本語プロンプト
この画像を読み取って、表の中身を「CSV形式」で出力してください。
【条件】
・表の項目(列・行)を正確に再現すること。
・数字の間違いがないように注意すること。
英語プロンプト(推奨)
# Instruction
Extract data from this image and output it as CSV format.
# Constraints
- Maintain the exact table structure (rows and columns)
- Ensure high accuracy for numbers
- Output ONLY the CSV data
これを入力すると……?
Geminiの回答
画像からデータを抽出しました。以下のテキストをコピーして、メモ帳などに貼り付けて「.csv」で保存するか、Excelに直接貼り付けてください。
コード スニペット
日付,商品名,単価,数量,売上 4月1日,Aセット,1000,5,5000 4月2日,Bセット,1500,3,4500 ...



本当に数字がそのまま出てきました!これをExcelにコピペするだけで、もう表計算ができちゃうってことですか?



私が1時間かけて手打ちしていた作業が、『撮影→アップロード』の数秒で終わってしまいました。斜めに撮った写真でも認識してくれる精度には驚きです。
検証2:汚いホワイトボードを「議事録」にする
次は、もっと難易度を上げてみましょう。 会議の後に残された「殴り書きのホワイトボード」です。
※こちらも実際の会議写真は社外秘のため、内容を模したサンプルで解説します。



ホワイトボードって、後で写真を見返しても解読するのが大変だよね。そんな時は『内容を整理して』ってGeminiに頼んでみて!
Geminiへの指示(プロンプト)
日本語プロンプト
このホワイトボードの写真を読み取って、会議の「議事録」としてまとめてください。
【条件】
・手書き文字をテキスト化すること。
・「決定事項」と「To Do(誰が何をするか)」に分けて整理すること。
英語プロンプト(推奨)
# Instruction
Read this whiteboard image and summarize it as "Meeting Minutes".
# Constraints
- Transcribe handwritten text accurately
- Organize into "Decisions" and "To Do (Who/What)"
- Output in Japanese
Geminiの回答
【会議メモの要約】
■決定事項
- 新サイトの公開日は12月1日に決定。
- デザイン案はB案を採用(修正あり)。
■To Do
- **田中さん:**サーバーの契約更新(来週まで)
- **佐藤さん:**ロゴデータの修正



これなら、会議が終わったらパシャッと撮ってGeminiに投げるだけで議事録が完成しますね。手書き文字の解読作業からも解放されます!
【重要】写真は「機密情報」に注意
ただし、ここでも注意が必要です。 前回までの記事と同様、「会社の重要な情報」の取り扱いには気をつけなければなりません。



便利だけど、『個人情報(顧客リストなど)』や『社外秘の数値』が写っている写真をそのまま無料版GeminiにアップロードするのはNGだよ。AIの学習に使われてしまうリスクがあるからね。



そうですね。『公開済みの資料』や『一般的なデータ』の入力作業を効率化するために使うのが、安全で賢い使い方と言えそうです。
まとめ:スマホカメラは「入力装置」になる
いかがでしたか?
- 紙の資料 → 写真を撮ってExcelへ
- ホワイトボード → 写真を撮って議事録へ
これまで「手入力しかない」と諦めていた作業も、「スマホカメラ」と「Gemini」を組み合わせれば一瞬で終わらせることができます。



私も今日から、キーボードを叩く前に『これ、写真でいけるんじゃないか?』と考えるようにします。浮いた時間を自分のための時間に変えていきましょう!










