Google Geminiについて、耳にしたことはあるけれど、何なのかよくわからない、という方もいるでしょう。さまざまな生成AIが登場する中、2023年12月にGoogleが発表したGeminiは、画期的ということで注目を集めています。
そこで、本記事では、Google Geminiについての説明と、業務の効率化に活かせる要素と、実際の使い方を解説しています。
実際にGoogle Geminiを利用して、日常の業務を効率化していきましょう。
本記事では操作画面を画像で分かるように掲載しております。
スマホだと、画像が見にくい恐れがあるためのため、パソコンで閲覧することを推奨しております。
COOMIL(クーミル)株式会社 代表取締役。神奈川県出身。東京薬科大学大学院を修了後、大手製薬会社にて研修開発に従事する。2016年にファングロウス株式会社を創業し、マーケティング、広告運用、YouTube、SEO対策を駆使し、2年で売上1億円強かつ利益率40%強の会社へとグロースさせ、株式譲渡。YouTubeチャンネルのプロデュース・原稿制作・出演・撮影・編集の全てを自ら行い、運営10ヶ月で登録者数1万人突破させる(現在3万人越え)。IT業界だけでなく実店舗経営の知見を活かし、クライアント様の課題の本質を捉えて、「結果が出るマーケティング施策」をご提案致します。サイトを公開後も運用をお任せ頂き、サイトだけでなく「事業規模の拡大を目指す」ことがクーミルのモットーです。
■経歴
2014年 東京薬科大学大学院終了
2014年 第一三共株式会社
2016年 ファングロウス株式会社 創業
2019年 一般社団法人スーパースカルプ発毛協会(FC本部) 理事
2021年 ファングロウス株式会社 株式譲渡
2021年クーミル株式会社 創業
■得意領域
SEO対策
コンテンツマーケティング
リスティング広告
オウンドメディア運用
フランチャイズ加盟店開発、集客
■保有資格
Google アナリティクス認定資格(GAIQ)
Google 広告検索認定資格
Google 広告ディスプレイ認定資格
Google 広告モバイル認定資格
■SNS
X(旧Twitter):https://twitter.com/ryosuke_coomil
YouTube:https://www.youtube.com/@marketing_coomil
メディア制作・SEO対策の
悩み
を無料で相談する
Step1
ありがとうございます
弊社にご相談頂きまして
誠にありがとうございます。
クーミル株式会社では、
1つ1つのご相談を真剣に考え、
最適解をご提供出来るよう日々努めております。
可能な限り、即日ご返信を心掛けておりますが、
相談内容や、
営業日の関係で少々、
お待たせさせてしまうかも知れません…。
目次
- Google Geminiは2023年12月にリリースされた生成AI
- Google Geminiの3つのモデル
- Google Geminiの活用について
- 論文の解読:一次情報の探索
- 企画書の作成:プレゼン資料の下書き
- 手書きメモの解読:清書の工数削減
- 図表を含むスライドの説明:資料読解の工数削減
- コードの自動生成:Webサイトの下書き
- 数学・物理の採点・解説:SPI対策など
- Google Gemini Proの使い方(設定手順)
- 使い方①:Googleアカウントを作成する
- 使い方②:Googleアカウントの言語設定を英語に変える
- 使い方③:Googleの言語設定を英語のままBardにアクセスする
- Gemini ProのAPIを使った実装方法
- Google AI Studioでの利用方法
- Google Gemini Proの注意点
- まとめ
Google Geminiは2023年12月にリリースされた生成AI
Google Geminiとは、Googleが2023年12月に発表した生成AIです。Google Geminiの特徴は「マルチモーダル」ということです。
マルチモーダルでは、今まで入出力がバラバラだった、テキスト・音声・画像といった、異なる種類の情報を、最初からまとめて取り扱えます。
防犯カメラを例に取ると、映像から画像データと音声データを、最初から掛け合わせて処理できるので、画像とともに音声の抑揚から、より危険度の高いシーンも抽出できるようになります。
Google Geminiの3つのモデル
GoogleGeminiのタイプ | 各モデルの詳細 |
---|---|
Gemini Ultra | 最高モデル。 |
Gemini Pro | 優良モデル。Ultraと同程度の性能を維持しながら、コストとレイテンシを抑えたモデル。 |
Gemini Nano | デバイスに最適化されたモデル。低メモリデバイス用にNano-1、高メモリデバイス用にNano-2が提供される。Google Pixel 8 Proで提供済み※。※英語版のみ |
※)2024年1月4日現在、Gemini Ultraは未提供となっています。
Google Geminiの活用について
Google Geminiを使えば、以下の作業が可能です。
- 論文の解読
- 企画書の作成
- 手書きメモの解読
- 画像の解説
- 図表を含むスライドの説明
- コードの自動生成
- 数学・物理の採点・解説
ここからは、Google Geminiでできることと、特性を活かした作業効率化の方法を解説していきます。
論文の解読:一次情報の探索
Google Geminiは、論文の検索を自動で行ってくれるので、一次情報や根拠を探したいときに便利です。たとえば「国有林に関する論文を教えて」と入力した場合、以下の回答がありました。
Geminiにて検索した結果
ChatGPTとの比較
ChatGPTで同じ質問をした場合の結果はこちらです。
論文をChatGPTで検索する場合、ScholarAIというプラグインを別途導入する必要がありました。
一方、Google Geminiでは、追加プラグインが必要なく、ある程度まとまった量の論文を提示してくれるため、リサーチ時間の短縮が見込めます。
企画書の作成:プレゼン資料の下書き
Google Geminiは、簡単なプロンプト(指示)である程度の企画書が作れます。試しに「パーソナルジムのオウンドメディアの企画書を作成してください。」と指示したところ、以下の回答がありました。
Geminiにて企画書を作成
簡素な指示でもターゲットやスケジュール、予算などを提示してくれるので、アイディア出しに使用したり、この企画書をもとにもっと精査した企画書を作成していくのもいいでしょう。
また、「友人の誕生日パーティーの企画」や「ユニバーサルスタジオジャパンでの1泊2日旅行の計画を立ててください」とプロンプトを入力すると、画像やGoogleマップを使った提案も得られます。
誕生日パーティーの企画例
ユニバーサルスタジオジャパンの地図
画像や地図まで提示してくれるので、視覚的にわかりやすいのがメリットと言えそうです。
手書きメモの解読:清書の工数削減
Google Geminiでは、画像から文字を読解できるのも特徴です。試しにこちらの手書きメモを読み取ってもらいました。
手紙メモの解読検証
すると、以下の回答が得られました。
画像の文字起こしは以下のとおりです。
GoogleGeminiの回答結果
10C2 = 10! / 8! 2! = 45
この画像は、ノートに書かれた組合せ数です。組合せ数は、n 個の中から r 個を選ぶ方法の数です。10C2 は、10 個の中から 2 個を選ぶ方法の数です。
10C2 = 10! / 8! 2! = 10 x 9 / 2 = 45
これを展開すると、以下のようになります。
10C2 = 90 / 2 = 45
したがって、答えは 45 となります。
乱雑に書いた手書きのメモでも、意図を理解して書き起こしてくれることで、かなりの工数が削減できます。議事録に残しておきたい手書きのメモも、記憶が鮮明なうちに文字に起こせるのもポイントでしょう。
図表を含むスライドの説明:資料読解の工数削減
情報量が多く、イラストや図表が混ざったスライドも、Geminiを使えば理解が早まるかもしれません。
こちらのスライドを読み取ってもらったところ、結果は以下になりました。
スライドの読み取り検証
結果は以下の通りとなりました。
GoogleGeminiの回答結果
画像で述べられていることは、相続土地国庫帰属制度についてです。相続土地国庫帰属制度とは、相続等によって取得した土地を、国庫に帰属させることを可能とする制度です。
この制度は、以下の背景から創設されました。
- 少子高齢化や人口減少に伴う土地利用ニーズの低下
- 相続を契機として、土地を望まず取得した所有者の負担感の増加
この制度を利用するには、以下の要件を満たす必要があります。
- 相続又は遺贈(相続人に対する遺贈に限る。)により土地を取得した者であること
- 土地の性質に応じた標準的な管理費用を考慮して算出した10年分の土地管理費相当額の負担金を納付すること
負担金は、土地の種類によって異なります。
- 市街地の宅地:20万円
- その他の宅地:面積に応じて算定
- 農用地区域等の田、畑:面積に応じて算定
- 森林:面積に応じて算定
申請手続きは、以下のとおりです。
- 法務局に承認申請を行う
- 法務局による要件審査
- 審査結果の通知
- 負担金の納付
- 土地の所有権の帰属
この制度を利用することで、相続した土地を管理する手間や費用を省くことができます。また、所有者不明土地の発生を予防することにもつながります。
なお、画像には、森林管理局がこの制度の申請があった土地のうち森林の要件審査に協力する旨が記載されています。Geminiを使うと、読解に時間がかかる資料も簡単にまとめてもらえます。
また、ChatGPTにはない「読解した資料をそのまま読み上げる」機能が実装されているため、移動中や作業中に聴ける点も見逃せません。
コードの自動生成:Webサイトの下書き
「Gemini は、Python、Java、C++、Go など、世界で最も広く利用されているプログラミング言語の理解、説明、そして高品質なコードを生成できます。複数の言語を超えて機能し、複雑な情報を推論できるため、世界でも先進的なコーディング基盤モデルです。」
引用:最大かつ高性能 AI モデル、Gemini を発表 – AI をすべての人にとってより役立つものに
Google Japanがこのように伝えているため、試しに下記の指示を行ってみました。
Google Geminiに指示した結果
指示内容:「自社を紹介するWebサイトを5ページで作りたいです。コードを書いてくれますか?」
このように入力したところ、次の手順が示されました。
- Webサイトの構成と内容を明示
- どのプログラミング言語を使えばいいのか
実際の画面がこちらです。
Google Geminiの回答結果
次に実際のコーディングを依頼したところ、トップページと会社概要のページのコードがHTMLで書き出されました。
CSSで装飾の依頼も可能です。
「こんなWebサイトを作りたい」と漠然と考えているときに、Geminiにコードを記載してもらうことで、Webサイトの骨組みをより具体的に考えられます。
指示内容が簡単な文章で済むのも、Geminiのポイントです。
数学・物理の採点・解説:SPI対策など
Geminiは、数学や物理の採点や解説にも使えます。現段階では、まだ正答率が100%ではないので、完全に頼りきれるわけではありません。
しかし、今後Geminiの進化が進めば、数学や物理の解説も可能です。
入社・転職試験のSPIにも応用が利くので、解説書でわからなければ、Geminiに解説を依頼する、という未来も十分考えられます。
Google Gemini Proの使い方(設定手順)
ここからは、Gemini Proの使い方を解説していきます。
2024年1月現在、Gemini ProはGoogle Bard(Googleが提供する生成AI)とGoogle AI Studio(Web開発者向けツール)・Google Colaboratory(Pythonなどの環境を整えられるサービス)で利用可能です。
ここでは、一番使いやすいGoogle Bardでの使い方を紹介します。
使い方①:Googleアカウントを作成する
まず、Googleアカウントをお持ちでない方は、Googleアカウントを作成します。
使い方②:Googleアカウントの言語設定を英語に変える
2024年1月現在、Google Bardは英語のみGeminiに対応しています。そこで、Googleアカウントの言語設定を英語に変える必要があります。
今後、日本語対応が順次されてくるでしょう。
右上の設定ボタンから「アカウント」を選択し、クリックします。
左側のバーから「個人情報」をクリックしましょう。
「Web向けの全般設定」という箇所があるので、ここの「言語」を英語に変更します。
「English」を選択すると、さまざまな種類の英語が提案されますが、一番上のUnited Statesを選択しましょう。
これで「保存」ボタンを押すと、言語が英語になります。
使い方③:Googleの言語設定を英語のままBardにアクセスする
この状態でGoogle Bardに再度アクセスすると、Gemini Proが搭載されたBardが利用できます。
Gemini ProのAPIを使った実装方法
Google AI Studio(個人のWeb開発者向けツール)・Google Colaboratory(Pythonなどの環境を整えられるサービス)でGemini Proを利用する場合、APIキーの取得が必要です。
このページからBuild with Geminiに進み、左側のタブからAPIキーを取得し、保存します。
APIの利用で、自分のPCでGemini Proにダイレクトにアクセスして利用できます。なお、取得したAPIキーは他人に見せたり、公開しないように注意してください。
Google AI Studioでの利用方法
Google AI Studioには、2つのモデルがあります。
- Gemini Pro(通常モード)
- Gemini Pro Vision(画像が組み込めるモード)
このように、直接画像をドラッグアンドドロップで挿入して、指示を出すことも可能です。
Temperatureは、値が低いほど事実に近く、値が大きいほど抽象度が上がるという意味で使われます。標準値は、Gemini Proで0.9、Gemini Pro Visionで0.4とのことです。
Gemini Proは APIは2024年1月現在、無料で利用可能です。しかし、すでに有料化も検討されています。
有料化した場合の料金は、以下の通りです。
Gemini Proが有料化された場合
タスク | 金額 |
---|---|
テキスト入力 | 0.00025ドル/1,000文字 |
テキスト出力 | 0.0005ドル/1,000文字 |
画像入力 | 0.0025ドル/1枚 |
Google Gemini Proの注意点
Google Bardをはじめ、解析度が高く、今後の業務改善にも期待できるGoogleGemini Proですが、注意点が3つあります。
- Google AI Studioの無料枠では1分間に60リクエストの制約がある
- Googleに解析結果が利用される
- Google Bard は13歳未満のユーザーは利用不可
現在のところ、Gemini Proに入力された項目をGoogle社が検証に利用することがあります。したがって、機密情報や個人情報の入力は避ける方がいいでしょう。
また、会社の資料を作る場合も、情報の取り扱いに注意し、機密事項であればGemini Proでは利用しないことをおすすめします。
また、現状、Google Bardは、日本の場合13歳未満は利用できませんので、お子さんをお持ちの方も注意が必要です。
まとめ
テキスト・画像・音声を同時に処理できる「マルチモーダル」機能によって進化したGemini Proは、解析処理が早く、手書きのメモや画像内のテキストも読み込めるため、利用することで大幅な業務の改善が見込めます。
しかし、まだまだ不正確なことも多く、ファクトチェックが欠かせないため、Gemini Proに頼りきりになるのは危険です。
会社の資料作成でGemini Proを利用する場合、Googleのプライバシーポリシー・Google API利用規約・Generative AI APIの追加利用規約をよく確認することが大切です。
機密情報や個人情報の取り扱いに注意し、常にファクトチェックをしながら、Gemini Proを利用していきましょう。
Geminiの最高モデルGemini Ultraは2024年年明け公開予定となっていますので、こちらのリリースも期待しながら、Gemini Proを使っていきましょう。