セガレの知恵袋

「ITライフハックマスター 」AI和泉(旧ぱわきち)が生活に役立つIT・通信・放送に関する情報をわかりやすく「情報共有」するブログです

「ITライフハックマスター」 AI和泉(旧ぱわきち)です。情報家電業界で40年以上の経験を持ち、消費生活アドバイザーやテレビ地デジ化推進業務なども行ってきました。この時代を生きる人に役立つIT・通信・放送に関する情報をわかりやすくお届けします。私の目標は、新時代のインフラやデバイス、ガジェットの仕組みや最新話題を「情報共有」してもらうことです。

生成AI

【検証】Geminiにひと声で今日のスケジュール、天気予報、ToDo、メールチェックを読み上げさせるカスタマイズ方法-「Gem(ジェム)」を作成


【検証】Geminiにひと声で今日のスケジュール、天気予報、ToDo、メールチェックを読み上げさせるカスタマイズ方法

20260410-gem-000

前回、GeminiとGoogleアプリを連携し、カレンダー・ToDo・Keepの入力を1本化する方法を紹介しました。



今回は、スマートフォン上を巡回することなく、Geminiのチャット画面上で音声一言でこれらのアプリから「今日のスケジュールをまとめて教えてくれる」ようにカスタマイズする方法を「検証」します。

Geminiにカスタム「Gem(ジェム)」を作成し、タップ→音声チャットで読み上げさせるようにする

この機能を作成するにはGoogle Geminiの「Gem(ジェム)」機能を使用します。

「Gem(ジェム)」とは、一言で言うと「特定の役割や目的に特化させた、自分専用のカスタムAIアシスタント」のことになります。

スマートフォンなど、モバイル端末でも作成できそうですが、筆者の環境では上手く行きませんでしたので、PCブラウザ上で「Gem」で作成しました。

「Gem」を作成

Geminiを立ち上げ、画面左メニューの「Gem」→「+Gemを作成」と進みます。

20260409-gem-002

今回は、作成するGemの名前を「スケジュール」に設定、「カスタム指示」欄に以下の内容を入力し、作成実行します。

今日のスケジュール・予定
・Googleカレンダーから本日の予定
・Googleカレンダーから今日と明日、今週の金曜日、次の日曜日の天気予報
・Gmailから本日未読のメールのタイトルのみ
・GoogleToDoリストから本日の「朝食前、夕食前を除いたマイタスク


作成したGem「スケジュール」を実行する

作成したGemの動作を、手持ちのAndroidタブレットで確認してみます。

① 作成したGem「スケジュール」をタップします。

② プロンプト欄のマイクアイコンをタップし「スケジュール」と音声で入力。

20260410-gem-001

③ すると、画像のように音声とテキストで「今日のGoogleカレンダーから本日の予定→Googleカレンダーから今日と明日→今週の金曜日、次の日曜日の天気予報→Gmailから本日未読のメールのタイトルのみ→GoogleToDoリストから本日の「朝食前、夕食前を除いたマイタスク」を出力してくれるようになりました。

20260410-gem-002

ただし、筆者の環境だけの問題なのか、各OSのバージョンの問題なのかも分かりませんが、PC(Windows11)、Android15タブレットでは問題なく期待通りの動作が確認できました。

しかし、他のAndroid11スマートフォン、iPhoneSE(iOS26) では、動作自体は確認できたものの、PC・Android15とは異なる結果になることもあるのは謎ですが・・・。

何が原因なのか調べてみる必要がありそうです。


家電・AV機器ランキング にほんブログ村 PC家電ブログ 家電・AV機器の豆知識へにほんブログ村

【検証】生成AI「Gemini」をGoogleアプリと連携させ、カレンダー・ToDo・Keepの入力を1本化する手順


【検証】生成AI「Gemini」をGoogleアプリと連携させ、カレンダー・ToDo・Keepの入力を1本化する手順

20260409-gemini-002

「予定はGoogleカレンダー、タスクはToDoリスト、メモはKeep……」

便利なGoogleツールを愛用していますが、バラバラに管理していると入力が面倒に感じます。

Googleの生成AI「Gemini(ジェミニ)」を使えば、これらを1ヵ所に集約することが可能になります。

特にモバイル端末なら、「〇〇の予定を入れて」と話しかけることで、AIが適切なアプリを判断して自動入力してくれるように設定が可能です。

今回は、GeminiGoogle各アプリを連携させ、音声でスケジュールやメモを完結させる具体的な手順を「検証」します。

モバイル端末からなら音声でスケジュールやメモを自動入力可能です

1. 準備:Geminiの「拡張機能」を有効にする

まず、GeminiGoogleワークスペースのデータにアクセスできるように設定します。

Gemini(アプリまたはブラウザ)を開きます。(今回はPCブラウザで設定)

左下の 「設定とヘルプ」(歯車アイコン)→「アプリ連携」 に進みます。

20260409-gemini-001

アプリ連携をオンにします。

20260409-gemini-002

これにより、Googleカレンダー、Google Keep、Googleタスク(ToDo)との連携が可能になります。

2. モバイル端末で「Gemini」をメインアシスタントに設定

スマートフォンから音声で指示を出すために、GoogleアシスタントGeminiに切り替えます。

「Android」の場合

設定アプリから「Googleアシスタント」を検索し、デジタルアシスタントとしてGeminiを選択します。

20260408-gemini-001

「iPhone」の場合

Googleアプリ内の「Gemini」タブに切り替えて利用します。

*(裏技)「ショートカット」アプリを使い、背面タップやアクションボタンにGeminiを割り当てると、よりスムーズに起動できます。

3. 実践:音声でスケジュール・メモ・タスクを入力する

連携が完了したら、実際に話しかけてみます。

Geminiは文脈を理解するらしく、曖昧な指示でも思いのほか正確に処理してくれるようです。

① スケジュールを入力する(Googleカレンダー)

指示例: 「明日、14時から渋谷で打ち合わせの予定を入れて」

20260408-gemini-003

結果: 自動的にカレンダーが開き、日時・タイトル・場所が入力された状態で保存されます。

② メモを保存する(Google Keep)

指示例: 「今のアイディアをKeepにメモして。タイトルは『新プロジェクト案』、内容は『AIを使った教育アプリ』」

20260408-gemini-003

結果: Keepに新しいメモが作成されます。

③ タスクを追加する(Google ToDoリスト)

指示例: 「今日の夕方までに牛乳を買うのをリマインドして」

20260408-gemini-002

結果: ToDoリストに期限付きのタスクとして登録されます。

4. Gemini連携「1本化」のメリット

・アプリの使い分けが不要: 「これはメモか?予定か?」と考える必要をGeminiに丸投げすれば、内容に応じて最適なアプリに振り分けてくれます。

・自然な会話で修正できる: 「さっきの予定、やっぱり30分後ろにずらして」といった修正も、会話の流れで実行可能です。

・情報の検索も一括: 「来週の予定を教えて」「Keepに書いた買い物リストを見せて」といった確認もGeminiひとつで完結します。

2026年4月現在、日本語指示の精度が格段に向上していることに驚きます。

(関連記事)




家電・AV機器ランキング にほんブログ村 PC家電ブログ 家電・AV機器の豆知識へにほんブログ村

【検証】生成AI での音楽ライブ・MVのMP3ファイルを「歌詞の文字起こし」させてみた |Geminiでのみ有効ですがアーチスト・アルバム名などメタデータ取得に弱い印象も


【検証】生成AI での音楽ライブ・MVのMP3ファイルを「歌詞の文字起こし」させてみた |Geminiでのみ有効ですがアーチスト・アルバム名などメタデータ取得に弱い印象も

20260301-mp3-000

MP3ファイルの楽曲を生成AIにアップロードして「歌詞の文字起こし」させる方法を「検証」しました。

(関連記事)





MP3データの場合、著作権保護対策にうるさいようで文字起こしできない訳ではありませんが正確性はまだまだの印象

とは言っても、この手法で文字起こしが可能な生成AIサービスは、2026年3月現在、「Gemini」のみのようです。

手法としては、Geminiのプロンプト欄左下の「+」をクリック・タップして、文字起こししたいMP3ファイルをアップロードします。

続いて「このMP3ファイル内の歌詞を文字起こししてください」と入力し「実行」します。

20260302-001

日本語歌詞の場合、YouTube動画の楽曲情報から読み込むのに対し、MP3ファイル音声をそのまま「文字起こし」するようで、早口の部分など「読み飛ばし」される傾向が見受けられます。

20260302-002

また、外国語楽曲では、日本語よりやや精度は高いように感じます。

さらに和訳の場合「一度外国語で文字起こし→翻訳」する仕組みのようで、「日本語読み上げ」機能単体に比べ精度が高い印象(あくまで筆者個人的使用感)です。

今回の「検証」結果から、現状、MP3ファイルから「歌詞の文字起こし」を行うのは「まだまだ課題が多い」気がします。

単純に「MP3ファイル」内の「歌詞情報を取得」したいのであれば、以下の方法も有効です。

【PC環境】の場合(Windows11)

音楽ファイル管理ソフト「MusicBee」「歌詞を表示するプラグインを追加する」方法も人気です。



【スマートフォン】の場合

ONKYO
製の歌詞表示機能搭載音楽プレイヤーアプリ「HF Player」が便利です。




家電・AV機器ランキング にほんブログ村 PC家電ブログ 家電・AV機器の豆知識へにほんブログ村

【検証】生成AI に海外アーチストの音楽ライブ・MVのYouTube動画の「歌詞の文字起こし」させてみた


【検証】生成AI に海外アーチストの音楽ライブ・MVのYouTube動画の「歌詞の文字起こし」させてみた

20260228-gemini-000

前回、YouTubeで公開されている動画AIで歌詞を書き起こしする方法を紹介しました。



今回はさらに海外言語の楽曲動画を、書き起こしおよび和訳が可能なのか「検証」してみます。

Gemini、Grokで動作は確認できましたがここでも異なる楽曲データになるケースも発生

結果的に、書き起こし+和訳できたのは、Gemini、Grokでのみ対応可能でした。

Gemini画面で手順を確認します。

書き起こし+和訳したい楽曲のURLを貼付「この動画の文字起こしと和訳を行ってください」実行します。

20260228-gemini-001

書き起こし+和訳の結果は、画面左側に「文字起こし」、右側に「和訳」が表示されました。

20260228-gemini-002

筆者の個人的な感想として、日本語楽曲では、URLからプロンプト指示をしても「全く異なる楽曲情報」が出力されたり、「少しずつ歌詞内容が変化してくる」ケースも確認できましたが、海外言語(英語)楽曲のほうが「割と正確に文字起こし」+「直訳に近い和訳」をしてくれているように感じます。

この書き起こし+和訳に於いても、楽曲(動画)によってメタデータなどが異なりますので、GeminiGrokそれぞれで実行して結果を比較してみたほうが良さそうです。


家電・AV機器ランキング にほんブログ村 PC家電ブログ 家電・AV機器の豆知識へにほんブログ村

【検証】生成AI に音楽MV・ライブのYouTube動画の「歌詞の文字起こし」させてみた |Gemini、Grokでのみ可能ですが異なる楽曲データになってしまう場合も


【検証】生成AI に音楽MV・ライブのYouTube動画の「歌詞の文字起こし」させてみた |Gemini、Grokでのみ可能ですが異なる楽曲データになってしまう場合も

20260225-grok-005

YouTubeで公開されているミュージックビデオ(MV)ライブ映像動画内の楽曲の歌詞の文字起こしを、生成AIで行えるのか、無料版ChatGPT、Copilot、Grok、Gemini、Claudeそれぞれで「検証」してみました。

動画に紐づけられた楽曲情報や歌詞検索サイトに掲載されているかで結果が異なる模様

最初に結果から言ってしまうと、2026年2月26日現在、歌詞の文字起こしが可能な生成AIは、GrokGeminiのみのようです。

無料版ChatGPT、Claudeでは「著作権保護」の関係から非対応、Copilotの場合は一部の楽曲に限り「歌詞の要約」だけなら可能なようです。

ただし、Grok、Geminiの場合でも、すべての動画が「文字起こし可能」かというとそうではなく動画に紐づけられた楽曲情報や歌詞検索サイトに掲載されているかなど原因は不明ですが「楽曲によって使い分け」する必要はあるようです。

今回貼付してある画像は、Grokでの「文字起こし」結果の画像になります。

20260225-grok-001

例として「MV」動画のURLを貼り付け、プロンプト欄に「この動画の歌詞を文字起こししてください」と入力し「実行」します。

20260225-grok-002

今回読み込ませた楽曲ではキチンと歌詞が表示されただけでなく、曲の解説まで出力してくれました。

また、MV動画以外のライブバージョンの提案をしてくれましたので、さっそくライブ動画のURLを貼付し「実行」してみます。

20260225-grok-003

こちらも、動画から「いつ、どこのライブ映像の説明」まで解説してくれました。

さすがAI!と言いたいところですが、動画によってはまったく別のアーチストの楽曲と認識して「全く異なる歌詞を出力」されるケースも目立ちます。

このあたり、GrokとGeminiを使い分けるか、プロンプトの文言を少し変更する事で期待する結果を得られるかも知れません。

(関連記事)




家電・AV機器ランキング にほんブログ村 PC家電ブログ 家電・AV機器の豆知識へにほんブログ村
スポンサーリンク
PVアクセスランキング にほんブログ村

応援ありがとうございます。
「AV機器」部門で上位キープ中です。




デジモノ・ガジェットランキング


パソコンランキング



にほんブログ村 PC家電ブログ 家電・AV機器の豆知識へ
にほんブログ村

プロフィール

AI和泉(旧ぱわきち...

読者登録
LINE読者登録QRコード
記事検索
カテゴリー
スポンサーリンク





Follow @x