【検証】生成AI に音楽MV・ライブのYouTube動画の「歌詞の文字起こし」させてみた |Gemini、Grokでのみ可能ですが異なる楽曲データになってしまう場合も

YouTubeで公開されているミュージックビデオ(MV)やライブ映像の動画内の楽曲の歌詞の文字起こしを、生成AIで行えるのか、無料版ChatGPT、Copilot、Grok、Gemini、Claudeそれぞれで「検証」してみました。
動画に紐づけられた楽曲情報や歌詞検索サイトに掲載されているかで結果が異なる模様
最初に結果から言ってしまうと、2026年2月26日現在、歌詞の文字起こしが可能な生成AIは、GrokとGeminiのみのようです。
無料版ChatGPT、Claudeでは「著作権保護」の関係から非対応、Copilotの場合は一部の楽曲に限り「歌詞の要約」だけなら可能なようです。
ただし、Grok、Geminiの場合でも、すべての動画が「文字起こし可能」かというとそうではなく、動画に紐づけられた楽曲情報や歌詞検索サイトに掲載されているかなど原因は不明ですが「楽曲によって使い分け」する必要はあるようです。
今回貼付してある画像は、Grokでの「文字起こし」結果の画像になります。

例として「MV」動画のURLを貼り付け、プロンプト欄に「この動画の歌詞を文字起こししてください」と入力し「実行」します。

今回読み込ませた楽曲ではキチンと歌詞が表示されただけでなく、曲の解説まで出力してくれました。
また、MV動画以外のライブバージョンの提案をしてくれましたので、さっそくライブ動画のURLを貼付し「実行」してみます。

こちらも、動画から「いつ、どこのライブ映像の説明」まで解説してくれました。
さすがAI!と言いたいところですが、動画によってはまったく別のアーチストの楽曲と認識して「全く異なる歌詞を出力」されるケースも目立ちます。
このあたり、GrokとGeminiを使い分けるか、プロンプトの文言を少し変更する事で期待する結果を得られるかも知れません。
(関連記事)
家電・AV機器ランキング 



























