AI用語・モデル種類

音声生成AIとは

音声生成AI、音声認識AI、文字起こしAIの違いを初心者向けに整理します。

このページでできること

音声生成AI、音声認識AI、文字起こしAI、読み上げ、ナレーションの違いを整理できます。MAI-Voice-2のような音声生成系モデルを非公式ガイドとしてどう読むかも確認できます。

音声生成AIと文字起こしAIの違い

音声生成AIは文章から音声を作る方向のAIです。音声認識AIや文字起こしAIは、音声から文字へ変換する方向のAIです。どちらも便利ですが、本人同意、個人情報、誤認、権利確認が必要です。

役割分担

領域向いていること人間が確認すること関連ページ
MAI-Voice-2 / Copilot音声生成、読み上げ、ナレーション文脈の整理提供範囲、対応言語、本人同意MAI-Voice-2
ChatGPTナレーション原稿、台本、YouTubeやSNS文面の整理内容、言い回し、個人情報ChatGPTで原稿作成
HAL本人同意、声の権利、なりすまし、詐欺リスク公開可否、第三者の声、商用利用AI音声安全注意
GPT総合音声生成AI、音声認識AI、文字起こしAIの用語整理モデル種類の混同音声生成AIとは
CodexWeb、動画、LPへ出す前の公開前チェック説明文、埋め込み、秘密情報Codex公開前チェック

音声生成AIチェックリスト

次に読むページ