TOPIC

chatGPTで実装されたAdvanced Voice Mode(アドバンスドボイスモード)とは?徹底解説

chatGPTのアドバンスドボイスモード

2022年11月にリリース以降、目覚ましい進化を遂げているChatGPTですが、ついに高品質な音声対話機能が追加されました。Advanced Voice Mode(アドバンスドボイスモード)という新機能は、人間とAIの自然な音声対話を可能とします。これは、OpenAI社が2024年5月の「Spring Update」イベントで発表して注目を浴びた機能です。
同9月下旬、ChatGPT PlusおよびChatGPT Teamの全ユーザーにアドバンスドボイスモードが提供され、早くも反響を呼んでいます。指示を出して回答を得るというシンプルな使い方だけでなく、様々な用途で活用することができるため、従来の音声認識AIのイメージを覆すものです。
本記事では、アドバンスドボイスモードの詳しい機能や使用法など、最大限に使いこなすために覚えておきたい情報を解説します。

chatGPtのAdvanced Voice Mode(アドバンスドボイスモード)とはどんな機能?

ChatGPTのAdvanced Voice Mode(アドバンスドボイスモード)は、OpenAI社が2024年9月にリリースした、高度な音声会話機能です。ボイスモードとよばれる機能は従来から存在したのですが、より人間に近い会話速度と感情表現が実現しました。それでは、アドバンスドボイスモードの主な特徴を、以下の3つに分けて説明していきましょう。

①自然な会話を多言語で実現

英語や日本語だけでなく、世界50以上の言語で使用可能です。同じ英語でも、アメリカとイギリスのアクセントの違いなど、細かい部分も対応しています。人間さながらの応答速度となり、言葉の表現も非常にスムーズです。しかも、例えばユーザーが関西弁などの方言を使うと、ChatGPT側も同じ方言で返せるので親近感が湧くはずです。

②9種類の音声から選択可能

既存の4つの音声(Breeze、Juniper、Cove、Ember)に加えて、アドバンスドボイスモードでは新たに5つの音声(Arbor、Maple、Sol、Spruce、Vale)が加わり、合計9種類から選択できます。
男性の声が5種類、女性の声が4種類となっており、名称ごとに声質が異なります。聞き慣れない名称がつけられていますが、これらの名前はすべて自然がモチーフです。“AIとの自然なコミュニケーション”というコンセプトを反映しているようです。

③メモリー機能やカスタム指示が可能

アドバンスドボイスモードは、ユーザーが指定した基準や特定の共有情報を記憶して、次回以降その基準を維持して返答を行います。例えば、「英語の先生」という基準を提供すると、ChatGPTは英語で回答を生成します。「デパートのベテラン店員」になりきるよう指定すれば、とても丁寧で落ち着いたトーンで話し続けるでしょう。

このように、ユーザーはChatGPTを自由にカスタマイズできるだけでなく、重要な情報を保存させることも可能です。同じやり取りを繰り返し行う必要がなく、会話を重ねるごとにスムーズなコミュニケーションができるはずです。

Advanced Voice Modeの使い方を解説

アドバンスドボイスモードを使用するためには、まずChatGPTの有料会員に登録してください。会員登録後、ChatGPTのアプリ版を最新バージョンにアップデートします。アプリを開くと、画面右下に音声アイコンがあるので、それをタップして、9種類の音声から選択します。
画面に円形の空模様が表示されると準備完了です。指示や質問を音声で発しましょう。

ChatGPTは、選択したボイスで返答すると同時に、やり取りを全てチャット上で自動的に記録していきます。会話内容を見返すことができるため、とても便利です。アドバンスドボイスモードは、バックグラウンドでも使用し続けることが可能です。他のアプリを開いている最中も、会話がいきなり終了しまうことはありません。
チャットでの文章だけでなく、音声クリップを最大30日間保存する機能も持っています。期限が経過すると、音声クリップは自動的に削除されます。

Advanced Voice Modeは時間制限があるので注意

アドバンスドボイスモードの活用法として、語学学習やリアルタイム翻訳、商品などの音声紹介サービスなど、多用な使い方が挙げられます。特に言語に関しては、オンライン英会話学習を凌駕する存在になるかもしれません。しかしながら、この機能を時間無制限で使用できるわけではない点に注意しましょう。
まず、無料版のChatGPTユーザーは、1ヶ月あたり15分間のみ使用可能になりましたが、月15分では語学学習は厳しいですよね。有料プラン会員でも、1日あたりの使用時間に制限がかけられています。ただし、具体的には公表されていません。
制限に到達する15分前に通知が届く仕様になっているため、気付かぬ間にオーバーすることはないです。すでにアドバンスドボイスモードを使っているユーザーによれば、「語学学習を1日30分するぐらいは問題なかった」というレビューが見られます。OpenAI社が正式な情報を公開していない以上、探り探りで使っていくしかないでしょう。

まとめ

アドバンスドボイスモードの登場により、接客業などコミュニケーションを重んじる業種の研修や、英会話レッスンなどの語学学習が大きく変わるのではないでしょうか。音声認識機能を活用して、会議の議事録作成やカスタマーサポート、製品紹介などビジネス面でも仕事の効率化を図れると考えられます。驚くべきことに、9種類の音声はそれぞれ性格まで異なります。元からキャラが備わっているわけです。将来的に、子供の声や高齢者の声など、さらに選択肢の幅が広がる可能性も十分あるでしょう。カスタマイズやメモリー機能を駆使して、あなただけの音声認識AIを作ってみてください。

関連記事

  1. 生成AIでwebサイト作成

    生成AIを活用すればwebサイト作成も簡単に?おすすめのツールやサービスについて調べてみた

  2. chatgptのAPI

    chatgptのapiはどのように提供されている?料金体系や条件などを調査してみた

  3. chatGPTの翻訳機能

    chatGPTの翻訳精度はどれくらい?グーグル翻訳との比較についても解説

  4. chatgpt-4oと日本語

    chatgpt-4oは日本語対応している?使い方の事例と共に解説

  5. aiのソースコード

    chatGPTにソースコードを解析させることは可能?

  6. chatGPTの議事録

    chatGPTは議事録作成もやってくれる?具体的な使い方や便利なツールを紹介

  7. chatgptのイラスト生成

    chatGPTでイラスト生成のやり方を徹底解説

  8. chatgptのファイルアップロード

    chatgpt 4oはファイルアップロードが可能に!対応しているファイルや具体的な使い方を解説

  9. chatgptで使えるプロンプト

    chatGPTはプロンプトが全て!生成のコツやプロンプトの一部を紹介

PAGE TOP