1. HOME
  2. ブログ
  3. アプリ
  4. Gemini搭載「ライブ翻訳」提供開始
ITニュース

パソコンインストラクター向けのITニュースで学ぶ

アプリ

Gemini搭載「ライブ翻訳」提供開始

Gemini搭載「ライブ翻訳」提供開始

Gemini搭載「ライブ翻訳」提供開始

Googleは、スマートフォン向け Google翻訳 アプリにおいて、生成AI Gemini を組み込んだ新機能「ライブ翻訳」の提供を開始しました。この機能は、ヘッドホンを通じて対面する相手との会話をリアルタイムで翻訳するものです。

自分の声のまま翻訳される

最大の特徴は、元の話者の声のトーン(声の高さや音色)、抑揚(言葉の強弱や上げ下げ)、話すリズムを維持したまま翻訳音声を生成する点です。

従来の機械的な合成音声(コンピューターで作られた人工的な声)とは異なり、まるで本人がその言語を話しているかのような、肉声に近い自然な音声を出力します。

基盤となるAI「Gemini 2.5 Flash」

基盤となるのは「Gemini 2.5 Flash Native Audio」などの最新モデルです。Googleは音声認識から翻訳、音声合成までのプロセスを単一のAIモデルに統合しました。これにより、処理遅延(データ処理にかかるタイムラグ)を大幅に短縮し、文脈やニュアンスをより正確に反映した翻訳が可能になっています。

ライブ翻訳の主な特徴と便利な使い方

ライブ翻訳は、海外旅行での日常会話からビジネスの商談まで、幅広いシーンでの利用が想定されています。

言語を自動で判別するスムーズな操作性

マイクが話者の言語を自動検出するため、自分と相手が交互に話すとき、その都度アプリのボタンを操作して言語を切り替える必要はありません。また「自動再生機能」を有効にすれば、相手が話を区切った瞬間に翻訳音声が流れ、人間同士の自然な対話のテンポ(会話の速度やタイミング)を維持できます。

視覚でも確認できる「対面モード」

音声だけでなく、画面上でのテキスト表示も非常に優秀です。「対面モード」を起動すると、スマートフォンの画面が上下に分割され、お互いの言語で文字起こし(音声を文字に変換すること)された内容を同時に確認できます。騒がしい場所や、音声を聞き逃した際でも、文字を見ることで確実に意思疎通を図ることができます。

利用環境と対応デバイスについて

この機能は、日本を含む世界各国で順次利用可能となります。対応言語は70言語以上に及びます。

対応OS:Android版およびiOS版の両方で展開。
出力先:有線・Bluetooth接続のヘッドホンのほか、スマホ内蔵スピーカーや外部スピーカーも選択可能。

関連記事