H

Hf Seamless M4t Large

facebookによって開発
SeamlessM4Tは、多言語音声・テキスト翻訳をサポートする統一モデルで、音声から音声、音声からテキスト、テキストから音声、テキストからテキストへの翻訳タスクを実現できます。
ダウンロード数 4,648
リリース時間 : 9/13/2023

モデル概要

SeamlessM4Tは、高品質な翻訳を提供することを目的としたモデル群で、複数言語間の音声・テキスト翻訳をサポートし、異なる言語コミュニティの人々が簡単に交流できるようにします。

モデル特徴

マルチタスク統一モデル
単一モデルで音声から音声、音声からテキスト、テキストから音声、テキストからテキストへの翻訳タスクをサポートし、複数の独立したモデルに依存する必要がありません。
幅広い言語サポート
101言語の音声入力、96言語のテキスト入力/出力、35言語の音声出力をサポートします。
高品質な翻訳
複数の言語ペアに対応した高品質な音声・テキスト翻訳を提供します。
柔軟な生成戦略
ビームサーチデコードや多項式サンプリングなど、複数の生成戦略をサポートし、必要に応じて生成効果を調整できます。

モデル能力

音声から音声翻訳
音声からテキスト翻訳
テキストから音声翻訳
テキストからテキスト翻訳
自動音声認識

使用事例

言語間コミュニケーション
リアルタイム音声翻訳
ある言語の音声を別の言語の音声またはテキストにリアルタイムで翻訳し、会議や旅行などのシナリオに適用できます。
高品質な多言語音声出力
多言語コンテンツ生成
テキストや音声コンテンツを複数の言語に翻訳し、多言語メディアコンテンツの生成に使用します。
複数言語のテキスト・音声出力をサポート
音声処理
音声認識
音声をテキストに変換し、複数言語の音声入力をサポートします。
高精度な音声認識
音声合成
テキストを音声に変換し、複数言語の音声出力をサポートします。
自然な音声合成効果
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase