S

Seamless M4t V2 Large

audoによって開発
SeamlessM4Tは大規模な多言語マルチモーダル機械翻訳モデルで、約100言語の音声とテキスト翻訳をサポートしています。
ダウンロード数 39
リリース時間 : 12/3/2023

モデル概要

SeamlessM4Tは基本的なオールインワンの多言語マルチモーダル機械翻訳モデルで、音声とテキストの高品質な翻訳を提供します。音声から音声、音声からテキスト、テキストから音声、テキストからテキスト翻訳、および自動音声認識など、さまざまなタスクをサポートします。

モデル特徴

多言語サポート
101言語の音声入力と96言語のテキスト入力/出力をサポートし、世界の主要言語をカバー
マルチモーダル翻訳
音声から音声、音声からテキスト、テキストから音声、テキストからテキストなど、さまざまな翻訳モードをサポート
高品質翻訳
新しいUnitY2アーキテクチャを採用し、品質と推論速度の両方で前バージョンを上回る
高速推論
階層的な文字からユニットへのアップサンプリングと非自己回帰的なテキストからユニットへのデコードにより、推論速度を大幅に向上

モデル能力

音声認識
音声合成
テキスト翻訳
音声翻訳
多言語処理

使用事例

リアルタイム翻訳
会議リアルタイム翻訳
国際会議でリアルタイムの音声翻訳サービスを提供
複数言語のリアルタイム相互翻訳をサポート
音声アシスタント
スマートデバイスに多言語音声インタラクション機能を提供
言語を超えた自然な会話を実現
コンテンツローカライゼーション
動画字幕生成
多言語の動画字幕を自動生成
コンテンツのアクセシビリティを向上
多言語ポッドキャスト
ポッドキャストコンテンツを複数言語に翻訳
視聴者層を拡大
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase