S

Seamless M4t V2 Large

facebookによって開発
SeamlessM4T v2 は Facebook がリリースした大規模多言語マルチモーダル機械翻訳モデルで、約100言語の音声とテキスト翻訳をサポートしています。
ダウンロード数 64.59k
リリース時間 : 11/29/2023

モデル概要

SeamlessM4T はオールインワンの大規模多言語マルチモーダル機械翻訳モデルで、音声とテキストの高品質な翻訳サービスを提供します。音声から音声、音声からテキスト、テキストから音声、テキストからテキスト翻訳、および自動音声認識など、さまざまなタスクをサポートします。

モデル特徴

多言語サポート
101言語の音声入力、96言語のテキスト入力/出力、35言語の音声出力をサポート。
マルチモーダル翻訳
音声から音声、音声からテキスト、テキストから音声、テキストからテキスト翻訳、および自動音声認識など、さまざまなタスクをサポート。
高品質翻訳
新しいUnitY2アーキテクチャを採用し、品質と音声生成タスクの推論速度の両方で前バージョンを上回っています。
高速推論
階層的な文字からユニットへのアップサンプリングと非自己回帰的なテキストからユニットへのデコードにより、推論速度を大幅に向上。

モデル能力

音声から音声翻訳
音声からテキスト翻訳
テキストから音声翻訳
テキストからテキスト翻訳
自動音声認識

使用事例

翻訳サービス
多言語会議翻訳
会議中の音声をリアルタイムで複数言語のテキストまたは音声に翻訳します。
高品質な多言語翻訳により、会議の効率とコミュニケーション効果を向上。
音声コンテンツ転記
音声コンテンツを自動的にテキストに転記し、複数言語をサポートします。
正確な音声認識と転記により、字幕生成や会議記録などのシナリオに適しています。
教育
言語学習支援
学習者が音声とテキストの相互翻訳を通じて言語学習を支援します。
高品質な多言語翻訳を提供し、言語学習をサポート。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase