M

Mms 1b Fl102

facebookによって開発
MMS-1B-FL102はFacebookの大規模多言語音声プロジェクトの一部で、102言語をサポートする自動音声認識モデルです。10億パラメータのWav2Vec2アーキテクチャを基に、アダプター技術で多言語転写を実現しています。
ダウンロード数 6,360
リリース時間 : 5/27/2023

モデル概要

このモデルは多言語自動音声認識(ASR)用にファインチューニングされたチェックポイントで、100以上の言語の音声を転写できます。Wav2Vec2アーキテクチャを基盤とし、アダプター技術で多言語サポートを実現しており、facebook/mms-1bをFleursデータセットの102言語でファインチューニングしたものです。

モデル特徴

多言語サポート
102言語の音声認識をサポートし、多数の少数言語も含まれます
アダプター技術
アダプターモデルを使用して言語切り替えを実現し、モデル全体を再読み込みする必要がありません
大規模事前学習
10億パラメータのWav2Vec2アーキテクチャを基にし、強力な音声認識能力を持っています

モデル能力

多言語音声認識
リアルタイム音声転写
言語アダプター切り替え

使用事例

音声転写
多言語会議転写
複数言語を含む会議内容をリアルタイムで転写
音声コンテンツのローカライズ
音声コンテンツを転写後、他の言語に翻訳
音声アシスタント
多言語音声アシスタント
複数言語をサポートする音声アシスタントアプリケーションの開発
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase