M

Mms 1b L1107

facebookによって開発
Facebookの大規模多言語音声プロジェクトにおける自動音声認識モデルで、1107言語をサポートし、Wav2Vec2アーキテクチャを基盤とし、アダプター技術を活用して多言語転写を実現しています。
ダウンロード数 267
リリース時間 : 5/27/2023

モデル概要

このモデルはFacebookの大規模多言語音声プロジェクトの一部で、多言語自動音声認識(ASR)専用に設計されています。Wav2Vec2アーキテクチャを基盤とし、アダプター技術により1107言語の転写をサポートし、10億パラメータ規模を有しています。

モデル特徴

多言語サポート
1107言語の音声認識をサポートし、幅広い言語多様性をカバーします。
アダプター技術
アダプターモデルを採用し、異なる言語間の迅速な切り替えと効率的な転写を実現します。
大規模事前学習
10億パラメータの大規模事前学習モデルを基盤とし、強力な音声認識能力を備えています。

モデル能力

多言語音声認識
音声からテキストへ
言語アダプター切り替え

使用事例

音声転写
多言語音声転写
異なる言語の音声内容をテキストに転写
高精度な転写結果
言語研究
低リソース言語研究
低リソース言語の音声認識と研究をサポート
言語技術の適用範囲拡大
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase