M

Mms Lid 126

facebookによって開発
Facebookの大規模多言語音声プロジェクトを基にファインチューニングした言語識別モデルで、126言語の音声分類をサポート
ダウンロード数 2.1M
リリース時間 : 6/13/2023

モデル概要

このモデルはWav2Vec2アーキテクチャを基にしており、生の音声入力を126言語の確率分布に分類できる10億パラメータの大規模音声認識モデルです

モデル特徴

超多言語サポート
126言語の音声認識をサポートし、世界の主要言語をカバー
大規模モデル
10億パラメータのWav2Vec2アーキテクチャを基にした強力な音声特徴抽出能力
高精度
複数言語で優れた性能を発揮し、異なる言語の音声特徴を正確に識別
使いやすい統合
Hugging Face Transformersライブラリとシームレスに統合可能で、デプロイが容易

モデル能力

音声言語識別
多言語音声分類
リアルタイム音声分析

使用事例

音声技術応用
多言語音声アシスタント
スマートデバイスでユーザーの音声言語タイプを自動識別
126言語を正確に識別し、ユーザー体験を向上
音声コンテンツ分析
音声ストリーム中の言語タイプを自動識別
大規模多言語音声データ処理をサポート
音声ルーティングシステム
識別結果に基づき通話を対応言語のサービスシステムにルーティング
カスタマーサービスシステムの効率向上
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase