exp_w2v2t_it_xlsr - 53_s387オープンソースモデル - 無料でイタリア語の自動音声認識を実現

ホーム

Exp W2v2t It Xlsr 53 S387

jonatasgrosmanによって開発

facebook/wav2vec2-large-xlsr-53モデルをファインチューニングしたイタリア語自動音声認識モデルで、Common Voice 7.0イタリア語データセットでトレーニングされています。

音声認識

Transformers

その他オープンソースライセンス:Apache-2.0 #イタリア語音声認識 #XLSR-53ファインチューニング #16kHzサンプリングレート

ダウンロード数 18

リリース時間 : 7/8/2022

モデル概要

このモデルはイタリア語の自動音声認識(ASR)タスク向けに最適化されたモデルで、XLSR-53アーキテクチャをベースにファインチューニングされており、16kHzサンプリングレートの音声入力に適しています。

モデル特徴

イタリア語最適化

イタリア語音声認識タスク向けに特別にファインチューニングされています

XLSR-53アーキテクチャベース

facebookのwav2vec2-large-xlsr-53事前トレーニングモデルをベースにしています

16kHzサンプリングレート対応

最適な結果を得るためには16kHzサンプリングレートの音声入力が必要です

モデル能力

イタリア語音声からテキストへの変換

自動音声認識

使用事例

音声文字起こし

イタリア語音声文字起こし

イタリア語の音声コンテンツをテキストに変換します

音声アシスタント

イタリア語音声コマンド認識

イタリア語音声アシスタントシステムでのコマンド認識に使用されます

属性	详情
モデルタイプ	自動音声認識
トレーニングデータ	mozilla-foundation/common_voice_7_0

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Exp W2v2t It Xlsr 53 S387

モデル概要

モデル特徴

モデル能力

使用事例

🚀 exp_w2v2t_it_xlsr-53_s387

🚀 クイックスタート

📚 ドキュメント

📄 ライセンス