モデル選定

16kHzサンプリングレート対応

# 16kHzサンプリングレート対応

Exp W2v2t Sv Se R Wav2vec2 S418

facebook/wav2vec2-large-robustモデルをファインチューニングしたスウェーデン語自動音声認識モデルで、16kHzサンプリングレートの音声入力をサポートします。

Exp W2v2t It Vp Fr S821

facebook/wav2vec2-large-fr-voxpopuliモデルをファインチューニングしたイタリア語自動音声認識モデル、Common Voice 7.0イタリア語データセットでトレーニング

Transformers その他

Exp W2v2t It Wavlm S895

microsoft/wavlm-largeモデルを基にファインチューニングしたイタリア語自動音声認識モデルで、Common Voice 7.0イタリア語データセットでトレーニングされています。

Transformers その他

Wav2vec2 Large Xlsr 53 Ukrainian

facebook/wav2vec2-large-xlsr-53を基に、ウクライナ語でCommon Voiceデータセットを使用してファインチューニングした自動音声認識モデル

音声認識その他

Wav2vec2 Large Xlsr Estonian

facebook/wav2vec2-large-xlsr-53をエストニア語Common Voiceデータセットでファインチューニングした自動音声認識モデル

音声認識その他

Wav2vec2 Large Xlsr 53 Levantine Arabic

facebook/wav2vec2-large-xlsr-53モデルを基に、アラビア語音声コーパスデータセットでファインチューニングしたアラビア語音声認識モデル

音声認識アラビア語

Wav2vec2 Large Xls Ar

facebook/wav2vec2-large-xlsr-53モデルを基にファインチューニングしたアラビア語自動音声認識モデルで、Common Voiceアラビア語データセットでテストしたWERは52%です。

Transformers アラビア語

Wav2vec2 Large Xlsr Tamil

facebook/wav2vec2-large-xlsr-53モデルを微調整したタミル語自動音声認識(ASR)モデル

音声認識その他

Wav2vec2 Large Xlsr Arabic

facebook/wav2vec2-large-xlsr-53をアラビア語Common Voiceデータセットでファインチューニングした音声認識モデル

Transformers アラビア語

Wav2vec2 Large Robust Ft Libri 960h

このモデルはFacebook Wav2Vec2のファインチューニング版で、音声認識タスクに特化しており、複数の音声データで事前学習され、Librispeechでファインチューニングされており、高いロバスト性を持っています。

Transformers 英語

Wav2vec2 Large Xlsr 53 Euskera

facebook/wav2vec2-large-xlsr-53モデルをバスク語（Euskera）でCommon Voiceデータセットを使用してファインチューニングした音声認識モデル。

音声認識その他

Wav2vec2 Base Voxpopuli Sv Swedish

FacebookのVoxPopuli-svベース版モデルをベースに、NSTとCommon Voiceのデータを使って微調整されたスウェーデン語音声認識モデルです。

Vakyansh Wav2vec2 Hindi Him 4200

Wav2Vec2アーキテクチャに基づくヒンディー語自動音声認識モデルで、Harveen Chadhaによって開発され、4200時間のラベル付きヒンディー語データで微調整されました。

Transformers その他

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase