モデル選定

大規模音声モデル

# 大規模音声モデル

W2v Bert 2.0 Naijavoices Clearglobal Hausa 500hr V0

facebook/w2v-bert-2.0をファインチューニングしたハウサ語音声認識モデルで、500時間のハウサ語データで訓練され、単語誤り率7.47%

Whisper Large V2 Hungarian

OpenAI Whisper Large-V2モデルをハンガリー語Common Voiceデータセットでファインチューニングした音声認識モデル

Transformers その他

Whisper Large V2 Punjabi

OpenAI Whisper-large-v2をファインチューニングしたパンジャーブ語自動音声認識モデル、Common Voice 11.0データセットでトレーニング

Transformers その他

Xlsr Wav2vec2 2

facebook/wav2vec2-large-xlsr-53をファインチューニングした音声認識モデルで、多言語音声からテキストへの変換タスクをサポート

Wav2vec2 Large Xls R 300m Urdu Cv8 200epochs

Common Voiceデータセットでトレーニングされたウルドゥー語音声認識モデル、wav2vec 2.0アーキテクチャ採用

Base Spanish Asr

汎用音声データセットでトレーニングされたスペイン語音声認識モデル、wav2vec2アーキテクチャを採用

Wav2vec2 Xls R 2b 21 To En

FacebookのWav2Vec2 XLS - Rモデルで、多言語音声から英語への翻訳タスクに使用されます。

Transformers 複数言語対応

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase