モデル選定

多言語ASR

# 多言語ASR

Erax WoW Turbo V1.1 CT2

CTranslate2で最適化されたWhisper Large-v3 Turboのベトナム語強化ローカライズ版で、多言語音声認識をサポートし、高速で高精度

Transformers その他

Erax WoW Turbo V1.0

ベトナム語に最適化されたWhisper Large-v3 Turbo音声認識モデルで、多言語リアルタイム書き起こしをサポート

Transformers その他

Lite Whisper Large V3 Turbo

Lite-WhisperはLiteASR技術で圧縮されたOpenAI Whisperの軽量版で、高い精度を維持しながらモデルサイズを大幅に削減しています。

efficient-speech

Whisper Small Tajik

OpenAI Whisper-smallをファインチューニングしたタジク語自動音声認識モデルで、Google Fleursデータセットでトレーニングされ、単語誤り率24.26%です。

Transformers その他

Whisperkit Coreml

WhisperKitはAppleチップ向けに設計されたローカル音声認識フレームワークで、効率的な自動音声認識機能を提供します。

音声認識その他

do-not-use-this-account-token

Whosper Large V2

Whosper-large-v2は、セネガルの主要言語であるウォロフ語に特化した最先端の音声認識モデルで、OpenAIのWhisper-large-v2を基に構築されており、単語誤り率（WER）と文字誤り率（CER）を大幅に改善しています。

音声認識複数言語対応

WhisperKit ProはWhisperKitの商用版で、自動音声認識（ASR）タスクに特化し、量子化技術をサポートし、効率的な音声処理に適しています。

CrisperWhisperはOpenAI Whisperの高度なバリアントで、迅速かつ正確な逐語的な音声認識のために設計されており、正確（明確）な単語レベルのタイムスタンプを提供します。

Transformers 複数言語対応

Whisperkit Coreml

WhisperKit は Apple Silicon 向けのローカル音声認識フレームワークで、効率的な自動音声認識タスクをサポートします。

音声認識その他

Whisper Large V2 Onnx Int4 Inc

Whisperは事前学習済みの自動音声認識（ASR）および音声翻訳モデルで、68万時間の注釈付きデータでトレーニングされ、強力な汎化能力を示しています。このリポジトリには、ONNX形式のWhisper large v2モデルのINT4重みのみ量子化バージョンが含まれています。

Whisper Medium Catalan

これはOpenAI Whisper Mediumモデルをカタルーニャ語Common Voice 11.0データセットで微調整した音声認識モデルです。

Transformers その他

Wav2vec2 Large Xls R 300m Hausa

これは、facebook/wav2vec2 - xls - r - 300mをハウサ語音声データセットでファインチューニングした自動音声認識モデルです。

Transformers その他

Wav2vec2 Large Xls R 300m Guarani Small

このモデルはfacebook/wav2vec2-xls-r-300mを汎用音声データセットでファインチューニングしたバージョンで、グアラニー語音声認識をサポートしています。

Wav2vec2 Large Xls R 300m Lithuanian

これはfacebook/wav2vec2-xls-r-300mモデルをリトアニア語のCommon Voice 7.0データセットで微調整した自動音声認識(ASR)モデルです。

Transformers その他

Wav2vec2 Xls R 300m Hi Final

facebook/wav2vec2-xls-r-300mをファインチューニングしたヒンディー語音声認識モデルで、Openslr多言語コーパスとCommon Voice 7.0データセットでトレーニング

Transformers その他

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase