モデル選定

中国語音声認識

# 中国語音声認識

Belle Whisper Large V3 Turbo Zh Ct2

これはBELLE-2/Belle-whisper-large-v3-turbo-zhモデルのCTranslate2形式変換バージョンで、効率的な音声認識タスクに適しています。

Belle Whisper Large V3 Turbo Zh

whisper-large-v3-turboを基に中国語音声認識向けに微調整したモデルで、複数の中国語音声認識ベンチマークテストで性能が大幅に向上

Whisper Tiny Chinese

OpenAI Whisper TinyモデルをCommon Voice 11.0中国語データセットでファインチューニングした音声認識モデル

Transformers 中国語

Belle Whisper Large V3 Zh

whisper-large-v3を微調整して最適化した中国語音声認識モデルで、複数の中国語音声ベンチマークテストで性能が大幅に向上

Belle Distilwhisper Large V2 Zh

distilwhisper-large-v2を微調整した中国語音声認識モデルで、whisper-large-v2の5.8倍の速度で、パラメータが51%削減されています

Belle Whisper Large V2 Zh

whisper-large-v2を微調整した中国語音声認識モデルで、複数の中国語音声認識ベンチマークテストにおいて30-70%の相対的性能向上を実現しました。

Asr Wav2vec2 Commonvoice 14 Zh CN

これはCommonVoice中国語データセットでトレーニングされたエンドツーエンドの自動音声認識システムで、wav2vec2.0とCTCアーキテクチャを使用し、中国語音声認識をサポートします。

音声認識中国語

Faster Whisper Large Zh Cv11

これはjonatasgrosman/whisper-large-zh-cv11モデルのCTranslate2変換バージョンで、効率的な音声認識タスク向けに最適化されており、特に中国語音声認識能力が強化されています。

音声認識中国語

Whisper Tiny Zh

openai/whisper-tinyをファインチューニングした中国語音声認識モデル、Common Voice 11.0中国語データセットでトレーニング

Transformers 中国語

Whisper Large Zh Cv11

openai/whisper-large-v2をベースに、中国語(北京語)向けにCommon Voice 11データセットでファインチューニングした音声認識モデル

Transformers 中国語

Whisper Small Chinese Base

openai/whisper-smallをgoogle/fleurs cmn_hans_cnデータセットで微調整した中国語音声認識モデル

Wav2vec2 Large Chinese Zh Cn

XLSR-53大規模モデルをファインチューニングした中国語音声認識モデル、16kHzサンプリングレートの音声入力をサポート

Transformers 中国語

Exp W2v2t Zh Cn Wavlm S596

microsoft/wavlm-largeモデルを基にファインチューニングした中国語音声認識モデルで、簡体字中国語をサポートし、Common Voice 7.0 (zh-CN)データセットでトレーニングされています。

Stt Zh Citrinet 1024 Gamma 0 25

これは中国語普通話の自動音声認識(ASR)用の非自己回帰Citrinetモデルで、約1.4億のパラメータを持ち、文字エンコーディングスキームとCTC損失/デコードを採用しています。

音声認識中国語

Wav2vec2 Large Xlsr 53 Chinese Zn Cn Aishell1

facebook/wav2vec2-large-xlsr-53をベースに中国語AISHELL-1データセットでファインチューニングした音声認識モデルで、中国語音声認識タスクをサポートします。

Transformers 中国語

Wav2vec2 Base MIR ST500 ASR 109

facebook/wav2vec2-baseをベースにMIR_ST500データセットでファインチューニングした自動音声認識モデル

Wav2vec2 Large Xlsr 53 Chinese Zh Cn Gpt

facebook/wav2vec2-large-xlsr-53をベースに中国語(zh-CN)でCommon Voiceデータセットを使用してファインチューニングした音声認識モデル

Transformers 中国語

Wav2vec2 Large Xlsr 53 Chinese Zh Cn

facebook/wav2vec2-large-xlsr-53モデルをファインチューニングした中国語音声認識モデルで、16kHzサンプリングレートの音声入力をサポートしています。

音声認識中国語

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase