モデル選定

低CER最適化

# 低CER最適化

Wav2vec2 Base Japanese Asr

rinna/japanese-wav2vec2-baseをcommon_voice_11_0日本語データセットでファインチューニングした音声認識モデル、ひらがな出力のみ対応

Transformers 日本語

Wav2vec2 Large Chinese Zh Cn

XLSR-53大規模モデルをファインチューニングした中国語音声認識モデル、16kHzサンプリングレートの音声入力をサポート

Transformers 中国語

Wav2vec2 Large Ru Golos

facebook/wav2vec2-large-xlsr-53をファインチューニングしたロシア語音声認識モデル。Sberdevices Golosデータセットでトレーニングされ、16kHz音声入力をサポート

Transformers その他

Wav2vec2 Large Xlsr 53 Finnish

XLSR-53大規模モデルをファインチューニングしたフィンランド語音声認識モデル、16kHz音声入力に対応

音声認識その他

W2v Hf Jsut Xlsr53

facebook/wav2vec2-large-xlsr-53モデルをベースに、Common VoiceとJSUTデータセットを使用して日本語にファインチューニングした自動音声認識モデルです。

Transformers 日本語

Wav2vec2 Large Xlsr 53 Tw Gpt

facebook/wav2vec2-large-xlsr-53を台湾華語(zh-tw)でファインチューニングした音声認識モデル、16kHzサンプリングレートの音声入力をサポート

Wav2vec2 Xls R 300m Korean

XLS-Rアーキテクチャに基づく韓国語自動音声認識モデル、Zeroth Koreanデータセットでファインチューニング済み

Transformers 韓国語

Wav2vec2 Large Xlsr 53 Chinese Zh Cn

facebook/wav2vec2-large-xlsr-53モデルをファインチューニングした中国語音声認識モデルで、16kHzサンプリングレートの音声入力をサポートしています。

音声認識中国語

Wav2vec2 Xls R 300m Korean Lm

XLS-Rアーキテクチャに基づく韓国語自動音声認識モデルで、Zeroth韓国語データセットで微調整され、5-gram言語モデルが追加されています

Transformers 韓国語

Wav2vec2 Large Xlsr Japanese

facebook/wav2vec2-large-xlsr-53を日本語用にファインチューニングしたモデルで、日本語音声認識タスクをサポートします。

Transformers 日本語

Wav2vec2 Xls R 300m Zh HK Lm V2

XLS-Rアーキテクチャに基づく自動音声認識モデルで、広東語(zh-HK)向けに最適化され、Common Voiceデータセットで微調整され、5-gram言語モデルが追加されています。

Wav2vec2 Xls R 300m Japanese

これはfacebook/wav2vec2-xls-r-300mをファインチューニングした日本語自動音声認識モデルで、日本語の音声を平仮名テキストに転写するために特化しています。

Transformers 日本語

Wav2vec2 Large Japanese

facebook/wav2vec2-large-xlsr-53モデルを微調整した日本語音声認識モデルで、16kHzサンプリングレートの入力をサポートします。

音声認識日本語

Wav2vec2 Xls R 300m Japanese

これはfacebook/wav2vec2 - xls - r - 300mをベースに、日本語Common Voice 8.0データセットで微調整された自動音声認識(ASR)モデルで、日本語の音声を文字に変換する機能をサポートしています。

Transformers 日本語

Wav2vec2 Xls R 300m German De

このモデルは、facebook/wav2vec2 - xls - r - 300mをベースに、MOZILLA - FOUNDATION/COMMON_VOICE_7_0 - DEデータセットで微調整されたドイツ語自動音声認識モデルです。

Transformers ドイツ語

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase