モデル選定

多シーン音声文字起こし

# 多シーン音声文字起こし

Wav2vec2 Base 10k Voxpopuli Ft Ro

FacebookのWav2Vec2アーキテクチャに基づく音声認識モデルで、ルーマニア語に対して微調整され、自動音声認識タスクに適しています。

Transformers その他

Wav2vec2 Base Turkish Cv8

これはCommon Voice 8.0トルコ語データセットを基に微調整された自動音声認識(ASR)モデルで、トルコ語の音声をテキストに変換することができます。

Transformers その他

Wav2vec2 Large Xls R 300m Basque

facebook/wav2vec2-xls-r-300mをベースに、バスク語のCommon Voiceデータセットで微調整した自動音声認識モデル

Transformers その他

Wav2vec2 Large Xls R 300m Bulgarian

facebook/wav2vec2 - xls - r - 300mをMOZILLA - FOUNDATION/COMMON_VOICE_7_0 - BGデータセットでファインチューニングしたブルガリア語音声認識モデル

Transformers その他

Wav2vec2 Large Xlsr 53 Dutch

Facebookが開発したWav2Vec 2.0アーキテクチャに基づくオランダ語自動音声認識(ASR)モデルで、XLSR - 53多言語事前学習モデルを微調整しています。

音声認識その他

Wav2vec2 Large Xls R 300m Pa IN Dx1

これはfacebook/wav2vec2-xls-r-300mをベースに、パンジャブ語（インド）データセットで微調整された自動音声認識モデルです。

Wav2vec2 Large Xls R 300m Hsb V1

これはfacebook/wav2vec2-xls-r-300mをベースに、上ソルブ語(HSB)データセットで微調整された自動音声認識モデルで、Common Voice 8テストセットで0.4393の単語誤り率(WER)を達成しました。

Transformers その他

Wav2vec2 Large Xls R 300m As V9

facebook/wav2vec2-xls-r-300mをベースに、アッサム語(Common Voice 8.0)データセットでファインチューニングした自動音声認識モデル

Transformers その他

Wav2vec2 Large Xlsr 53 Frisian

これはwav2vec2-large-xlsr-53モデルを微調整したフリジア語の自動音声認識(ASR)モデルで、RuudVeloによって開発されました。

このモデルは、KBLab/wav2vec2 - large - voxrexをベースに、NBAILAB/NPSC - 48K_MP3データセットで微調整された自動音声認識モデルです。

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase