モデル選定

ベトナム語音声認識

# ベトナム語音声認識

Whisper Small Vi

openai/whisper-smallをベースにベトナム語音声データ向けにファインチューニングした自動音声認識モデルで、ベトナム語の文字起こし精度と頑健性を向上

Transformers その他

Whisper Base Vi

openai/whisper-baseモデルを100時間のベトナム語音声データでファインチューニングした音声認識モデルで、ベトナム語文字起こしの精度を向上

Transformers その他

Chunkformer Large Vie

ChunkFormerアーキテクチャに基づく大規模ベトナム語自動音声認識モデルで、約3000時間のベトナム語公開音声データで微調整され、優れた性能を発揮します。

音声認識その他

Vi Whisper Large V3 Turbo V1

ベトナム語自動音声認識(ASR)タスク向けに最適化されたWhisper-V3-Turboモデル、複数のベトナム語データセットでファインチューニング済み

Transformers その他

Viwhisper Medium

ベトナム語音声認識タスク向けに最適化されたWhisper-mediumモデル、1308時間のベトナム語データでファインチューニング済み

Transformers その他

Whisper Tiny Vi

OpenAI Whisper-tinyアーキテクチャをベースにファインチューニングしたベトナム語自動音声認識(ASR)モデルで、複数のベトナム語データセットで優れた性能を発揮

Transformers その他

Phowhisper Medium

PhoWhisperは、ベトナム語の自動音声認識（ASR）に特化したモデルシリーズで、844時間のベトナム語アクセントデータセットでWhisperモデルを微調整することで高いロバスト性を実現しています。

Transformers その他

Phowhisper Small

PhoWhisperはベトナム語自動音声認識のために特別に設計されたシステムで、Whisperモデルをファインチューニングしており、さまざまなベトナム語のアクセントをサポートしています。

Transformers その他

Wav2vec2 Bartpho

これはベトナム語をサポートする自動音声認識モデルで、正規化されたテキストの出力、タイムスタンプの付与、および複数話者のセグメンテーションが可能です。

Transformers その他

Whisper Large V2 Vietnamese

このモデルはOpenAIのWhisper Smallアーキテクチャを基に、Common Voice 11.0ベトナム語データセットでファインチューニングされた自動音声認識(ASR)モデルです

Transformers その他

Wav2vec2 Large Vi Vlsp2020

wav2vec2アーキテクチャに基づくベトナム語自動音声認識モデル。1.3万時間の未ラベルYouTube音声で事前学習し、250時間のラベル付きデータでファインチューニング

Transformers その他

Wav2vec2 Base Vietnamese 160h

Wav2vec2ベースのベトナム語音声認識モデル、160時間のベトナム語音声データでファインチューニング

Transformers その他

Viwav2vec2 Base 3k

このモデルは3千時間のベトナム語音声データで事前学習されたWav2Vec2ベースモデルで、ベトナム語音声認識タスクに適しており、下流タスクで微調整して使用する必要があります。

Transformers その他

Viwav2vec2 Base 1.5k

このモデルは1.5千時間のベトナム語音声データで事前学習されており、ベトナム語音声認識タスクに適しています。使用前に微調整が必要です。

Transformers その他

Wav2vec NCKH 2022

Wav2vec2アーキテクチャに基づくベトナム語自動音声認識モデル、音声からテキストへの変換をサポート

Transformers その他

Wav2vec2 Large Xls R 300m Vietnamese Colab

このモデルはfacebook/wav2vec2-xls-r-300mを汎用音声データセットでファインチューニングしたベトナム語音声認識モデルです

Fb Vindata Vi Large

このモデルは、facebook/wav2vec2-large-xlsr-53をPHONGDTD/VINDATAVLSP - NAデータセットでファインチューニングしたベトナム語自動音声認識モデルです

このモデルはfacebook/wav2vec2-xls-r-300mをCommon Voice 7.0ベトナム語データセット及びプライベートデータセットでファインチューニングした音声認識モデルです。

Transformers その他

microsoft/wavlm-base-plusをベースに、PHONGDTD/VINDATAVLSP - NAデータセットで微調整したベトナム語自動音声認識モデル

Wav2vec2 Base Vietnamese

Wav2Vec2アーキテクチャに基づくベトナム語音声認識モデル、VSLPデータセットでファインチューニング済み、16kHzサンプリングレートの音声入力をサポート

Transformers その他

Wav2vec2 Base Vietnamese 250h

wav2vec 2.0アーキテクチャに基づくベトナム語自動音声認識モデルで、13,000時間の未ラベル付きオーディオと250時間のラベル付きデータで訓練されています。

Transformers その他

Fine Tune XLSR Wav2Vec2 Speech2Text Vietnamese

これはMT5アーキテクチャに基づくベトナム語自動音声認識(ASR)修復モデルで、ベトナム語音声認識タスク向けにファインチューニングされています。

音声認識その他

Viwav2vec2 Base 100h

VLSPデータセットの100時間のラベルなしベトナム語音声データで事前学習されたWav2Vec2基本モデルで、下流タスクで微調整が必要です。

Transformers その他

Wav2vec2 Large Xlsr 53 Vietnamese

facebook/wav2vec2-large-xlsr-53モデルをベトナム語向けにファインチューニングした自動音声認識モデルで、16kHzサンプリングレートの音声入力をサポートします。

Transformers その他

Xls Asr Vi 40h 1B

facebook/wav2vec2-xls-r-1bをベースに、40時間のFPTオープン音声データセット(FOSD)と公共音声データセット7.0で微調整したベトナム語自動音声認識モデル

Transformers その他

Wav2vec2 Large Xlsr 53 Vietnamese

facebook/wav2vec2-large-xlsr-53モデルをファインチューニングしたベトナム語自動音声認識モデル、Common Voiceデータセットでトレーニング済み。

音声認識その他

Wavlm Vindata Demo Dist

microsoft/wavlm-baseをベトナム語データセットでファインチューニングした自動音声認識モデル

Fb Youtube Vi Large

このモデルは、facebook/wav2vec2-large-xlsr-53をベトナム語のYouTube非公式音声データセットでファインチューニングした自動音声認識モデルです。

Wav2vec2 Base Vn 270h

約270時間のベトナム語注釈データでファインチューニングされた音声認識モデルで、ベトナム語の自動音声認識タスクをサポート

音声認識その他

Wav2vec2 Large Xlsr Vietnamese

facebook/wav2vec2-large-xlsr-53モデルをベースにファインチューニングしたベトナム語自動音声認識モデル

音声認識その他

Wav2vec2 Large Xlsr Vietnamese

これはfacebook/wav2vec2-large-xlsr - 53モデルをベトナム語で微調整した音声認識モデルで、Common VoiceとInfore_25hデータセットを使用して訓練されました。

音声認識その他

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase