モデル選定

英語ASR

# 英語ASR

月光モデルはUseful Sensorsによって開発された自動音声認識(ASR)モデルで、リソースが制限されたデバイス上で効率的な英語音声の文字起こしを実現することに焦点を当てています。

Transformers 英語

Asr Wav2vec2 Librispeech

これはLibriSpeechデータセットでトレーニングされたエンドツーエンドの自動音声認識システムで、wav2vec 2.0事前トレーニングモデルとCTC技術を組み合わせ、英語音声認識タスクで優れた性能を発揮します。

音声認識英語

Iwslt Asr Wav2vec Large 4500h

Wav2Vec2アーキテクチャに基づく大規模英語自動音声認識モデルで、4500時間の多ソース音声データで微調整され、言語モデルを用いたデコードをサポートします。

Transformers 英語

Sew Tiny 100k Ft Ls100h

SEW（圧縮高効率版Wav2vec）は、ASAPP Researchによって開発された音声認識の事前学習モデルで、性能と効率の面でwav2vec 2.0より優れています。

Transformers 複数言語対応

Simpleoier Librispeech Asr Train Asr Conformer7 Wavlm Large Raw En Bpe5000 Sp

ESPnetフレームワークでトレーニングされた自動音声認識(ASR)モデルで、ConformerアーキテクチャとWavLM大型事前学習モデルを使用し、LibriSpeechデータセットでトレーニングされました。

音声認識英語

Kamo Naoyuki Mini An4 Asr Train Raw Bpe Valid.acc.best

これはESPnet2フレームワークでトレーニングされた自動音声認識(ASR)事前学習モデルで、mini-an4データセットを使用してトレーニングされ、英語音声認識をサポートします。

音声認識英語

S2t Medium Librispeech Asr

シーケンスツーシーケンストランスフォーマーアーキテクチャに基づく、自動音声認識(ASR)用の音声からテキストへの変換器(S2T)モデル

Transformers 英語

Asr Transformer Transformerlm Librispeech

これはTransformerアーキテクチャに基づく自動音声認識(ASR)システムで、CTCとTransformerデコーダを組み合わせ、LibriSpeech英語データセットでトレーニングされています。

音声認識英語

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase