モデル選定

リアルタイム音声翻訳

# リアルタイム音声翻訳

Quantum_STT は、大規模な弱教師あり学習に基づく先進的な自動音声認識（ASR）および音声翻訳モデルで、複数の言語とタスクをサポートしています。

Transformers 複数言語対応

Canary 180m Flash

NVIDIA NeMo Canary Flash は、英語、ドイツ語、フランス語、スペイン語の自動音声認識と翻訳タスクをサポートする多言語多機能音声モデルです。

音声認識複数言語対応

Canary 1b Flash

NVIDIA NeMo Canary Flashは多言語マルチタスクモデルファミリーで、複数の音声ベンチマークで最先端の性能を実現しています。4つの言語の自動音声認識と翻訳タスクをサポートします。

音声認識複数言語対応

Ultravox V0 5 Llama 3 1 8b

UltravoxはLlama3.1-8B-Instructとwhisper-large-v3-turboを基に構築されたマルチモーダル音声大規模言語モデルで、音声とテキスト入力を同時に処理できます。

テキスト生成オーディオ

Transformers 複数言語対応

Whisper Tflite Models

F-Droidプラットフォーム上のWhisperアプリに適したTFLiteモデルで、音声文字起こしと翻訳機能をサポートします。

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase