M

Meralion AudioLLM Whisper SEA LION

MERaLiONによって開発
シンガポールの多言語多文化環境に特化した音声-テキスト大規模言語モデルで、Whisper-large-v2音声エンコーダーとSEA-LION V3テキストデコーダーを統合
ダウンロード数 2,828
リリース時間 : 11/22/2024

モデル概要

シンガポールのローカルアクセントや方言の多様な言語ニュアンスに最適化され、様々な音声テキスト変換タスクをサポート

モデル特徴

ローカル最適化
シンガポールのローカルアクセント、方言、コードスイッチングに特化して最適化
マルチタスクサポート
6種類の異なる音声テキスト変換タスクをサポート
効率的な推論
vLLMフレームワークによる高速推論を実現
大規模トレーニング
26万時間の音声データに基づいてトレーニング

モデル能力

音声認識
音声翻訳
音声質問応答
対話要約
音声コマンド理解
パラ言語学分析

使用事例

音声転写
文レベル音声認識
単文の音声をテキストに変換
シンガポールアクセントの英語を正確に転写
対話レベル音声認識
対話音声を話者タグ付きテキストに変換
複数話者認識とコードスイッチングをサポート
音声理解
音声対話要約
対話音声からキー情報を抽出して要約を生成
対話の核心を正確に捕捉
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase