L

Llama 3 Typhoon V1.5 8b Audio Preview

scb10xによって開発
Typhoon-Audio プレビュー版はタイ語と英語に対応したオーディオ-言語モデルで、テキストと音声入力を処理し、テキストを出力します。
ダウンロード数 218
リリース時間 : 8/10/2024

モデル概要

Typhoon-1.5-8b-instructをベースにしたマルチモーダル音声-言語モデルで、タイ語と英語の音声文字起こし、翻訳、質問応答タスクをサポートします。

モデル特徴

マルチモーダル入力
テキストと音声入力をネイティブにサポートし、テキストを出力します。
タイ語最適化
タイ語に特化して最適化されており、タイ語の音声文字起こしや質問応答をサポートします。
高性能
タイ語ASR、翻訳、質問応答タスクで優れた性能を発揮し、同類のモデルを凌駕します。

モデル能力

音声文字起こし
テキスト生成
音声コマンド理解
多言語翻訳

使用事例

音声文字起こし
タイ語音声文字起こし
タイ語の音声コンテンツをテキストに変換します。
WER(単語誤り率)は14.17
翻訳
英語→タイ語翻訳
英語の音声またはテキストをタイ語に翻訳します。
BLEUスコアは17.52
タイ語→英語翻訳
タイ語の音声またはテキストを英語に翻訳します。
BLEUスコアは24.14
質問応答
タイ語音声質問応答
タイ語音声に基づく質問に回答します。
F1スコアは64.60
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase