L

Llama3.1 Typhoon2 Audio 8b Instruct

scb10xによって開発
タイフーン2-オーディオ版は、オーディオ、音声、テキスト入力を処理し、テキストと音声の両方を同時に生成できるエンドツーエンドの音声変換モデルアーキテクチャです。このモデルは特にタイ語に最適化されており、英語もサポートしています。
ダウンロード数 664
リリース時間 : 12/13/2024

モデル概要

タイフーン2大規模言語モデルをベースにした音声変換モデルで、タイ語と英語の音声入出力をサポートし、テキスト生成と音声合成の能力を備えています。

モデル特徴

マルチモーダル入出力
オーディオ、音声、テキスト入力をサポートし、テキストと音声の両方を同時に生成可能
タイ語最適化
特にタイ語に最適化されており、高品質なタイ語音声処理能力を提供
エンドツーエンドアーキテクチャ
追加の中間処理ステップなしで、完全な音声変換処理フローを実現
マルチターン対話サポート
複雑なマルチターン対話インタラクションをサポートし、文脈の一貫性を保持

モデル能力

音声認識
音声合成
テキスト生成
音声変換
多言語処理
対話システム

使用事例

音声アシスタント
タイ語音声アシスタント
音声入力と音声出力をサポートするタイ語音声アシスタントの構築
タイ語音声品質評価で7.19点(満点10点)を獲得
音声文字起こし
タイ語音声文字起こし
タイ語音声コンテンツをテキストに文字起こし
タイ語ASRのWERは14.04%
音声翻訳
英タイ音声翻訳
英語音声をタイ語テキストまたは音声に翻訳
英→タイ翻訳のBLEUスコアは27.15
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase