P

Pathumma Llm Audio 1.0.0

nectecによって開発
Pathumma-llm-audio-1.0.0は80億パラメータのタイ語大規模言語モデルで、音声理解タスク向けに設計されており、音声、汎用音声、音楽など様々な音声入力を処理できます。
ダウンロード数 333
リリース時間 : 10/24/2024

モデル概要

このモデルはOpenThaiLLM-DoodNiLT-V1.0.0-Beta-7B言語モデルとPathumma-whisper-th-large-v3音声エンコーダを組み合わせており、音声を意味のあるテキスト表現に変換できます。

モデル特徴

多種音声処理
音声、汎用音声、音楽など様々な種類の音声入力を処理できます。
タイ語最適化
タイ語向けに設計され、タイ語音声とテキストの変換能力を最適化しています。
効率的な推論
LoRA推論モードをサポートし、限られたリソースでの実行に適しています。

モデル能力

音声書き起こし
音声理解
テキスト生成

使用事例

音声書き起こし
タイ語音声からテキストへ
タイ語音声をテキスト出力に変換します。
音声理解
汎用音声分析
汎用音声内容を分析し、記述的なテキストを生成します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase