P

Pathumma Llm Audio 1.0.0

Developed by nectec
Pathumma-llm-audio-1.0.0是一個80億參數的泰語大語言模型,專為音頻理解任務設計,能夠處理語音、通用音頻和音樂等多種音頻輸入。
Downloads 333
Release Time : 10/24/2024

Model Overview

該模型結合了OpenThaiLLM-DoodNiLT-V1.0.0-Beta-7B語言模型和Pathumma-whisper-th-large-v3語音編碼器,能夠將音頻轉換為有意義的文本表示。

Model Features

多類型音頻處理
能夠處理語音、通用音頻和音樂等多種類型的音頻輸入。
泰語優化
專為泰語設計,優化了泰語語音和文本的轉換能力。
高效推理
支持LoRA推理模式,適合在有限資源下運行。

Model Capabilities

音頻轉錄
語音理解
文本生成

Use Cases

語音轉錄
泰語語音轉文本
將泰語語音轉換為文本輸出。
音頻理解
通用音頻分析
分析通用音頻內容並生成描述性文本。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase