P

Pathumma Llm Audio 1.0.0

由nectec開發
Pathumma-llm-audio-1.0.0是一個80億參數的泰語大語言模型,專為音頻理解任務設計,能夠處理語音、通用音頻和音樂等多種音頻輸入。
下載量 333
發布時間 : 10/24/2024

模型概述

該模型結合了OpenThaiLLM-DoodNiLT-V1.0.0-Beta-7B語言模型和Pathumma-whisper-th-large-v3語音編碼器,能夠將音頻轉換為有意義的文本表示。

模型特點

多類型音頻處理
能夠處理語音、通用音頻和音樂等多種類型的音頻輸入。
泰語優化
專為泰語設計,優化了泰語語音和文本的轉換能力。
高效推理
支持LoRA推理模式,適合在有限資源下運行。

模型能力

音頻轉錄
語音理解
文本生成

使用案例

語音轉錄
泰語語音轉文本
將泰語語音轉換為文本輸出。
音頻理解
通用音頻分析
分析通用音頻內容並生成描述性文本。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase