B

Biolingual

由davidrrobinson開發
基於對比語言-音頻預訓練的生物聲學音頻-文本模型,支持生物聲學零樣本分類和任務微調
下載量 483
發布時間 : 7/24/2023

模型概述

BioLingual是一個基於人類語言監督的可遷移生物聲學模型,通過對比語言-音頻預訓練實現生物聲學音頻與文本的關聯

模型特點

對比語言-音頻預訓練
通過對比學習實現音頻與文本的跨模態關聯
零樣本分類能力
無需微調即可對新的音頻類別進行分類
生物聲學專用
專門針對動物聲音等生物聲學數據優化

模型能力

生物聲學音頻分類
音頻-文本嵌入提取
零樣本學習
跨模態檢索

使用案例

野生動物監測
動物聲音識別
識別野外錄音中的特定動物種類
示例中能準確識別狗的聲音
生態研究
生物多樣性評估
通過聲音分析評估特定區域的生物多樣性
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase