無監督預訓練

# 無監督預訓練

Sam2 Hiera Base Plus.fb R896

基於HieraDet圖像編碼器的SAM2模型，專注於圖像特徵提取任務。

Dinov2 With Registers Base

基於DINOv2訓練的視覺Transformer模型，通過添加寄存器標記優化注意力機制，提升特徵提取能力

Depth Anything V2 Small

Depth Anything V2 是目前性能最強的單目深度估計模型，基於大規模合成與真實圖像訓練，相比V1版本能捕捉更精細的細節且更魯棒。

NVIDIA開發的視覺特徵提取模型，用於生成圖像嵌入，支持下游任務如圖像分類。

由NVIDIA研發的視覺特徵提取模型，可將圖像轉換為嵌入向量供下游任務使用

Esm1b T33 650M UR50S

ESM-1b是基於Transformer的蛋白質語言模型，通過無監督學習蛋白質序列數據，可用於蛋白質結構和功能預測。

蛋白質模型

Wav2vec2 Nsc Final 1 Google Colab

基於wav2vec2架構的語音處理模型，訓練細節未完全公開

Assignment1 Omar

Wav2Vec2是一個基於自監督學習的語音識別模型，在LibriSpeech 960小時語音數據上預訓練和微調，支持英語語音轉錄。

Transformers 英語

Classroom-workshop

Response Quality Classifier Large

該模型用於評估對話中最後一條消息的相關性和具體性，基於sberbank-ai/ruRoberta-large架構。

Transformers 其他

Viwav2vec2 Base 1.5k

該模型通過1.5千小時越南語語音數據預訓練得到，適用於越南語語音識別任務，需微調後使用。

Transformers 其他

T5版本1.1是谷歌改進的文本到文本轉換模型，採用GEGLU激活函數，僅在C4數據集上進行無監督預訓練，需微調後使用。

大型語言模型英語

mT5是谷歌推出的多語言文本到文本轉換模型，支持101種語言，基於mC4數據集預訓練。

大型語言模型支持多種語言

Wav2vec2 Large 100k Voxpopuli

基於VoxPopuli語料庫10萬條無標註數據預訓練的語音識別模型，支持多語言語音表徵學習

語音識別其他

Wav2vec2 Large Es Voxpopuli

基於VoxPopuli語料庫西班牙語子集訓練的大型語音預訓練模型，適用於西班牙語語音識別任務

語音識別西班牙語

Wav2vec2 Large It Voxpopuli

基於VoxPopuli意大利語無標註數據預訓練的語音識別模型，採用Facebook的Wav2Vec2架構

語音識別其他

Wav2vec2 Base Bg Voxpopuli V2

基於Facebook Wav2Vec2架構的語音模型，專門針對保加利亞語進行預訓練，適用於語音識別任務。

Transformers 其他

Wav2vec2 Base Lt Voxpopuli V2

這是一個基於Facebook Wav2Vec2架構的語音模型，專門針對立陶宛語進行了預訓練，使用了VoxPopuli語料庫中的14.4k未標記數據。

Transformers 其他

Wav2vec2 Large Nl Voxpopuli

基於VoxPopuli語料庫荷蘭語子集預訓練的自動語音識別模型

語音識別其他

T5 Large Lm Adapt

T5版本1.1的LM適配版是基於T5架構改進的文本生成模型，通過語言建模目標額外訓練，提升了提示調優能力。

大型語言模型

Transformers 英語

mT5是谷歌推出的多語言文本到文本轉換模型，支持101種語言，基於mC4數據集預訓練，適用於多種NLP任務。

大型語言模型

Transformers 支持多種語言

Wav2vec2 Base Et Voxpopuli V2

基於Facebook Wav2Vec2框架的語音模型，專門針對愛沙尼亞語進行預訓練

Transformers 其他

Wav2vec2 Base Sv Voxpopuli

基於VoxPopuli語料庫瑞典語子集預訓練的Wav2Vec2基礎模型，適用於瑞典語語音識別任務。

Transformers 其他

Wav2vec2 Base Pt Voxpopuli V2

基於葡萄牙語VoxPopuli語料庫預訓練的Wav2Vec2基礎模型，適用於語音識別任務

Transformers 其他

Wav2vec2 Large Fr Voxpopuli

基於VoxPopuli法語語料庫預訓練的大型語音識別模型，支持法語語音轉文本任務

語音識別法語

Wav2vec2 Large Mt Voxpopuli V2

Facebook的Wav2Vec2大型模型，僅在馬耳他語（mt）上使用VoxPopuli語料庫的未標記數據進行預訓練，適用於語音識別任務。

Transformers 其他

Wav2vec2 Base Lv Voxpopuli V2

基於Facebook Wav2Vec2架構的語音識別基礎模型，專門針對拉脫維亞語（lv）進行預訓練，使用VoxPopuli語料庫的13.1k未標註數據。

Transformers 其他

T5 1.1是谷歌改進的文本到文本轉換Transformer模型，採用GEGLU激活函數和優化架構，僅使用C4數據集進行無監督預訓練

大型語言模型

Transformers 英語

Wav2vec2 Base Es Voxpopuli V2

Wav2Vec2基礎模型，僅在西班牙語的21.4k無標註數據上預訓練，適用於語音識別任務。

Transformers 西班牙語

Wav2vec2 Large Romance Voxpopuli V2

Facebook的Wav2Vec2大型模型，僅在羅曼語族的VoxPopuli語料庫101.5小時未標註數據上進行預訓練，適用於語音識別任務。

Wav2vec2 Large El Voxpopuli V2

基於VoxPopuli語料庫預訓練的希臘語語音識別模型，使用17.7小時未標註數據

Transformers 其他

Wav2vec2 Base Fi Voxpopuli V2

基於Facebook Wav2Vec2架構的語音模型，專門針對芬蘭語進行預訓練，適用於語音識別任務。

Transformers 其他

Wav2vec2 Base Sl Voxpopuli V2

這是一個基於Facebook Wav2Vec2架構的語音模型，專門針對斯洛文尼亞語(sl)進行預訓練，使用了VoxPopuli語料庫中的11.3k未標註數據。

Transformers 其他

Wav2vec2 Base 10k Voxpopuli

基於VoxPopuli語料庫1萬條未標註數據預訓練的語音識別基礎模型，支持多語言語音處理

Transformers 其他

T5 1.1是谷歌改進的文本到文本轉換模型，採用GEGLU激活函數和優化架構，專注於無監督預訓練

大型語言模型英語

Wav2vec2 Base It Voxpopuli

基於VoxPopuli意大利語無標註數據預訓練的Wav2Vec2基礎模型，適用於語音識別任務。

Transformers 其他

Wav2vec2 Base Nl Voxpopuli

基於VoxPopuli語料庫荷蘭語子集預訓練的Wav2Vec2基礎模型，適用於荷蘭語語音識別任務。

Transformers 其他

Wav2vec2 Base Fr Voxpopuli

基於VoxPopuli法語無標註數據預訓練的Wav2Vec2基礎模型，適用於法語語音識別任務

Transformers 法語

Wav2vec2 Large West Germanic Voxpopuli V2

Facebook的Wav2Vec2大型模型，僅在西日耳曼語系的VoxPopuli語料庫66.3無標註數據上進行預訓練。

Wav2vec2 Base Es Voxpopuli

基於VoxPopuli西班牙語無標註數據預訓練的Wav2Vec2語音識別基礎模型

Transformers 西班牙語

Wav2vec2 Base De Voxpopuli V2

基於Facebook Wav2Vec2架構的德語語音預訓練模型，使用VoxPopuli語料庫中的23.2k未標註德語數據進行預訓練。

Transformers 德語

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase