muril-adapted-local開源模型 - 支持17種印度語言多語言表示的免費工具

首頁

Muril Adapted Local

由monsoon-nlp開發

MuRIL是谷歌開源的基於17種印度語言及其轉寫版本預訓練的BERT模型，支持多語言表示。

大型語言模型支持多種語言開源協議:Apache-2.0 #印度多語言處理 #全詞掩碼預訓練 #17種語言支持

下載量 24

發布時間 : 3/2/2022

模型概述

該模型通過自監督的掩碼語言建模任務進行訓練，採用全詞掩碼策略，最多預測80個詞。適用於處理多種印度語言的文本任務。

模型特點

多語言支持

支持17種印度語言及其轉寫版本，覆蓋廣泛的語言需求。

全詞掩碼策略

採用全詞掩碼策略進行訓練，最多預測80個詞，提升模型理解能力。

高兼容性

轉換為PyTorch格式，確保與HuggingFace Transformers庫兼容。

模型能力

文本理解

多語言文本處理

掩碼語言建模

使用案例

自然語言處理

多語言文本分類

對印度多種語言的文本進行分類任務。

語言翻譯輔助

作為翻譯模型的預訓練基礎，提升翻譯質量。

屬性	詳情
模型類型	BERT預訓練模型
訓練任務	自監督掩碼語言建模
掩碼策略	全詞掩碼，最多80次預測
訓練步數	1000K步
批次大小	4096
最大序列長度	512

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Muril Adapted Local

模型概述

模型特點

模型能力

使用案例

🚀 MuRIL - 非官方版本

🚀 快速開始

✨ 主要特性

📚 詳細文檔

📄 許可證

🔧 技術細節