SRoBERTa - Fオープンソースモデル - 大量のクセ語データセットに基づき、マスク言語モデルタスクをサポート

ホーム

Sroberta F

Andrijaによって開発

43GBのクロアチア語とセルビア語データセットで訓練されたRoBERTaモデルで、マスク言語モデルタスクをサポートします。

大規模言語モデル

Transformers

その他オープンソースライセンス:Apache-2.0 #クロアチア語-セルビア語バイリンガル #マスク言語モデリング #低パープレキシティ最適化

ダウンロード数 51

リリース時間 : 3/2/2022

モデル概要

これはクロアチア語とセルビア語に最適化されたRoBERTaモデルで、自然言語処理タスク、特にマスク言語モデルタスクに主に使用されます。

モデル特徴

多様な訓練データ

Leipzig、OSCAR、srWac、hrWac、cc100-hr、cc100-srなどの高品質データセットを統合し、合計43GBのテキストデータを使用しています。

継続的な訓練可能性

訓練プロセスに停滞が見られず、さらなる最適化の余地があります。

バイリンガルサポート

クロアチア語とセルビア語に特化して最適化訓練されています。

モデル能力

テキスト理解

言語モデリング

文脈予測

使用事例

自然言語処理

テキスト補完

マスクされた単語を予測

例：'Ovo je početak <mask>.' で文を補完可能

言語モデルのファインチューニング

下流NLPタスクのベースモデルとして使用

プロパティ	詳細
モデルタイプ	`Andrija/SRoBERTa-F`
パラメータ数	80M
アーキテクチャ	Fifth
学習データ	Leipzig Corpus, OSCAR, srWac, hrWac, cc100-hr and cc100-sr (43 GBのテキスト)

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Sroberta F

モデル概要

モデル特徴

モデル能力

使用事例

🚀 Transformer言語モデル（クロアチア語とセルビア語用）

🚀 クイックスタート

✨ 主な機能

📦 インストール

💻 使用例

基本的な使用法

📚 ドキュメント

データセット

言語

タグ

ウィジェット

モデル評価

考察

モデル情報

📄 ライセンス