bart_large_teaser_de_v2オープンソースドイツ语文本処理モデル - 多様な自然言語タスクに無料でデプロイ可能

ホーム

Bart Large Teaser De V2

bettertextappによって開発

BARTアーキテクチャに基づく大規模ドイツ語テキスト処理モデル、様々な自然言語処理タスクに適用可能

大規模言語モデル

Transformers

#ドイツ語テキスト生成 #マルチGPUトレーニング #高精度評価

ダウンロード数 123

リリース時間 : 4/25/2025

モデル概要

このモデルはBARTアーキテクチャでトレーニングされた大規模ドイツ語言語モデルで、テキスト生成や要約などのタスクに使用される可能性があります。モデルの具体的なトレーニング詳細と用途はまだ明確ではありません。

モデル特徴

マルチGPUトレーニング

モデルは4つのGPUを使用した分散トレーニングを行い、トレーニング効率を向上させました

最適化されたトレーニングパラメータ

Adamオプティマイザーと線形学習率スケジューラーを採用し、トレーニングバッチサイズは64です

ドイツ語サポート

ドイツ語テキスト処理に特化して最適化されたモデル

モデル能力

テキスト生成

テキスト要約

ドイツ語テキスト処理

使用事例

テキスト処理

ドイツ語テキスト要約

ドイツ語テキストの簡潔な要約を生成

ドイツ語テキスト生成

入力に基づいて一貫性のあるドイツ語テキストを生成

属性	详情
モデルタイプ	bart_large_teaser_de_v2
トレーニングデータ	不明なデータセット

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Bart Large Teaser De V2

モデル概要

モデル特徴

モデル能力

使用事例

🚀 bart_large_teaser_de_v2

📚 ドキュメント

モデルの説明

想定される用途と制限

トレーニングと評価データ

トレーニング手順

トレーニングハイパーパラメータ

フレームワークのバージョン

モデル情報