fairseq-dense-6.7Bオープンソース言語モデル - テキスト処理などのシーンに無料で簡単に適用可能

Fairseq Dense 6.7B

KoboldAIによって開発

これは、Artetxeらの論文『Efficient Large Scale Language Modeling with Mixtures of Experts』におけるオリジナルの密集型67億パラメータモデルのHugging Face transformers適合バージョンです。

大規模言語モデル

Transformers

英語#大規模言語モデル #67億パラメータ #オープン評価基準

ダウンロード数 123

リリース時間 : 3/2/2022

モデル概要

67億パラメータ規模の大規模言語モデルで、Mixtures of Expertsアーキテクチャに基づいて効率的な大規模言語モデリングを実現します。

モデル特徴

大規模パラメータ

67億パラメータ規模を持ち、複雑な言語モデリングタスクを処理できます。

効率的なアーキテクチャ

Mixtures of Expertsアーキテクチャを採用し、効率的な大規模言語モデリングを実現します。

Hugging Face適合

Hugging Face transformersフレームワークに適合しており、使用が容易です。

モデル能力

テキスト生成

言語理解

コンテキスト学習

使用事例

自然言語処理

オープン大規模言語モデル評価

オープン大規模言語モデルランキングで総合評価を行います。

総合平均スコア36.09

指標	値
平均	36.09
ARC (25-shot)	39.42
HellaSwag (10-shot)	71.26
MMLU (5-shot)	26.91
TruthfulQA (0-shot)	32.73
Winogrande (5-shot)	65.27
GSM8K (5-shot)	0.0
DROP (3-shot)	17.05

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Fairseq Dense 6.7B

モデル概要

モデル特徴

モデル能力

使用事例

🚀 元の67億パラメータの密モデルのHugging Face Transformers互換変換

📚 ドキュメント

Open LLM Leaderboard評価結果