Legion V2.2 LLaMa 70B
DARE TIES メソッドを使用してマージされた事前学習済み言語モデル、L-BASE-V1をベースに複数のMERGEモデルを融合
大規模言語モデル
Transformers

L
TareksTesting
24
2
Llama3 8b Spaetzle V20
llama3-8b-spaetzle-v20はllama3-8b-spaetzle-v13とllama-3-wissenschaft-8B-v2をマージしたモデルで、英語とドイツ語をサポートし、EQ-Bench v2_deで良好なパフォーマンスを示します。
大規模言語モデル
Transformers 複数言語対応

L
cstr
18
1
Flashbackmist Dare
Apache-2.0
test-dareはMistral-7Bをベースにしたマージモデルで、DAREメソッドにより複数のMistral-7Bバリアントを統合し、各モデルの強みを組み合わせています。
大規模言語モデル
Transformers

F
FredrikBL
71
1
Strangemerges 17 7B Dare Ties
Apache-2.0
StrangeMerges_17-7B-dare_tiesは、LazyMergekitを使用してGille/StrangeMerges_16-7B-slerpとGille/StrangeMerges_12-7B-slerpの2つのモデルをdare_tiesマージ手法で統合したものです。
大規模言語モデル
Transformers

S
Gille
20
1
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98