Thinkygemma 4b
Google Gemma-3-4b-ptを微調整した疑似推理専門家モデル、構造化推論/疑似誘導推論専用に設計
大規模言語モデル
Transformers

T
xsanskarx
19
1
Wiroai Finance Qwen 1.5B
Apache-2.0
Qwenアーキテクチャを基にした金融分野専用言語モデル、50万以上の金融命令でファインチューニング済み
大規模言語モデル
Transformers

W
WiroAI
886
16
Llama3.1 1B Neo BAAI 1000k
Apache-2.0
Llama3.1-Neo-1B-100wは、Meta-Llama-3.1-8B-Instructを1.4Bパラメータ規模にプルーニングし、LLM-Neoメソッド(LoRAと知識蒸留を組み合わせた)でファインチューニングした効率的な言語モデルです。トレーニングデータはBAAI/Infinity-Instructの100万行からサンプリングされています。
大規模言語モデル
Transformers

L
yang31210999
39
2
Llama 3 Gutenberg 8B
その他
Llama-3-8bベースのファインチューニングモデルで、Gutenberg DPOデータセットを使用して最適化されており、テキスト生成タスクに適しています。
大規模言語モデル
Transformers

L
nbeerbower
18
9
Indic Gemma 2b Finetuned Sft Navarasa 2.0
その他
Gemma-2bをファインチューニングした多言語命令モデルで、15のインド言語と英語をサポート
大規模言語モデル
Transformers 複数言語対応

I
Telugu-LLM-Labs
166
24
Indic Gemma 7b Finetuned Sft Navarasa 2.0
その他
Gemma-7bモデルをベースに、15のインド言語と英語の命令データセットでLoRAファインチューニングを行った多言語テキスト生成モデル
大規模言語モデル
Transformers 複数言語対応

I
Telugu-LLM-Labs
400
19
Gemma2b Turkish Instruction
Gemma-2bモデルを基にトルコ語命令-応答ペア向けにファインチューニングしたテキスト生成モデルで、約75kのトレーニングデータ規模をサポート
大規模言語モデル
Transformers その他

G
erythropygia
136
2
Zhilu 13B Instruct
Apache-2.0
ZhiLuは中国語Alpaca2-13Bを基に二次開発された金融大規模言語モデルで、膨大な中英語コーパスの増分事前学習と高品質な指示データの整合により能力が飛躍的に向上し、金融分野の専門的なパフォーマンスが重点的に強化されています。
大規模言語モデル
Transformers

Z
SYSU-MUCFC-FinTech-Research-Center
26
3
Camel Platypus2 70B
Camel-Platypus2-70B は Platypus2-70B と qCammel-70-x を統合した大規模言語モデルで、LLaMA 2 アーキテクチャに基づき、STEM と論理的推論タスクに特化しています。
大規模言語モデル
Transformers 英語

C
garage-bAInd
114
15
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98