Slim Orpheus 3b JAPANESE Ft Q4 K M GGUF
Apache-2.0
これはslim-orpheus-3b-JAPANESE-ftモデルを変換したGGUF形式のモデルで、日本語テキスト処理に特化して最適化されています。
大規模言語モデル 日本語
S
Gapeleon
40
0
Slim Orpheus 3b JAPANESE Ft Q8 0 GGUF
Apache-2.0
これはslim-orpheus-3b-JAPANESE-ftモデルを変換したGGUF形式のモデルで、日本語テキスト処理に特化して最適化されています。
大規模言語モデル 日本語
S
Gapeleon
26
0
Diffllama 1B
Apache-2.0
DiffLlama-1Bは、ゼロから約1000億トークンを事前学習した約10億パラメータ規模の大規模言語モデルで、革新的な'差分Transformer'アーキテクチャの概念を採用しています。
大規模言語モデル 日本語
D
kajuma
202
2
Gemma 2 2b Jpn It
Gemma 2 JPNは日本語テキストでファインチューニングされたGemma 2 2Bモデルで、優れた日本語処理能力を持ち、様々なテキスト生成タスクに適しています。
大規模言語モデル
Transformers 日本語

G
google
7,510
183
Japanese TextGen MoE TEST 2x7B NSFW Gguf
これはMergekit - MoEテスト用に特別に設計されたテキスト生成モデルで、個人使用のみ許可されています。
大規模言語モデル 日本語
J
dddump
586
21
Japanese Gpt Neox 3.6b
MIT
36億パラメータを持つ日本語GPT-NeoXモデルで、Transformerアーキテクチャに基づき、3.125兆トークンの日本語コーパスで学習されています。
大規模言語モデル
Transformers 複数言語対応

J
rinna
34.74k
99
Bart Large Japanese
日本語ウィキペディアで事前学習された日本語BART大規模モデルで、テキスト生成や自然言語処理タスクに適しています。
大規模言語モデル
Transformers 日本語

B
ku-nlp
206
10
Bart Base Japanese
これは日本語ウィキペディアで事前学習された日本語BARTベースモデルで、自然言語処理タスクに適しています。
大規模言語モデル
Transformers 日本語

B
ku-nlp
181
10
Japanese Gpt Neox Small
MIT
GPT-NeoXアーキテクチャに基づく小型日本語言語モデルで、テキスト生成タスクをサポート
大規模言語モデル
Transformers 複数言語対応

J
rinna
838
15
Gpt2 Large Japanese
MIT
ABEJA社がトレーニングした日本語大規模GPT-2モデルで、日本語テキスト生成タスクをサポート
大規模言語モデル
Transformers 複数言語対応

G
abeja
960
18
Xlnet Japanese
Apache-2.0
これはXLNetアーキテクチャに基づく日本語言語モデルで、日本語テキスト生成タスクに最適化されています。
大規模言語モデル
Transformers 日本語

X
hajime9652
398
2
T5 Base Japanese
日本語コーパスを用いて事前学習されたT5(テキストからテキストへの変換Transformer)モデルで、様々なテキスト生成タスクに適しています。
大規模言語モデル 日本語
T
sonoisa
13.85k
49
Japanese Gpt2 Medium
MIT
rinna株式会社によってトレーニングされた中規模の日本語GPT-2モデルで、Transformerアーキテクチャに基づき、日本語テキスト生成タスクに適しています。
大規模言語モデル 複数言語対応
J
rinna
7,664
79
Japanese Gpt 1b
MIT
凛那株式会社が訓練した13億パラメータの日本語GPTモデルで、日本語テキスト生成タスクに特化
大規模言語モデル
Transformers 複数言語対応

J
rinna
2,763
101
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98