Deepseek R1T Chimera
MIT
DeepSeek-R1T-Chimeraは、DeepSeek-R1の知能とDeepSeek-V3のトークン効率を組み合わせたオープンソースの重み付けモデルです。
大規模言語モデル
Transformers

D
tngtech
491
158
Multi2convai Quality En Bert
MIT
これはBERTアーキテクチャに基づき、英語品質分野のテキスト分類タスク向けにファインチューニングされたモデルで、Multi2ConvAIプロジェクトの一部です。
テキスト分類
Transformers 英語

M
inovex
116
0
PEG
PEGは段階的学習によってロバストなテキスト検索を実現するモデルで、負例の難易度レベルに基づいて損失の重みを調整します。
テキスト埋め込み
Transformers 中国語

P
TownsWu
36
29
Modernbert Base Tr Uncased
MIT
ModernBERTアーキテクチャに基づくトルコ語事前学習モデル、8192トークンのコンテキスト長をサポート、複数分野で優れた性能
大規模言語モデル
Transformers その他

M
artiwise-ai
159
9
Whisper Small Turkish 0
Apache-2.0
OpenAI Whisper-smallをファインチューニングしたトルコ語音声認識モデル
音声認識
Transformers その他

W
ysdede
14
1
Deepseek Ai.deepseek R1 Distill Llama 8B GGUF
DeepSeek-R1-Distill-Llama-8B は、Llama アーキテクチャに基づく 8B パラメータ規模の大規模言語モデルで、蒸留トレーニングによって最適化され、テキスト生成タスクに適しています。
大規模言語モデル
D
DevQuasar
320
3
German RAG WHISPER LARGE V3 TURBO HESSIAN AI
MIT
Whisper Large v3 Turboを基に最適化されたドイツ語音声認識モデル。13時間の精選データセットで微調整され、ドイツ語認識精度が大幅に向上
音声認識
Transformers ドイツ語

G
avemio
282
1
Exaone3 Instructrans V2 Enko 7.8b
exaone-3-7.8B-itで訓練された英韓翻訳モデルで、命令データセットの翻訳タスクに特化
機械翻訳
Transformers 複数言語対応

E
Translation-EnKo
45
7
Swahili English Translation
MIT
スワヒリ語と英語の双方向翻訳のために開発されたTransformerモデルで、21万の言語ペアで微調整されています
機械翻訳
Transformers

S
Bildad
98
2
Faster Whisper Large V3 Ru Podlodka
Apache-2.0
これは bond005/whisper-large-v3-ru-podlodka の ctranslate2 変換バージョンで、ロシア語音声認識タスク向けに最適化されています。
音声認識
Transformers その他

F
bzikst
23
1
Phi 3 HornyVision 128k Instruct
MIT
MITライセンスに基づくオープンソースモデル、具体的な機能は実際のモデルによって決定されます
大規模言語モデル
Transformers

P
Desm0nt
31
27
Turkish Llama 8b V0.1 GGUF
Turkish-Llama-8b-v0.1はLLaMA-3 8Bモデルを完全にファインチューニングしたトルコ語テキスト生成モデルで、30GBのトルコ語データセットで訓練されています。
大規模言語モデル その他
T
LiteLLMs
108
2
Sage V1.1.0
MIT
FRED-T5-1.7Bで訓練されたロシア語スペルチェックモデルで、スペル、句読点、大文字小文字の誤りを修正可能
テキスト生成
Transformers その他

S
ai-forever
668
6
Chocollama 2 7B Base
Meta Llama-2-7bをベースにオランダ語適応したバージョンで、LoRa技術を使用して32Bのオランダ語Llama-2トークンで微調整された基本モデル
大規模言語モデル
Transformers その他

C
ChocoLlama
26
2
Sage Fredt5 Distilled 95m
MIT
FRED-T5-1.7Bアーキテクチャに基づく蒸留モデルで、ロシア語のスペル、句読点、大文字小文字の誤りを自動修正
テキスト生成
Transformers その他

S
ai-forever
1,553
14
Tinyllama V1.1 Math Code
Apache-2.0
TinyLlamaは11億パラメータのコンパクトな言語モデルで、Llama 2と同じアーキテクチャとトークナイザーを採用しており、計算リソースやメモリが限られたアプリケーションシナリオに適しています。
大規模言語モデル
Transformers 英語

T
TinyLlama
3,436
11
Tinyllama V1.1
Apache-2.0
TinyLlamaは11億パラメータの小型言語モデルで、Llama 2と同じアーキテクチャとトークナイザーを採用しており、リソースが限られたアプリケーションシナリオに適しています。
大規模言語モデル
Transformers 英語

T
TinyLlama
42.11k
92
Parakeet Tdt 1.1b
Parakeet TDT 1.1BはNVIDIA NeMoとSuno.aiが共同開発した自動音声認識(ASR)モデルで、音声を小文字の英字に文字起こしできます。
音声認識 英語
P
nvidia
12.27k
90
SFR Embedding Mistral
Salesforce Researchによって開発されたテキスト埋め込みモデルで、E5-mistral-7b-instructとMistral-7B-v0.1を基に訓練されており、主にテキスト検索タスクに使用されます。
テキスト埋め込み
Transformers 英語

S
Salesforce
34.75k
277
Bce Reranker Base V1
Apache-2.0
RAG最適化のための二言語・多言語再ランキングモデル、中日英韓4言語対応、説明可能な絶対スコアを提供
テキスト埋め込み
Transformers 複数言語対応

B
maidalun1020
68.29k
190
Parakeet Ctc 0.6b
Parakeet CTC 0.6BはNVIDIA NeMoとSuno.aiが共同開発した自動音声認識モデルで、FastConformerアーキテクチャに基づき、約6億のパラメータを持ち、英語音声の書き起こしをサポートします。
音声認識 英語
P
nvidia
6,528
13
Parakeet Rnnt 0.6b
Parakeet RNNT 0.6B は、NVIDIA NeMo と Suno.ai が共同開発した自動音声認識モデルで、FastConformer アーキテクチャを基にし、約6億のパラメータを持ち、英語音声をテキストに転写するために特別に設計されています。
音声認識 英語
P
nvidia
92.27k
8
Parakeet Rnnt 1.1b
Parakeet RNNT 1.1BはNVIDIA NeMoとSuno.aiが共同開発した自動音声認識モデルで、FastConformer Transducerアーキテクチャに基づき、約11億のパラメータを持ち、英語音声の書き起こしをサポートします。
音声認識 英語
P
nvidia
13.18k
124
Belle Whisper Large V2 Zh
Apache-2.0
whisper-large-v2を微調整した中国語音声認識モデルで、複数の中国語音声認識ベンチマークテストにおいて30-70%の相対的性能向上を実現しました。
音声認識
Transformers

B
BELLE-2
140
33
Robbert 2023 Dutch Large
MIT
RobBERT-2023はRoBERTaアーキテクチャに基づくオランダ語言語モデルで、ルーヴェン大学、ゲント大学、ベルリン工科大学によって開発され、オランダ語の最先端言語モデルの一つです。
大規模言語モデル
Transformers その他

R
DTAI-KULeuven
627
20
Sheared LLaMA 2.7B
Apache-2.0
Sheared-LLaMA-2.7BはLlama-2-7bを剪枝と継続事前学習によって得られた軽量言語モデルで、わずか50Bトークンの予算で作成されました。
大規模言語モデル
Transformers

S
princeton-nlp
1,131
60
Stt En Fastconformer Transducer Xlarge
NVIDIA FastConformer-Transducerは、英語の自動音声認識(ASR)向けの高性能モデルで、最適化されたFastConformerアーキテクチャとTransducerデコーダを採用し、パラメータ規模は約6.18億です。
音声認識 英語
S
nvidia
106
24
Stt En Fastconformer Ctc Xlarge
NVIDIA FastConformer-CTC XLargeは約6億パラメータの自動音声認識(ASR)モデルで、英語音声の文字起こしのために設計され、FastConformerアーキテクチャとCTC損失でトレーニングされています。
音声認識 英語
S
nvidia
216
2
Stt En Fastconformer Ctc Large
これはFastConformerアーキテクチャに基づく大規模な自動音声認識(ASR)モデルで、英語音声をテキストに転写するために特別に設計されています。
音声認識 英語
S
nvidia
1,001
12
Stt En Fastconformer Transducer Large
これはFastConformerアーキテクチャに基づく大規模な自動音声認識(ASR)モデルで、英語音声をテキストに転写するために特別に設計されています。
音声認識 英語
S
nvidia
1,398
7
Pegasus X Sumstew
Apache-2.0
Pegasus-x-largeをファインチューニングした英語長文要約モデルで、学術原稿や会議記録などの複雑なテキストの抽象的要約生成をサポート
テキスト生成
Transformers 英語

P
Joemgu
31
1
Long Ke T5 Base Translation Aihub En2ko
Apache-2.0
KETI-AIR/long-ke-t5-baseをファインチューニングした英語から韓国語への翻訳モデルで、複数のAI Hubデータセットでトレーニングされ、BLEUスコアは42.463を達成しました。
機械翻訳
Transformers 複数言語対応

L
KETI-AIR-Downstream
35
3
Wav2vec2 Xls R Parlaspeech Hr Lm
facebook/wav2vec2-xls-r-300mモデルを微調整したクロアチア語自動音声認識モデルで、ParlaSpeech-HR v1.0データセットで訓練
音声認識
Transformers その他

W
classla
18
0
Opus Mt Tc Big Hu En
これはハンガリー語から英語へのニューラル機械翻訳モデルで、OPUS-MTプロジェクトの一部です。
機械翻訳
Transformers 複数言語対応

O
Helsinki-NLP
371
3
Opus Mt Tc Big Fr En
OPUS-MTプロジェクトのフランス語から英語へのニューラル機械翻訳モデル、transformer-bigアーキテクチャを基にし、SentencePieceトークン化を使用
機械翻訳
Transformers 複数言語対応

O
Helsinki-NLP
30.05k
2
Aragpt2 Base
AraGPT2はTransformerアーキテクチャに基づくアラビア語生成の事前学習モデルで、AUB MIND研究所によって開発され、さまざまなサイズのモデルバリアントをサポートしています。
大規模言語モデル アラビア語
A
aubmindlab
21.26k
25
Plt5 Large
plT5はT5アーキテクチャに基づき、ポーランド語コーパス向けに訓練された言語モデルで、元のT5のノイズ除去タスクに最適化されています。
大規模言語モデル
Transformers その他

P
allegro
1,366
5
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98