モデル選定

効率的な微調整

# 効率的な微調整

Turn Detection Cocalai Vllm

このモデルはQwen3-0.6Bを微調整した対話ターン検出モデルで、UnslothとHuggingface TRLライブラリを使用してトレーニングを加速し、対話ターン検出タスクで96.22%の正解率を達成しました。

大規模言語モデル

Transformers 英語

Sarvam Finetune

これはHub上に公開されたtransformersモデルで、具体的な機能と詳細情報は補充待ちです。

大規模言語モデル

Unlearn Tofu Llama 3.2 1B Instruct Forget10 SimNPO Lr1e 05 B4.5 A1 D0 G0.25 Ep5

これはHugging Face Hubにアップロードされたtransformersモデルで、具体的な情報は後で補足されます。

大規模言語モデル

open-unlearning

Seed Coder Triton 8b V1

ByteDance - Seed/Seed - Coder - 8B - Baseモデルを特定のデータセットで微調整した大規模言語モデルで、長シーケンス入力と効率的なトレーニング戦略をサポートします。

大規模言語モデル

Qwen3 1.7B GGUF

Qwen3-1.7BはQwenシリーズ最新世代の1.7Bパラメータ規模の大規模言語モデルで、思考モードと非思考モードの切り替えをサポートし、強化された推論能力と多言語サポートを備えています。

大規模言語モデル英語

Qwen3 0.6B Unsloth Bnb 4bit

Qwen3はQwenシリーズの最新世代の大規模言語モデルで、包括的な密モデルと混合専門家（MoE）モデルを提供します。広範なトレーニングに基づき、Qwen3は推論、指示追従、エージェント能力、多言語サポートにおいて画期的な進歩を実現しました。

大規模言語モデル

Transformers 英語

Deepseek V3 5layer

DeepSeek-V3の5層簡易開発バージョン、軽量タスクと迅速な実験に適しています。

大規模言語モデル

Turkish Llama 3 8B Function Calling

このモデルはTurkish-Llama-8b-DPO-v0.1を調整したもので、トルコ語の機能呼び出しタスク専用です。

大規模言語モデル

Transformers 複数言語対応

Reranker Bert Tiny Gooaq Bce

これはbert-tinyから微調整されたクロスエンコーダモデルで、テキストペアの類似度スコアを計算するために使用され、意味的テキスト類似度、意味的検索などのさまざまなタスクに適しています。

テキスト埋め込み英語

cross-encoder-testing

Yulan Mini Instruct

YuLan-Mini-Instructは24億パラメータのコンパクトながら強力なテキスト生成モデルで、数学とコード推論タスクに特化しており、中英語をサポートしています。

大規模言語モデル

Transformers 複数言語対応

Deepseek R1 Distill Qwen 14B Uncensored

transformersライブラリに基づく蒸留モデルで、DeepSeek-AIによって開発され、Qwen-14Bモデルを基に知識蒸留を行って得られたものです。

大規模言語モデル

Smolmaestra 1.7b Translation

SmolMaestraは軽量級の翻訳モデルで、英語とイタリア語の間のテキスト翻訳に特化しており、効率的に直接翻訳結果を出力することができます。

Transformers 複数言語対応

Llama3.1 8b Instruct Summarize Q4 K M

Meta-Llama-3.1-8B-Instructを基にした4ビット量子化バージョンで、UnslothとHuggingface TRLライブラリを使用して訓練され、速度が2倍向上しました。

大規模言語モデル英語

Llama 3 SauerkrautLM 8b Instruct

Llama-3-SauerkrautLM-8b-Instructは、VAGO SolutionsとHyperspace.aiが共同で開発した、Meta-Llama-3-8B-Instructをベースに改良したバージョンで、DPOアライメントによる最適化を行い、ドイツ語と英語をサポートしています。

大規模言語モデル

Transformers 複数言語対応

EEVE Korean 10.8B V1.0

SOLAR-10.7B-v1.0を基に拡張した韓国語大規模言語モデルで、語彙拡張とパラメータ凍結訓練により韓国語理解能力を最適化

大規模言語モデル

Collectivecognition V1.1 Mistral 7B

Mistral-7Bを基に微調整した効率的な対話モデルで、TruthfulQAベンチマークで優れた性能を発揮

大規模言語モデル

Transformers 英語

En2ko Hiphop Small 100

SMaLL-100を微調整した英語から韓国語への翻訳モデルで、ヒップホップ音楽分野に特化

Transformers 複数言語対応

OpenChatは一連のオープンソース言語モデルで、多様で高品質な多輪対話データセットで微調整され、限られたデータで高性能を実現することを目的としています。

大規模言語モデル

Transformers 英語

Manticore 13b Chat Pyg Guanaco

TimDettmersのGuanaco 13b qLoRa技術に基づいて開発されたチャットモデルで、対話生成タスクに適しています。

大規模言語モデル

Distilroberta Base

DistilRoBERTaはRoBERTaモデルの軽量級蒸留バージョンで、大部分の性能を維持しながら、サイズが小さく、速度が速い。

大規模言語モデル

Transformers 英語

Bart Large Samsum

BART-largeアーキテクチャに基づいて微調整された対話要約生成モデルで、SAMSumデータセットでトレーニングされ、対話テキストの要約に特化して最適化されています。

テキスト生成

Transformers 英語

Distilbart Mnli 12 9

DistilBart - MNLIは、教師なし蒸留技術を用いてbart - large - mnliから蒸留された軽量版で、高い精度を維持しながらモデルの複雑さを減らしています。

テキスト分類

google/mt5-baseをベースにしたコンパクト版で、ロシア語と英語用に最適化され、パラメータ数が58％削減されています。

大規模言語モデル複数言語対応

Bioformer 8L Mnli

Bioformerは生物医学分野向けに最適化されたTransformerモデルで、MNLIデータセットで微調整後、優れた性能を発揮します。

テキスト分類

Distilbert Base Uncased Finetuned Mi

このモデルはdistilbert-base-uncasedを未知のデータセットで微調整したバージョンで、主にテキスト関連のタスクに使用されます。

大規模言語モデル

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase