MiniThinky-v2-1B-Llama-3.2オープンソースAIアシスタントモデル - 思考プロセスを無料でデプロイして表示し、質問に解答する

ホーム

Minithinky V2 1B Llama 3.2

ngxsonによって開発

MiniThinky 1BはLlama-3.2-1B-InstructをファインチューニングしたAIアシスタントモデルで、回答前に思考プロセスを表示する特徴があります

大規模言語モデル

Transformers

#思考連鎖推論 #Llama3ファインチューニング #システムメッセージへの敏感さ

ダウンロード数 260

リリース時間 : 1/8/2025

モデル概要

これは1Bパラメータ規模の言語モデルで、回答前に思考プロセスを表示するように特別に設計されています。Llama 3と同じチャットテンプレートを使用していますが、思考ステップのマーカー出力が追加されています。

モデル特徴

思考プロセスの可視化

最終的な回答を生成する前に<|thinking|>マーカーで思考プロセスを出力します

システムメッセージへの敏感さ

システムメッセージに非常に敏感で、最適なパフォーマンスを得るには特定の形式のシステムプロンプトが必要です

改良版

v2バージョンはv1と比べて損失値が0.7から0.5に低下し、トレーニング時間が6時間増加しました

モデル能力

対話生成

質問回答

思考プロセス表示

使用事例

AIアシスタント

インテリジェントQA

インテリジェントアシスタントとしてユーザーの質問に答えます

まず思考プロセスを表示してから回答を提供します

属性	详情
ライブラリ名	transformers
タグ	trl、sft
ベースモデル	meta-llama/Llama-3.2-1B-Instruct
学習データセット	ngxson/MiniThinky-dataset

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Minithinky V2 1B Llama 3.2

モデル概要

モデル特徴

モデル能力

使用事例

🚀 MiniThinky 1B

🚀 クイックスタート

重要なシステムメッセージ

📚 ドキュメント

Q&A

今後の予定

情報一覧