phi-2-sft-ultrachat-fullオープンソース大規模言語モデル - 無料でのデプロイで会話生成をサポート

ホーム

Phi 2 Sft Ultrachat Full

lole25によって開発

microsoft/phi-2をultrachat_200kデータセットでファインチューニングした大規模言語モデルで、対話生成タスクに適しています。

大規模言語モデル

Transformers

その他オープンソースライセンス:MIT #対話ファインチューニング #小パラメータ高効率 #マルチターン対話最適化

ダウンロード数 68

リリース時間 : 3/7/2024

モデル概要

このモデルはmicrosoft/phi-2をHuggingFaceH4/ultrachat_200kデータセットで教師ありファインチューニング(SFT)したバージョンで、主に対話生成タスクに使用されます。

モデル特徴

教師ありファインチューニング

ultrachat_200kデータセットで教師ありファインチューニングを行い、対話生成能力を最適化

マルチGPUトレーニング

4つのGPUを使用した分散トレーニングにより、トレーニング効率を向上

最適化トレーニング

コサインアニーリング学習率スケジューリングとウォームアップ戦略を採用し、トレーニングプロセスを最適化

モデル能力

テキスト生成

対話システム

自然言語理解

使用事例

対話システム

インテリジェントチャットボット

インテリジェントチャットボットシステムの構築に使用可能

訓練損失	エポック	ステップ	検証損失
1.2491	1.0	3996	1.2346
1.1463	2.0	7993	1.1998
1.1623	3.0	11988	1.1928

属性	详情
ベースモデル	microsoft/phi-2
タグ	alignment-handbook, generated_from_trainer, trl, sft, generated_from_trainer
データセット	HuggingFaceH4/ultrachat_200k

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Phi 2 Sft Ultrachat Full

モデル概要

モデル特徴

モデル能力

使用事例

🚀 phi-2-sft-ultrachat-full

🚀 クイックスタート

📚 ドキュメント

モデルの説明

想定される用途と制限事項

訓練と評価データ

🔧 技術詳細

訓練ハイパーパラメータ

訓練結果

フレームワークバージョン

📄 ライセンス