Decilm 6b Instruct
DeciLM 6B-指示モデルは、短い形式の指示追従に特化した英語言語モデルで、DeciLM 6BをLoRAファインチューニング技術でトレーニングしたものです
ダウンロード数 105
リリース時間 : 9/13/2023
モデル概要
DeciLM 6Bを最適化した指示追従モデルで、英語圏のビジネスや研究用途に適しており、他の言語環境にもファインチューニングで対応可能
モデル特徴
効率的な推論
可変グループクエリ注意メカニズムを採用し、推論効率を大幅に向上
指示最適化
短い形式の指示追従シナリオに特化し、OpenOrcaデータセットでファインチューニング
高性能
ARCチャレンジ(44.43)、HellaSwag(74.57)など、複数のベンチマークテストで優れた成績
モデル能力
英語テキスト生成
指示理解と実行
質問応答システム
知識推論
使用事例
ビジネスアプリケーション
カスタマーサポートアシスタント
自動化されたカスタマーサポートシステム構築に使用、よくある質問への対応
教育研究
教育補助
教材やステップバイステップの指導説明を生成
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98