T

TC Instruct DPO

tanamettpkによって開発
台風7Bを微調整したタイ語命令最適化モデルで、直接選好最適化(DPO)技術を用いてトレーニング
ダウンロード数 28
リリース時間 : 2/17/2024

モデル概要

このモデルはSCB 10Xの台風7B(ミストラル7B由来)を微調整したタイ語命令最適化モデルで、大規模言語モデルの構築プロセス研究のために開発されました。QLoRA技術を用いてトレーニングされ、様々なタイ語命令タスクをサポートします。

モデル特徴

タイ語命令最適化
タイ語命令に特化して最適化され、命令の多様性を確保
直接選好最適化(DPO)
直接選好最適化技術を用いてトレーニングされ、モデルの応答品質を向上
QLoRA効率的微調整
QLoRA技術(ランク32、α値64)を使用した効率的な微調整

モデル能力

タイ語テキスト生成
命令追従
質問応答システム

使用事例

研究応用
大規模言語モデル構築研究
タイ語大規模言語モデルの構築プロセスと技術の研究に使用
対話システム
タイ語チャットボット
タイ語対話システムの構築に利用可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase