C

Cendol Llama2 7b Chat

indonlpによって開発
仙都(Cendol)は、インドネシア語に対して微調整されたオープンソースの生成型大規模言語モデルの集合で、さまざまなアーキテクチャとパラメータ規模をカバーしています。
ダウンロード数 1,749
リリース時間 : 12/25/2023

モデル概要

仙都(Cendol)は、インドネシア語に対して微調整されたオープンソースの生成型大規模言語モデルの集合で、デコーダのみとエンコーダ - デコーダの2種類のTransformerモデルアーキテクチャをカバーし、パラメータ規模は3億から130億までさまざまです。このモデルは70億パラメータの仙都(Cendol)LLaMA-2チャットモデルです。

モデル特徴

多アーキテクチャと多パラメータ規模
mT5とLLaMA-2の2種類の基礎モデルに基づき、さまざまなパラメータ規模のモデルを提供し、さまざまなシナリオのニーズを満たします。
命令調整バージョンが豊富
特定のタスクに対応したCendol - Instructと、一般的な知識と人間中心のプロンプトに基づいて継続的に調整されたCendol - Chatが含まれています。
卓越した性能
ほとんどのテストベンチマークで、オープンソースの多言語および特定地域の大規模言語モデルを大幅に上回り、小さなバージョン(パラメータが10億未満)も70億パラメータの他のモデルと匹敵します。
効率的な戦略
語彙置換戦略を提案し、LoRA調整と比較して、トレーニング時間と推論時間がそれぞれ11.50%と18.71%向上し、評価性能は元の語彙でトレーニングされたモデルと同等です。

モデル能力

インドネシア語テキスト生成
命令調整
単輪対話
自然言語理解
自然言語生成

使用事例

研究
インドネシア語自然言語処理研究
インドネシア語の自然言語処理タスク、例えばテキスト生成や命令理解などの研究に使用されます。
ほとんどのテストベンチマークで優れた結果を示し、他のオープンソースモデルを上回ります。
一般知識質問応答
インドネシア語一般知識質問応答
インドネシア語の一般知識に関する質問に答えるために使用されます。
人間による評価で良好な結果を示します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase