Cantonesellmchat V1.0 32B
C
Cantonesellmchat V1.0 32B
hon9kon9izeによって開発
Cantonese LLM Chat v1.0はhon9kon9izeチームが開発した第一世代の広東語大規模言語モデルで、香港関連の専門知識と広東語会話において優れた性能を発揮します。
ダウンロード数 117
リリース時間 : 3/22/2025
モデル概要
Qwen 2.5 32Bを基に継続的プレトレーニングを行って得られた広東語大規模言語モデルで、香港文化と広東語会話理解に特化しています。
モデル特徴
広東語最適化
広東語会話に特化して最適化されており、流暢な広東語コミュニケーションが可能
香港文化理解
香港のローカル文化と知識について深い理解を持つ
大規模トレーニング
6億件の香港ニュース記事と広東語ウェブサイトデータを使用してトレーニング
高品質インストラクションデータ
75,000件の精選されたインストラクションペアでファインチューニング
モデル能力
広東語会話生成
香港文化質問応答
広東語テキスト理解
マルチターン会話
使用事例
対話システム
広東語チャットボット
広東語で自然な会話が可能なチャットボットを構築
HK-Evalベンチマークで優れた性能を発揮
文化教育
香港文化質問応答
香港の歴史、文化、社会に関する様々な質問に回答
香港文化理解タスクで同類モデルを上回る性能
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98