V

Vietnamese Llama2 7b 40GB

bkai-foundation-modelsによって開発
Llama2-chat 7Bをベースにしたベトナム語最適化モデル。増分事前トレーニングと効率的なトークナイザーによりベトナム語処理能力を大幅に向上
ダウンロード数 23
リリース時間 : 10/26/2023

モデル概要

このモデルはベトナム語に最適化されたLlama2の変種で、トークナイザーの再トレーニングと継続的な事前トレーニングにより、ベトナム語テキストのエンコード効率を大幅に改善。ベトナム語自然言語処理タスクに適しています

モデル特徴

効率的なベトナム語トークン化
SentencePieceを使用した専用トークナイザーを採用。ベトナム語エンコード効率はオリジナルLlama2比70%向上
混合データトレーニング
40.5GBの混合データセット(ベトナム語ニュース、ウィキペディア、法律文書および英語データ)を使用した増分事前トレーニング
LoRAアダプテーション
低ランク適応(LoRA)技術を採用した効率的なトレーニング。独立したLoRAモジュールを提供し統合を容易に

モデル能力

ベトナム語テキスト生成
英語テキスト生成
クロスランゲージ理解

使用事例

コンテンツ生成
ベトナム語ニュース生成
ニュースコーパスでトレーニング済み。ベトナム語慣習に沿ったニュースコンテンツを生成可能
法律支援
法律文書処理
大量のベトナム語法律テキストでトレーニング済み。法律文書の分析と生成に適しています
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase