V

Vietnamese Llama2 7b 120GB

bkai-foundation-modelsによって開発
Llama-2-7Bをベースに最適化したベトナム語大規模言語モデル。124GBのマルチドメインベトナム語・英語データで継続事前学習を行い、言語理解能力を強化
ダウンロード数 65
リリース時間 : 12/20/2023

モデル概要

ベトナム語に特化して最適化された7Bパラメータの大規模言語モデル。LoRA技術を用いてマルチドメインベトナム語データで継続事前学習を行い、ベトナム語テキスト処理効率を大幅に向上

モデル特徴

最適化されたベトナム語トークナイザー
広範なベトナム語コーパスで訓練されたSentencePieceトークナイザー。ChatGPT比50%、元のLlama2比約70%トークン数を削減
マルチドメイン事前学習データ
124GBの高品質データ(104GBベトナム語+20GB英語)を統合。ニュース、ウィキペディア、書籍、法律文書など多分野を網羅
LoRA効率的ファインチューニング
LoRA技術を用いた継続事前学習により、モデルコアパラメータを保持しながらベトナム語能力を効果的に向上

モデル能力

ベトナム語テキスト生成
英語テキスト生成
クロスリンガル理解
マルチドメインテキスト処理

使用事例

コンテンツ生成
ベトナム語ニュース執筆
ニュースコーパスで訓練され、ニュースコンテンツ生成を支援
法律文書処理
法律文書で訓練され、関連専門テキストを処理可能
教育
ベトナム語学習支援
ベトナム語学習者の言語モデルリファレンスとして利用可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase