L

Llama PLLuM 8B Chat

CYFRAGOVPLによって開発
PLLuMは、ポーランド語やその他のスラブ/バルト語に特化した大規模言語モデルファミリーであり、より広範な汎化能力を実現するために英語データも取り入れています。
ダウンロード数 2,618
リリース時間 : 2/7/2025

モデル概要

PLLuMシリーズのモデルは、文脈が連続したテキストを生成し、質問応答や要約などの様々なタスクを支援し、特定分野のアプリケーション(特定分野のインテリジェントアシスタントなど)の基礎を築くことを目的としています。

モデル特徴

広範なデータ収集
大規模かつ高品質のポーランド語テキストデータ(クリーニングと重複排除後で約1500億個のトークン)と、スラブ語、バルト語、英語の追加テキストを収集しました。
有機指令データセット
最大規模のポーランド語で手動作成された「有機指令」のセット(約40000個のプロンプト - 応答ペア)を精心に企画し、監督微調整における自動化手法では見落とされる一連の微妙な側面を網羅しています。
ポーランド語嗜好コーパス
異なる人口統計学的特徴を持つアノテーションチームによって手動で評価されたプロンプトと複数のモデル応答を含む、最初のポーランド語嗜好コーパスを作成しました。
評価ベンチマーク
ポーランドの公共管理に関連するタスクでのモデルの性能を評価するためのカスタムベンチマークを開発し、PLLuMはすべてのテストモデルの中で最高得点を獲得しました。

モデル能力

テキスト生成
質問応答
要約
検索強化生成(RAG)
多言語対応

使用事例

一般的な言語タスク
テキスト生成
詩や記事など、文脈が連続したテキストを生成します。
様々なシナリオに適した高品質のポーランド語テキストを生成します。
質問応答
提供されたドキュメントまたは一般知識に基づいて、ユーザーが提出した質問に回答します。
正確で文脈に関連した回答を提供します。
特定分野アシスタント
公共管理
ポーランドの公共管理に専門的なサポートを提供し、法律や官僚的なトピックの情報検索や質問応答を行います。
複雑な情報検索と質問応答で優れた性能を発揮します。
研究開発
下流の人工知能アプリケーション
ポーランド語に精通した下流の人工知能アプリケーションに必要な基礎構築ブロックとして機能します。
学術または産業環境に強力な言語モデルのサポートを提供します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase