🚀 EM German
EM Germanは、ドイツ語の様々な命令の大規模データセットで微調整された、Llama2/Mistral/LeoLMベースのモデルファミリーです。これらのモデルはドイツ語テキストに最適化されており、ドイツ語コンテンツの理解、生成、および対話に高い能力を発揮します。

LeoLM Mistralは、EM Germanモデルファミリーの代表モデルであり、リリース時点で私たちの見解では最良のオープンなドイツ語LLMです。
LeoLMチームが、ドイツ語テキストで継続的に事前学習されたベースモデルを公開し、生成能力を大幅に向上させてくれたことに、心から感謝申し上げます。
⚠️ 重要提示
Mistralアーキテクチャは非常に新しく、まだすべてのライブラリ(例:AutoGPTQ)でサポートされていないことに注意してください。問題が発生した場合は、別の形式/ベースモデルを試してみてください。
🚀 クイックスタート
EM Germanは、ドイツ語のテキスト処理に最適化されたモデルファミリーです。以下のセクションでは、モデルの概要、リンク、プロンプト形式、出力例などについて説明します。
✨ 主な機能
- Llama2/Mistral/LeoLMベースのモデルファミリーで、ドイツ語の様々な命令の大規模データセットで微調整されています。
- 7b、13b、70bのLlama-2、Mistral、LeoLM(ドイツ語テキストで継続的に事前学習されたLlama-2/Mistral)モデルに基づくバージョンを提供しています。
- ドイツ語テキストの理解、生成、対話に最適化されています。
📚 ドキュメント
目次
- はじめに
- リンクとデモ
- プロンプト形式
- 出力例
- 謝辞
- 連絡先
- 免責事項
はじめに
EM Germanは、Llama2/Mistral/LeoLMベースのモデルファミリーで、ドイツ語の様々な命令の大規模データセットで微調整されています。これらのモデルはドイツ語テキストに最適化されており、ドイツ語コンテンツの理解、生成、および対話に高い能力を発揮します。
私たちは、7b、13b、70bのLlama-2、Mistral、LeoLM(ドイツ語テキストで継続的に事前学習されたLlama-2/Mistral)モデルに基づくバージョンを提供しています。
EM Germanモデルファミリーのすべての情報、出力例、特別なRAGプロンプト形式、出力例、評価結果は、私たちのGitHubリポジトリで確認できます。(ドイツ語版)また、GUI(GPT4All/LM Studio)でモデルを実行する方法についても記載されています。
リンクとデモ
モデルリンク
1つのモデルバージョンだけを試す場合は、LeoLM Mistral モデルを強くおすすめします。このモデルは、パフォーマンスと計算要件のバランスが最も良いです!
異なるバージョンに関する注意事項
(7b)モデルの能力を比較するには、出力例の比較も参照してください。
あるEM Germanバージョンで満足のいかない結果が得られた場合は、別の(および/またはより大きな)モデルまたはバージョンを試してみてください。
デモ
一部のモデルは、無料のGoogle Colabインスタンスで使用できます(例:8bitの7bnモデルまたはGPTQの13bモデル)。
プロンプト形式
このモデルは、改行なしのVicuna形式に従います(ただし、改行ありでも動作するはずです)。形式は以下の通りです。
Du bist ein hilfreicher Assistent. USER: <instruction> ASSISTANT:
標準のシステムプロンプトを、より適したものに置き換えることができます(RAGタスクについては以下を参照)。
出力例
EM Germanのすべての7bバージョンの様々な出力例の選択肢は、こちらで確認できます。
プロンプト:
Erkläre die Bedeutung von drei wesentlichen Elementen der Bilanzierung und des Accountings nach IFRS für Unternehmen, die auf internationaler Ebene tätig sind.
EM German Leo Mistral 7bの回答:
Die International Financial Reporting Standards (IFRS) sind eine Reihe von internationalen Rechnungslegungsstandards, die von der International Accounting Standards Board (IASB) entwickelt wurden. Sie sollen dazu beitragen, dass Finanzberichte vergleichbar, zuverlässig und relevant sind.
1. Fair Value: Dieses Konzept ist ein zentraler Bestandteil der IFRS. Es besagt, dass Vermögenswerte und Schulden zum fairen Wert bilanziert werden sollten, was dem Preis entspricht, zu dem sie zwischen Marktteilnehmern gehandelt werden könnten. Dadurch wird sichergestellt, dass das Unternehmen eine genaue Darstellung seiner finanziellen Lage liefert.
2. Konsolidierung: Die IFRS verlangen von Unternehmen, ihre Finanzergebnisse auf konsolidierter Basis darzustellen. Das bedeutet, dass alle Tochtergesellschaften und verbundenen Unternehmen in die Bilanz des Mutterunternehmens aufgenommen werden. Dadurch wird ein klareres Bild von der finanziellen Situation des Konzerns geschaffen.
3. Vollständigkeitsprinzip: Die IFRS verlangen von Unternehmen, alle relevanten Informationen offenzulegen. Dies umfasst sowohl positive als auch negative Faktoren, wie zum Beispiel Gewinne und Verluste, Einnahmen und Ausgaben sowie Risiken und Unsicherheiten. Durch dieses Prinzip wird sichergestellt, dass Investoren, Kreditgeber und andere Stakeholder eine umfassende Einschätzung der finanziellen Lage des Unternehmens vornehmen können.
プロンプト:
Ein Mensch atmet durchschnittlich 16 Mal pro Minute. Wie oft atmet er an einem Tag?
EM German Leo Mistral 7bの回答:
Zuerst berechnen wir, wie oft eine Person in einer Stunde atmet. Wir wissen, dass eine Stunde 60 Minuten hat, also:
Atemzüge pro Stunde = Atemfrequenz * Minuten pro Stunde
= 16 Atemzüge pro Minute * 60 Minuten
= 960 Atemzüge
Um herauszufinden, wie viele Atemzüge eine Person an einem Tag macht, müssen wir diese stündliche Rate mit der Anzahl der Stunden an einem Tag multiplizieren, also 24:
Atemzüge pro Tag = Atemzüge pro Stunde * Stunden pro Tag
= 960 Atemzüge * 24 Stunden
= 23.040 Atemzüge
Also macht ein durchschnittlicher Mensch etwa 23.040 Atemzüge an einem Tag.
(詳細な例については、私たちのGitHubリポジトリをご覧ください。)
謝辞
winglian/caseus氏がAxolotlに関して素晴らしい仕事をしてくれたことに感謝します。私はこれを使ってEMモデルを訓練しました。また、Jon Durbin氏と彼のAiroborosモデルとコードから多くのアイデアとコードスニペットを借りました。
さらに、Björn Plüster氏とLeoLMチームがLeoLMに関して卓越した事前学習の仕事をしてくれたこと、そして最後にTheBloke氏があらゆる形式の量子化バージョンを準備してくれたことに、心から感謝申し上げます。
70bモデルは、OVH Cloud Startup Programの支援を受けて訓練されました。
連絡先
詳細なフィードバックや機能要求については、issueを開くか、私のウェブサイトを通じて私に連絡してください。
PS: 私たちは、将来的にビジネスアプリケーション向けのカスタマイズされたモデルを提供するスタートアップellamindの支援にも常に興味があります(現在はまだステルスモードです)。もしあなたが私たちのモデルをビジネスアプリケーションで使用し、特殊な機能に関する高度なニーズがある場合は、ぜひ連絡してください。
免責事項
私は、このモデルを使用する第三者の行動やモデルの出力について責任を負いません。このモデルは研究目的でのみ使用する必要があります。元のベースモデルのライセンスが適用され、モデルファイルとともに配布されます。
📄 ライセンス
このモデルは、Apache-2.0ライセンスの下で提供されています。
属性 |
详情 |
モデルタイプ |
Mistral |
訓練データ |
ドイツ語の様々な命令の大規模データセット |