🚀 EM German
EM German 是一个基于 Llama2、Mistral 和 LeoLM 的模型家族,在大量德语指令数据集上进行了微调。该模型针对德语文本进行了优化,在理解、生成和交互德语内容方面表现出色。

LeoLM Mistral 是 EM German 模型家族的展示模型,在我们看来,它是目前最好的开源德语大语言模型。
非常感谢 LeoLM 团队发布了一个在德语文本上持续预训练的基础模型,这极大地提升了模型的生成能力。
⚠️ 重要提示
请注意,Mistral 架构是最新的架构,并非所有库都支持(例如 AutoGPTQ)。如果遇到任何问题,请尝试使用不同的格式或基础模型。
🚀 快速开始
EM German 是一个基于 Llama2/Mistral/LeoLM 的模型家族,在大量德语指令数据集上进行了微调。这些模型针对德语文本进行了优化,能够熟练理解、生成和交互德语内容。
我们提供基于 7b、13b 和 70b Llama - 2、Mistral 和 LeoLM(在德语文本上持续预训练的 Llama - 2/Mistral)模型的版本。
请在 我们的 GitHub 仓库 中查找 EM German 模型家族的所有信息、示例输出、特殊的 RAG 提示格式、输出示例和评估结果。(德语版本)。你还可以找到如何使用 GUI(GPT4All/LM Studio)运行模型的说明。
✨ 主要特性
- 基于 Llama2、Mistral 和 LeoLM 架构,在德语指令数据集上微调。
- 提供 7b、13b 和 70b 不同规模的模型版本。
- 针对德语文本进行优化,在德语内容处理上表现出色。
📦 安装指南
文档未提供具体安装步骤,你可以在 我们的 GitHub 仓库 中查找相关信息,其中也包含如何使用 GUI(GPT4All/LM Studio)运行模型的说明。
💻 使用示例
基础用法
提示格式
此模型遵循无换行符的 Vicuna 格式(有换行符也应该可行)。格式如下:
Du bist ein hilfreicher Assistent. USER: <instruction> ASSISTANT:
你可以将标准系统提示替换为更合适的提示(有关 RAG 任务,请见下文)。
示例输出
请在 这里 查看 EM German 所有 7b 版本的各种示例输出。
提示:
Erkläre die Bedeutung von drei wesentlichen Elementen der Bilanzierung und des Accountings nach IFRS für Unternehmen, die auf internationaler Ebene tätig sind.
EM German Leo Mistral 7b 回答:
Die International Financial Reporting Standards (IFRS) sind eine Reihe von internationalen Rechnungslegungsstandards, die von der International Accounting Standards Board (IASB) entwickelt wurden. Sie sollen dazu beitragen, dass Finanzberichte vergleichbar, zuverlässig und relevant sind.
1. Fair Value: Dieses Konzept ist ein zentraler Bestandteil der IFRS. Es besagt, dass Vermögenswerte und Schulden zum fairen Wert bilanziert werden sollten, was dem Preis entspricht, zu dem sie zwischen Marktteilnehmern gehandelt werden könnten. Dadurch wird sichergestellt, dass das Unternehmen eine genaue Darstellung seiner finanziellen Lage liefert.
2. Konsolidierung: Die IFRS verlangen von Unternehmen, ihre Finanzergebnisse auf konsolidierter Basis darzustellen. Das bedeutet, dass alle Tochtergesellschaften und verbundenen Unternehmen in die Bilanz des Mutterunternehmens aufgenommen werden. Dadurch wird ein klareres Bild von der finanziellen Situation des Konzerns geschaffen.
3. Vollständigkeitsprinzip: Die IFRS verlangen von Unternehmen, alle relevanten Informationen offenzulegen. Dies umfasst sowohl positive als auch negative Faktoren, wie zum Beispiel Gewinne und Verluste, Einnahmen und Ausgaben sowie Risiken und Unsicherheiten. Durch dieses Prinzip wird sichergestellt, dass Investoren, Kreditgeber und andere Stakeholder eine umfassende Einschätzung der finanziellen Lage des Unternehmens vornehmen können.
提示:
Ein Mensch atmet durchschnittlich 16 Mal pro Minute. Wie oft atmet er an einem Tag?
EM German Leo Mistral 7b 回答:
Zuerst berechnen wir, wie oft eine Person in einer Stunde atmet. Wir wissen, dass eine Stunde 60 Minuten hat, also:
Atemzüge pro Stunde = Atemfrequenz * Minuten pro Stunde
= 16 Atemzüge pro Minute * 60 Minuten
= 960 Atemzüge
Um herauszufinden, wie viele Atemzüge eine Person an einem Tag macht, müssen wir diese stündliche Rate mit der Anzahl der Stunden an einem Tag multiplizieren, also 24:
Atemzüge pro Tag = Atemzüge pro Stunde * Stunden pro Tag
= 960 Atemzüge * 24 Stunden
= 23.040 Atemzüge
Also macht ein durchschnittlicher Mensch etwa 23.040 Atemzüge an einem Tag.
📚 详细文档
链接与演示
模型链接
如果你只想尝试一个模型版本,我强烈推荐 LeoLM Mistral 模型,它在性能和计算要求方面达到了最佳平衡!
不同版本说明
有关(7b)模型能力的比较,请参阅 示例输出比较。
如果你对某个 EM German 版本的结果不满意,请尝试为你的用例选择不同(和/或更大)的模型或版本。
演示
你可以使用一些模型在 免费 的 Google Colab 实例上运行(例如 8 位的 70 亿参数模型或使用 GPTQ 的 130 亿参数模型):
致谢
非常感谢 winglian/caseus 在 Axolotl 上的出色工作,我使用它来训练 EM 模型。我也感谢 Jon Durbin 及其 Airoboros 模型,我从其中借鉴了很多想法和代码片段。
此外,非常感谢 Björn Plüster 和 LeoLM 团队在 LeoLM 上的出色预训练工作,最后但同样重要的是,非常感谢 TheBloke 准备了各种格式的量化版本。
700 亿参数模型是在 OVH 云创业计划 的支持下训练的。
联系我们
如需详细反馈和功能请求,请提出问题或通过 我的网站 与我联系。
💡 使用建议
我们也一直对为我们的创业公司 ellamind 提供支持感兴趣,该公司未来将为商业应用提供定制模型(我们目前仍处于保密模式)。如果你将我们的模型用于商业应用,并且对专业能力有更高的需求,请与我们联系。
免责声明
我不对使用此模型的第三方的行为或模型的输出负责。此模型仅应用于研究目的。原始基础模型的许可证适用,并随模型文件一起分发。
🔧 技术细节
属性 |
详情 |
模型类型 |
Mistral |
训练数据 |
基于 Llama2、Mistral 和 LeoLM 模型,在大量德语指令数据集上微调 |
📄 许可证
本项目采用 Apache - 2.0 许可证。