Mistral 7B V0.1 Flashback V2
模型简介
这是一个对话式文本生成模型,专注于北欧语言(瑞典语、挪威语、丹麦语)和英语的文本生成能力,适用于论坛风格对话模拟和创意写作。
模型特点
北欧语言优化
特别针对瑞典语等北欧语言进行优化,适合处理论坛风格的对话文本
对话连贯性
能够生成具有上下文连贯性的多轮对话,模仿真实论坛讨论模式
引用回复生成
支持生成带有引用回复的论坛式对话结构
模型能力
多语言文本生成
对话模拟
创意写作
论坛风格回复生成
使用案例
内容生成
论坛对话模拟
生成模拟真实论坛讨论的对话内容
可生成包含标题、用户回复和引用结构的完整讨论串
创意写作辅助
辅助北欧语言创意写作
生成具有北欧语言特色的创意文本
教育研究
语言学习工具
作为瑞典语等北欧语言学习的辅助工具
🚀 🐈⬛ Mistral-7B-v0.1-flashback-v2
Mistral-7B-v0.1-flashback-v2是在基础模型Mistral-7B-v0.1上继续进行预训练的模型。它利用了来自瑞典网站https://www.flashback.org/ 的2251233个论坛线程,约40GB的文本数据进行了一个轮次的全量微调。
🚀 快速开始
模型使用示例
import torch
from transformers import AutoTokenizer, AutoModelForCausalLM
model_name = "timpal0l/Mistral-7B-v0.1-flashback-v2"
device = "cuda:0" if torch.cuda.is_available() else "cpu"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name)
model.eval()
model.to(device)
prompt = "Idag är det den bästa"
input_ids = tokenizer(prompt, return_tensors="pt")["input_ids"].to(device)
generated_token_ids = model.generate(
inputs=input_ids,
max_new_tokens=256,
do_sample=True,
temperature=0.8,
top_p=1,
)[0]
generated_text = tokenizer.decode(generated_token_ids)
generated_text
<s> Idag är det den bästa dagen i hela veckan, för nu tar det slut!\n\n>! Gnällfesten!\n\nJag sitter här, oerhört förvirrad, och försöker förstå varför vi ens måste fortsätta att existera efter döden. Jag menar, jag förstår ju egentligen att det aldrig kan ta slut, eller inte "ta slut" i den bemärkelsen att materian försvinner, men det är inte det jag pratar om.\n\nDöden, det faktum att man dör och aldrig kan uppleva livet igen. Det som är liv och ger livet en mening, det försvinner i döden. Och sen börjas det om, om och om igen. Varför behöver vi så många liv? Vi är ju inte ens medvetna av att vi någonsin har levt, så varför ska vi komma hit och bli medvetna hela tiden?\n\nDet här är en sådan fråga som jag aldrig kan få
✨ 主要特性
Mistral-7B-v0.1-flashback-v2是基于基础模型Mistral-7B-v0.1继续进行预训练得到的模型。它使用了来自瑞典网站https://www.flashback.org/ 的约40GB文本数据进行了一个轮次的全量微调。
📦 安装指南
文档未提及安装步骤,故跳过该章节。
💻 使用示例
基础用法
import torch
from transformers import AutoTokenizer, AutoModelForCausalLM
model_name = "timpal0l/Mistral-7B-v0.1-flashback-v2"
device = "cuda:0" if torch.cuda.is_available() else "cpu"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name)
model.eval()
model.to(device)
prompt = "Idag är det den bästa"
input_ids = tokenizer(prompt, return_tensors="pt")["input_ids"].to(device)
generated_token_ids = model.generate(
inputs=input_ids,
max_new_tokens=256,
do_sample=True,
temperature=0.8,
top_p=1,
)[0]
generated_text = tokenizer.decode(generated_token_ids)
generated_text
高级用法
文档未提及高级用法代码示例,故跳过该部分。
📚 详细文档
数据格式
为了模拟预训练中使用的数据格式,它具有以下结构:
# Thread_Title
username_thread_creator:
Hello, this is my thread...
username_user_1:
This is a response to the thread, without qouting anything.
username_user_2:
> username_user_1: This is a response to the thread, without qouting anything.
I am now quoting username_user_1...
随机训练样本
# Tips om aktiviter och sevärdheter i Stockholm för någon med funktionsnedsättning
Roozbeh:
Hej!
Jag jobbar som assistent åt en kille på ett stödboende.
Nästa vecka åker han, jag och en kollega till Stockholm och han är superpeppad på att se sig omkring.
Har ni några guld tips?
Får gärna ge förslag både dag och kvällstid om ni kommer på något.
Vi har redan tänkt på att se slottet.
Och gamla staden, finns där något kanske?
Bra cafen/restauranger som inte är allt för dyra.
Några ställen som man bara måste se eller göra i Stockholm?
Han är inte rullstolsbunden ska nämnas, är ung och i ganska bra kondition fysiskt.
Alla tips är välkomna tack!
Annéa:
Beror lite på vad man gillar. Om ni ändå är vi Slottet så har ni ju dom stora turistgatorna i Gamla Stan runt hörnet precis, dock inget ställe man vill gå på om man tycker det är jobbigt med folk och att trängas och ingenstans där man äter särskilt bra eller billigt.
Laust:
Åka upp på globen funkar med rullstol
Thomaz:
Välkomna! 🙂
Vad har han för intressen?
Är ni ändå på slottet kan jag rekommendera livrustkammaren, där kläder och attiraljer såsom vagnar (och även uppstoppade hästar) från svenska kungligheter är utställda.
Anne-Jorunn:
Gröna Lund och skansen är guld, om hen klarar av att åka karusell så går ni också förbi alla köer om du är stödperson.
Abba museumet, Vasamuseumet, militärhistoriska museet, tekniska museet, Junibacken. Finns mycket bra.
Annars kan det vara skoj att gå runt på Mall of Scandinavia, skönt att vara inne med toaletter inom räckhåll.
Muscab:
> Roozbeh: Hej!
>
> Jag jobbar som assistent åt en kille på ett stödboende.
> Nästa vecka åker han, jag och en kollega till Stockholm och han är superpeppad på att se sig omkring.
> Har ni några guld tips?
> Får gärna ge förslag både dag och kvällstid om ni kommer på något.
> Vi har redan tänkt på att se slottet.
> Och gamla staden, finns där något kanske?
> Bra cafen/restauranger som inte är allt för dyra.
> Några ställen som man bara måste se eller göra i Stockholm?
> Han är inte rullstolsbunden ska nämnas, är ung och i ganska bra kondition fysiskt.
> Alla tips är välkomna tack!
Jag tror de mesta platser är ganska ovänliga för rullstol. Backar, grusvägar, kullersten, trånga dörrar, trappor. Finns det någon restaurang/café som är billig och rullstolsvänlig? Vet inte. Köp ett paket glassar på ica istället.
Något man måste göra i Stockholm? Det finns inte mycket att se. Turister brukade gå runt i gamla stan och titta på tunnelbanestationer.
Annéa:
> Muscab: Jag tror de mesta platser är ganska ovänliga för rullstol. Backar, grusvägar, kullersten, trånga dörrar, trappor. Finns det någon restaurang/café som är billig och rullstolsvänlig? Vet inte. Köp ett paket glassar på ica istället.
>
> Något man måste göra i Stockholm? Det finns inte mycket att se. Turister brukade gå runt i gamla stan och titta på tunnelbanestationer.
Han sitter ju INTE i rullstol...
Tharsika:
Vad har han för problematik? Vad kan störa/vara svårt för honom ? Rullstol ? Kramp? Utåtagerande ?
Muscab:
> Annéa: Han sitter ju INTE i rullstol...
Läste fel. 🤦
Boine:
Armémuseum
Historiska museet
Åka djurgårdsfärjan alt. ”Skärgårdstur” med SL
Utsikt på Södermalm + promenaden dit. Mariaberget & Monteliusvägen
Gamla stan - Mårten Trotzig gränd samt kanonkulorna i husväggen några meter från Stortorget
Målningar i tunnelbanan
Spela äventyrsgolf inomhus
Se guldbron - Slussen
Utsikt Katarinahissen - Slussen, man går in i porten till Gondolen (nog nerlagd) tar hissen längst upp och går en våning upp annars får man gå dit bakvägen onödigt långt.
Gå hela Drottninggatan
Slottet ev tajma in vaktavlösning
Kolla om det finns något personen har intresse av/om, finns en hel gratis museum
Roozbeh:
Vilka bra tips! Tack allihopa vad fint av er att bidra! Så uppskattat verkligen 🙂
Nu är vi åter hemma igen efter resan till Stockholm.
Resan gick jättebra, vi planerade noga och gjorde det mesta av tid med hänsyn till funktionsnedsättningen. Vi gick såklart efter vad han själv önskade göra och gav förslag på vad Stockholm erbjuder. Då vi bara var i Stockholm under ca 24 timmar måste jag säga att vi fick gjort mycket mer än vi väntade oss. Vi hade ingen bil. Istället köpte vi ett 24 tim kort för kollektivtrafiken och med hjälp av SL appen och google maps navigerade jag runt oss i staden.
Hotellet vi bodde på låg nära Centralstationen.
Detta gjorde vi:
Gick runt hela Gamla Stan. Åt på restaurang där samt i Vasaplan och även fikade på diverse caféer i Gamla Stan. Vi såg det Kungliga slottet både inuti och utanpå, var uppskattat! Han tyckte det var så häftigt. Strosade runt i alla gränder, torg och gator i Gamla Stan, gick in i trevliga små butiker och tog fina foton! Vi tittade på alla båtar i hamnen. Parlamentet. Stadshuset. Vi gick in på diverse olika ställen vi gick förbi som han impulsivt kände dragning till. Typ karaokebar, kulturhuset, pubbar etc. Allt han kände för gjorde vi. Det var hans resa 100 %.
Åkte med färja till Djurgården och besökte ABBA museet där han fick lyssna på sånger, se rekvisita, sjunga och t.om åka helikopter i VR.
Vi shoppade också såklart då Stockholm har så många butiker!(Hela Drottninggatan och ställen på/nära Vasaplan)
Under resan interagerade han med en massa Stockholmare. Sade till flertalet tjejer att han älskade dom haha vilket charmör! Vi gick förbi en högvakt vid slottet som han hälsade på. Det var en hon, och vakten rörde inte en min men följde honom med blicken. Givetvis fick vi säga det att dom inte pratar med någon då det ingår i jobbet etc.
Han blev bemött med respekt och ömhet av de flesta ska sägas. Han var glad över att ha fått prata med så många människor. Vi stannade ofta då han ville fråga t.ex poliser eller andra arbetare om saker, alla var gulliga och vänliga mot honom.
Vi åkte under resan buss, tunnelbana(också en önskan att få göra) och färjor till olika färjterminaler för att få se Stockholm från vattnet.
Såg också Sergels Torg på kvällen eller "Plattan" som jag tror den också kallas. En pelare var vackert upplyst i blått ljus där och han berättade exalterat om hur många filmer han sett som har plattan som scenplats etc. Kvällen bjöd på solnedgången från hotellets tak. Åt en fantastisk frukostbuffé på morgonen med flera omgångar god mat! Härligt att han njöt.
Då han faktiskt har en fysisk och kognitiv nedsättning är vi så glada att han orkade så mycket! Bäst av allt sa han sig vara väldigt nöjd med resan. Vi ska nu planera fler resor till Stockholm i framtiden. Då gör vi fler saker, sånt vi inte hann med den här gången. Var lite begränsat med tid(24 timmar) samt behövde vi tänka på att energi skulle räcka till utan att kroppen skulle triggas till att hans nedsättnings symptom blossade upp. Behövs ju givetvis pauser med jämna mellanrum då.
Tack och lov för apparna som jag kunde leda oss efter. Att åka kollektivt hade varit svårt annars och jag kunde se efter kartan var våra besöksmål låg samt vilka vägar som kunde spara oss onödig tid.
Tack ska ni ha för tipsen, igen. Tack till Stockholm för att ni tog emot oss med respekt han var så nöjd med resan.
Hej så länge, vi kommer åter i framtiden! 😁
评估结果
详细的评估结果可以在 此处 找到。
指标 | 值 |
---|---|
平均 | 57.53 |
AI2推理挑战 (25-shot) | 57.17 |
HellaSwag (10-shot) | 80.74 |
MMLU (5-shot) | 59.98 |
TruthfulQA (0-shot) | 40.66 |
Winogrande (5-shot) | 77.19 |
GSM8k (5-shot) | 29.42 |
🔧 技术细节
文档未提及技术实现细节,故跳过该章节。
📄 许可证
该项目采用MIT许可证。
📋 模型信息
属性 | 详情 |
---|---|
支持语言 | 瑞典语、英语、挪威语、丹麦语 |
模型类型 | 基于Mistral-7B-v0.1继续预训练的模型 |
训练数据 | 来自瑞典网站https://www.flashback.org/ 的2251233个论坛线程,约40GB的文本数据 |
任务类型 | 文本生成 |
Phi 2 GGUF
其他
Phi-2是微软开发的一个小型但强大的语言模型,具有27亿参数,专注于高效推理和高质量文本生成。
大型语言模型 支持多种语言
P
TheBloke
41.5M
205
Roberta Large
MIT
基于掩码语言建模目标预训练的大型英语语言模型,采用改进的BERT训练方法
大型语言模型 英语
R
FacebookAI
19.4M
212
Distilbert Base Uncased
Apache-2.0
DistilBERT是BERT基础模型的蒸馏版本,在保持相近性能的同时更轻量高效,适用于序列分类、标记分类等自然语言处理任务。
大型语言模型 英语
D
distilbert
11.1M
669
Llama 3.1 8B Instruct GGUF
Meta Llama 3.1 8B Instruct 是一个多语言大语言模型,针对多语言对话用例进行了优化,在常见的行业基准测试中表现优异。
大型语言模型 英语
L
modularai
9.7M
4
Xlm Roberta Base
MIT
XLM-RoBERTa是基于100种语言的2.5TB过滤CommonCrawl数据预训练的多语言模型,采用掩码语言建模目标进行训练。
大型语言模型 支持多种语言
X
FacebookAI
9.6M
664
Roberta Base
MIT
基于Transformer架构的英语预训练模型,通过掩码语言建模目标在海量文本上训练,支持文本特征提取和下游任务微调
大型语言模型 英语
R
FacebookAI
9.3M
488
Opt 125m
其他
OPT是由Meta AI发布的开放预训练Transformer语言模型套件,参数量从1.25亿到1750亿,旨在对标GPT-3系列性能,同时促进大规模语言模型的开放研究。
大型语言模型 英语
O
facebook
6.3M
198
1
基于transformers库的预训练模型,适用于多种NLP任务
大型语言模型
Transformers

1
unslothai
6.2M
1
Llama 3.1 8B Instruct
Llama 3.1是Meta推出的多语言大语言模型系列,包含8B、70B和405B参数规模,支持8种语言和代码生成,优化了多语言对话场景。
大型语言模型
Transformers 支持多种语言

L
meta-llama
5.7M
3,898
T5 Base
Apache-2.0
T5基础版是由Google开发的文本到文本转换Transformer模型,参数规模2.2亿,支持多语言NLP任务。
大型语言模型 支持多种语言
T
google-t5
5.4M
702
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers 支持多种语言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers 英语

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 中文
R
uer
2,694
98