模型简介
模型特点
模型能力
使用案例
🚀 深度财经模型(Deepmoney)
Deepmoney 是一款专门为金融投资领域打造的大模型。它突破了传统金融模型仅依赖公开知识训练的局限,能更精准地对市场变化做出反应,为投资者提供更具价值的投资分析和决策支持。
Sft版本:
本模型属于“七宗罪”系列模型中的“贪婪(Greed)”模型,具备以下特性:
- 在Yi - 34b上进行全参数预训练。
- 采用高质量的研究报告数据。
- 经过高端的数据清洗流程。
🚀 快速开始
本模型旨在为金融投资领域提供更有效的分析工具。在当前金融市场中,大多数所谓的金融模型主要基于公开知识进行训练,然而这些公开知识对于市场的可解释性往往不足。而 Deepmoney 模型通过独特的数据选择和训练方式,能够更好地应对市场变化,为投资者提供更有价值的投资建议。
✨ 主要特性
- 全参数预训练:在Yi - 34b上进行全参数预训练,使模型能够掌握大量的金融知识和分析方法。
- 高质量数据:选用高质量的研究报告数据,这些数据来自多种渠道,包括传统券商和专业研究机构,确保模型训练数据的有效性和实用性。
- 高端清洗流程:对训练数据进行高端清洗,去除无效和错误信息,提高模型的准确性和可靠性。
📚 详细文档
1. 模型目标
当下大多数金融模型基于公开知识训练,如普通教材、入门分析师考试资料和公司公开报告等。但在实际金融领域,这些公开知识对市场的可解释性严重不足。例如,凯恩斯、弗里德曼的经济理论以及当下行为金融学的各类主张,在这些普通训练数据中往往体现不足。因此,大多数金融模型难以做出有效的投资判断。
而本模型作为整个投资分析流程的基础模型,计划搭配信息搜集者、标的判断者、定性分析者、定量分析者和数据提取者等模型,共同完成投资分析任务。模型本身需要掌握大量的定性和定量分析方法,以应对复杂多变的金融市场。
2. 数据来源
公开知识虽然有一定价值,但有效性存在疑问。本模型的训练数据主要包括两部分:
- 专业书籍:挑选了一些大学教材和专业书籍,数量不多但质量较高。
- 研究报告:选取了2019 - 2023年12月期间的大量研究报告数据,这些报告由多种发布者提供,包括传统券商和专业研究机构,且大多为付费内容,仅对机构开放。
为了从研究报告中提取数据(大多以图形或表格形式呈现),尝试了多种多模态模型,发现cog - agent和emu2效果较好。同时,为了更好地提取信息,还创建了一套将研究报告上下文总结作为提示(prompt)一部分的流程。最终,将这些数据进行混合,未使用通识数据,因为模型专注于金融投资领域。
3. 训练方式
采用原始文本进行全参数训练,基座模型选用长上下文的yi - 34b - 200k,这有助于模型理解和处理深度的金融研究报告。此外,还进行了一次监督微调(SFT),微调后的模型在实际应用中表现出色。
4. 模型评估
通过采样最近发生的事件,模拟真实世界中事件驱动的证券分析流程,对 Deepmoney 和GPT - 4进行对比测试。由于事件对市场的影响较为隐形,且评估产出需要使用多种定量方法,因此将测试结果展示如下,供大家对模型的生产结果进行感性评价。
具体流程如下:
- 拥有一套全球新闻爬取系统,对爬取的新闻进行去重和主客观判断,可通过传统的BERT模型完成。
- 对于 Deepmoney 模型,使用三个步骤处理传入的新闻:
- 主观判断:判断新闻可能影响的行业板块或投资标的,这主要依赖模型的主观分析能力。
- 设计定量方法:根据新闻内容,设计一套定量方法研究新闻对特定行业的影响,并说明所需数据。
- 具体定量分析:根据给定数据,设计具体的定量方法,对新闻对特定行业的影响进行定量分析。
以下是 Deepmoney 和GPT - 4针对某一新闻的三步回答示例:
Deepmoney
(1).
近日,英国药企葛兰素史克(GSK.US)宣布,以10亿美元的首付款,以及4亿美元的里程碑付款,收购美国一家临床阶段生物制药服务商Aiolos Bio。GSK瞄准的,是Aiolos Bio唯一的核心管线——用于治疗成人哮喘的单克隆抗体AIO - 001。IO - 001管线并非Aiolos Bio自研,它授权自中国医药一哥——恒瑞医药。医药分析师称,总体来看,此次的AIO - 001单抗交易中,所谓“中间商赚差价”的说法有媒体炒作嫌疑,对“恒瑞医药轻易出手”的观点,他表示:“一个(Aiolos Bio)是赌博,下注,几年吃一次大单;一个(恒瑞医药)是制造业顺便做海外增量。大家做的完全不是一个生意,恒瑞依然是赚钱方。”(澎湃新闻)
Which industry sectors or investment targets may the above news affect?
ANS:
上述新闻主要影响制药、生物技术和医疗保健行业。该新闻涉及葛兰素史克收购Aiolos Bio,后者专注于使用名为AIO - 001的单克隆抗体开发哮喘治疗方法。此交易对这些行业中可能参与类似交易或合作以扩展产品线和市场份额的公司也有影响。
******************************************************************************
(2). 近日,英国药企葛兰素史克(GSK.US)宣布,以10亿美元的首付款,以及4亿美元的里程碑付款,收购美国一家临床阶段生物制药服务商Aiolos Bio。GSK瞄准的,是Aiolos Bio唯一的核心管线——用于治疗成人哮喘的单克隆抗体AIO - 001。IO - 001管线并非Aiolos Bio自研,它授权自中国医药一哥——恒瑞医药。医药分析师称,总体来看,此次的AIO - 001单抗交易中,所谓“中间商赚差价”的说法有媒体炒作嫌疑,对“恒瑞医药轻易出手”的观点,他表示:“一个(Aiolos Bio)是赌博,下注,几年吃一次大单;一个(恒瑞医药)是制造业顺便做海外增量。大家做的完全不是一个生意,恒瑞依然是赚钱方。”(澎湃新闻)
Please design a quantitative method to study the impact of the above news on the pharmaceutical industry. And accordingly explain what data needs to be used.
ANS:
为了定量分析此次收购新闻对制药行业的影响,我们可以使用回归分析或其他统计建模技术。关键是确定可能影响制药行业股票价格的自变量,然后确定每个变量对股票价格变化的影响程度。
以下是设计这种定量方法的步骤概述:
步骤1:数据收集
从彭博社、雅虎财经等各种来源收集你希望研究的时间段(例如季度或年度)的历史数据。以下是一些可能需要的数据集列表:
- 与制药行业相关的本地(例如标准普尔制药指数)和全球(例如标准普尔全球医疗保健指数)股票市场指数。
- 与葛兰素史克/Aiolos Bio处于同一领域且受其收购影响的主要参与者的财务绩效指标。
- 过去类似交易的新闻情绪得分。
- 宏观经济因素,如GDP增长率、通货膨胀率、利率等。
- 行业特定因素,如研发支出趋势、监管环境变化、专利到期等。
步骤2:模型选择
收集所有相关信息后,根据因变量和自变量之间关系的性质选择合适的计量经济模型。如果线性假设成立,普通最小二乘法回归将适用;否则,也可以考虑Logit/Probit模型。
步骤3:变量选择
使用方差膨胀因子(VIF)值检查变量之间的多重共线性后,选择合适的解释变量。这将帮助我们了解哪些变量对股票回报有显著影响。
步骤4:假设检验
进行假设检验,如F检验、t检验、杜宾 - 沃森检验等,以检查我们选择的回归变量在不同显著性水平下是否具有统计学意义。
步骤5:系数解释
解释从步骤4中获得的系数,同时要记住符号和大小必须与经济理论一致。正系数表示正相关,而负系数表示负相关。
步骤6:模型评估
评估拟合优度指标,如R²、调整后的R²、赤池信息准则(AIC)、贝叶斯信息准则(BIC)、均方根误差(RMSE)、平均绝对偏差(MAD)等,以确定模型的拟合度。
步骤7:预测
使用估计的参数和未来外生变量值,预测任何给定时间段的未来结果。
总之,这种定量方法旨在通过研究此次收购对制药行业多家公司的股票价格和财务绩效的影响,来衡量葛兰素史克收购对整个制药行业的影响。
****************************************************************************
(3). 近日,英国药企葛兰素史克(GSK.US)宣布,以10亿美元的首付款,以及4亿美元的里程碑付款,收购美国一家临床阶段生物制药服务商Aiolos Bio。GSK瞄准的,是Aiolos Bio唯一的核心管线——用于治疗成人哮喘的单克隆抗体AIO - 001。IO - 001管线并非Aiolos Bio自研,它授权自中国医药一哥——恒瑞医药。医药分析师称,总体来看,此次的AIO - 001单抗交易中,所谓“中间商赚差价”的说法有媒体炒作嫌疑,对“恒瑞医药轻易出手”的观点,他表示:“一个(Aiolos Bio)是赌博,下注,几年吃一次大单;一个(恒瑞医药)是制造业顺便做海外增量。大家做的完全不是一个生意,恒瑞依然是赚钱方。”(澎湃新闻)
Based on the following data, please design a specific set of quantitative methods to quantitatively analyze the impact of the above news on the pharmaceutical industry.
* Stock market indices related to pharmaceutical industries both locally (e.g., S&P Pharmaceutical Index) and globally (e.gs&p Global Healthcare Index)
* Financial performance indicators of major players within the same space as GSK/Aiolos Bio and those affected by their acquisitions
* News sentiment scores around similar deals in the past
* Macroeconomic factors like GDP growth rate, inflation rates, interest rates, etc.
* Industry specific factors like R&D spending trends, regulatory environment changes, patent expirations, etc.
ANS:
为了定量分析此新闻对制药行业的影响,我们可以使用多种定量方法,包括分析股票价格、财务绩效指标、新闻情绪得分、宏观经济因素和行业特定因素。以下是具体的操作方法:
1. 股票市场指数分析:监测收购公告前后,与制药行业相关的本地(如标准普尔制药指数)和全球(如标准普尔全球医疗保健指数)股票市场指数的每日或每周波动。使用回归分析、方差分析(ANOVA)测试或时间序列分析等统计技术分析这些波动,以确定此次事件是否导致了显著的价格变动。
2. 财务绩效指标分析:检查在收购公告前,与Aiolos Bio和葛兰素史克在同一治疗领域运营的其他公司的财务绩效指标。这些指标可能包括收入增长率、净利润率、净资产收益率(ROE)比率、每股收益(EPS)等。然后将这些指标与收购后的数字进行比较,以查看交易是否导致了明显的差异。你还可以观察同一领域公司的整体盈利能力趋势,以评估其对投资者信心的潜在影响。
3. 新闻情绪得分分析:收集过去一定时期(例如5年)内,涉及与Aiolos Bio类似的生物技术初创公司的并购(M&A)的媒体报道。使用自然语言处理工具或机器学习算法提取每篇文章的正面/负面情绪。将这些得分与制药行业内并购的历史平均得分进行比较;如果它们有显著偏差,则可能表明投资者对未来交易的乐观或悲观情绪加剧。
4. 宏观经济因素分析:跟踪制药行业主要参与者所在不同国家的关键经济指标,如GDP增长率、通货膨胀率、利率、汇率、失业率等。评估这些变量与制药股票表现变化之间的相关性,以了解它们对更广泛经济条件的敏感性。
5. 行业特定因素分析:跟踪医疗保健行业的最新发展,如监管环境的变化、专利到期、药物发现技术的进步和定价政策等。评估这些事件对参与类似交易的公司估值的影响程度,并确定影响整个行业的共同模式。
6. 回归建模:开发多元线性回归模型,将上述所有确定的驱动因素作为自变量,因变量可以是单个公司的股票回报或代表整个制药行业的指数水平变化。使用反向消除技术得出最简约的模型,该模型在仅保留具有统计学意义的预测变量的同时,解释因变量的最大变化。这将帮助我们分离出每个因素(包括上述新闻事件)的独特贡献。
7. 蒙特卡罗模拟:最后,根据最终回归模型的估计系数运行蒙特卡罗模拟,通过生成数千个反映每个驱动变量分布假设的随机样本。通过多次重复该过程,我们可以获得在各种情景下考虑参数估计不确定性的预测结果的概率分布。
8. 结论:根据上述分析结果,推断此次交易对同一领域可比公司或整个行业估值倍数的可能影响。考虑风险偏好和整个调查过程中使用的可用信息来源,为投资决策提供建议。
GPT - 4
(1).
近日,英国药企葛兰素史克(GSK.US)宣布,以10亿美元的首付款,以及4亿美元的里程碑付款,收购美国一家临床阶段生物制药服务商Aiolos Bio。GSK瞄准的,是Aiolos Bio唯一的核心管线——用于治疗成人哮喘的单克隆抗体AIO - 001。IO - 001管线并非Aiolos Bio自研,它授权自中国医药一哥——恒瑞医药。医药分析师称,总体来看,此次的AIO - 001单抗交易中,所谓“中间商赚差价”的说法有媒体炒作嫌疑,对“恒瑞医药轻易出手”的观点,他表示:“一个(Aiolos Bio)是赌博,下注,几年吃一次大单;一个(恒瑞医药)是制造业顺便做海外增量。大家做的完全不是一个生意,恒瑞依然是赚钱方。”(澎湃新闻)
Which industry sectors or investment targets may the above news affect?
ANS:
葛兰素史克(GSK)收购Aiolos Bio的新闻,涉及从恒瑞医药授权的单克隆抗体疗法(AIO - 001),可能会影响多个行业板块和投资目标:
- 制药和生物技术行业:此次收购直接影响制药和生物技术行业。参与单克隆抗体疗法,特别是专注于哮喘等呼吸道疾病的公司,可能会受到更多关注。
- 医疗保健投资:这一举措可能会影响医疗保健行业的投资策略,特别是在开发类似治疗方法或从事创新研究的公司方面。
- 中国制药公司:鉴于AIO - 001是从中国领先的制药公司恒瑞医药授权的,这笔交易可能会吸引人们对中国制药公司作为潜在合作伙伴或授权协议目标的关注。
- 临床阶段生物制药公司:此次收购凸显了临床阶段生物制药公司的价值,特别是那些在其产品线中有有前景的候选药物的公司。
- 呼吸道疾病治疗:开发呼吸道疾病治疗方法,特别是哮喘治疗方法的公司,可能会获得投资者的关注,因为此次收购凸显了该领域的市场潜力。
- 跨境医疗保健交易:这笔交易反映了医疗保健行业跨境合作和收购的增长趋势。促进或受益于此类国际合作的公司可能会受到影响。
- 医疗保健授权和知识产权管理:制药合作中授权协议和知识产权的作用可能会受到更多关注,影响专门从事这些领域的公司。
这些行业的投资者和公司应密切关注与此次收购相关的发展,以寻找潜在机会,并评估其对自身战略和运营的影响。
******************************************************************************
(2). 近日,英国药企葛兰素史克(GSK.US)宣布,以10亿美元的首付款,以及4亿美元的里程碑付款,收购美国一家临床阶段生物制药服务商Aiolos Bio。GSK瞄准的,是Aiolos Bio唯一的核心管线——用于治疗成人哮喘的单克隆抗体AIO - 001。IO - 001管线并非Aiolos Bio自研,它授权自中国医药一哥——恒瑞医药。医药分析师称,总体来看,此次的AIO - 001单抗交易中,所谓“中间商赚差价”的说法有媒体炒作嫌疑,对“恒瑞医药轻易出手”的观点,他表示:“一个(Aiolos Bio)是赌博,下注,几年吃一次大单;一个(恒瑞医药)是制造业顺便做海外增量。大家做的完全不是一个生意,恒瑞依然是赚钱方。”(澎湃新闻)
Please design a quantitative method to study the impact of the above news on the pharmaceutical industry. And accordingly explain what data needs to be used.
ANS:
为了研究葛兰素史克(GSK)收购Aiolos Bio对制药行业的影响,我们可以设计一个涵盖几个关键方面的定量方法。以下是一个结构化的方法:
1. 事件研究方法:
目标:分析股票市场对收购公告的反应。
所需数据:
- 葛兰素史克、Aiolos Bio、恒瑞医药和其他相关制药公司的每日股票价格。
- 同一时期的市场指数(例如标准普尔500指数、纳斯达克生物技术指数)。
分析:
- 计算公告日期前后一段时间内的异常回报(AR)和累积异常回报(CAR)。
- 将葛兰素史克和其他公司的表现与整体市场进行比较。
2. 产品线影响分析:
目标:评估AIO - 001在葛兰素史克和恒瑞医药产品线中的战略价值。
所需数据:
- AIO - 001的临床试验阶段、成功率和市场潜力的信息。
- 葛兰素史克和恒瑞医药当前的产品线组合数据。
分析:
- 预测AIO - 001未来的收入流。
- 评估AIO - 001在收购公司产品线中的多元化和战略契合度。
3. 行业情绪分析:
目标:评估行业对这笔交易的反应。
所需数据:
- 公告前后的新闻文章、新闻稿和分析师报告。
- 社交媒体情绪分析。
分析:
- 使用自然语言处理(NLP)技术分析情绪。
- 识别行业利益相关者提出的主要主题和担忧。
4. 竞争对手反应分析:
目标:了解竞争对手可能的反应。
所需数据:
- 关键竞争对手的市场份额、研发支出和战略举措。
- 行业趋势和创新指标。
分析:
- 确定公告后竞争策略的任何变化。
- 评估新合作或并购活动的可能性。
5. 监管影响评估:
目标:评估收购的监管影响。
所需数据:
- 与交易相关的监管文件和批准。
- 类似收购及其监管结果的历史数据。
分析:
- 评估监管挑战的可能性。
- 了解监管变化对交易成功的影响。
数据来源:
- 金融数据来自彭博社、雅虎财经或路透社等数据库。
- 临床试验数据来自ClinicalTrials.gov等公共数据库或公司报告。
- 行业报告和出版物用于市场趋势和分析。
- 社交媒体数据和在线新闻存档用于情绪分析。
- 监管文件来自美国食品药品监督管理局(FDA)或欧洲药品管理局(EMA)等政府网站。
结论:
这种定量方法结合了财务分析、战略评估、情绪分析、竞争格局评估和监管考虑。它提供了一个全面的视角,展示了此次收购对葛兰素史克、Aiolos Bio、恒瑞医药和更广泛的制药行业的影响。通过利用不同的数据来源和分析技术,利益相关者可以做出明智的决策,并有效地制定应对这一重大行业事件的策略。
****************************************************************************
(3). 近日,英国药企葛兰素史克(GSK.US)宣布,以10亿美元的首付款,以及4亿美元的里程碑付款,收购美国一家临床阶段生物制药服务商Aiolos Bio。GSK瞄准的,是Aiolos Bio唯一的核心管线——用于治疗成人哮喘的单克隆抗体AIO - 001。IO - 001管线并非Aiolos Bio自研,它授权自中国医药一哥——恒瑞医药。医药分析师称,总体来看,此次的AIO - 001单抗交易中,所谓“中间商赚差价”的说法有媒体炒作嫌疑,对“恒瑞医药轻易出手”的观点,他表示:“一个(Aiolos Bio)是赌博,下注,几年吃一次大单;一个(恒瑞医药)是制造业顺便做海外增量。大家做的完全不是一个生意,恒瑞依然是赚钱方。”(澎湃新闻)
Based on the following data, please design a specific set of quantitative methods to quantitatively analyze the impact of the above news on the pharmaceutical industry.
Financial data from databases like Bloomberg, Yahoo Finance, or Reuters.
Clinical trial data from public databases like ClinicalTrials.gov or company reports.
Industry reports and publications for market trends and analyses.
Social media data and online news archives for sentiment analysis.
Regulatory filings from government websites like the FDA or EMA.
ANS:
为了定量分析葛兰素史克收购Aiolos Bio的新闻及其对制药行业的影响,我们可以设计一个多方面的方法,结合不同的数据来源和分析技术。以下是一个结构化的方法:
财务数据分析:
- 股票表现:使用彭博社、雅虎财经或路透社跟踪收购公告前后葛兰素史克、Aiolos Bio和恒瑞医药的股票价格。分析波动率、交易量和任何异常回报。
- 财务健康指标:检查关键财务指标,如市盈率(P/E)、息税折旧摊销前利润(EBITDA)、收入增长率和研发支出,以评估这些公司的财务健康状况。
- 同行比较:将这些指标与制药行业的其他公司进行比较,以了解更广泛的市场反应。
临床试验数据评估:
- 产品线分析:使用ClinicalTrials.gov或公司报告检查AIO - 001的临床试验细节,包括阶段、入组人数和研究结果。
- 比较疗效和安全性:将AIO - 001的临床试验数据与现有的哮喘治疗方法进行比较,以评估其潜在的市场影响。
- 开发时间表:评估AIO - 001的预计上市时间和潜在的监管障碍。
市场趋势分析:
- 行业报告:利用行业报告了解哮喘治疗和单克隆抗体疗法的当前趋势。
- 市场规模和增长预测:分析AIO - 001如何影响哮喘治疗市场的规模、增长率和竞争格局。
情绪分析:
- 社交媒体和新闻情绪:对社交媒体平台和在线新闻存档进行情绪分析,以评估公众和投资者对此次收购的情绪。
- 专家意见:分析行业分析师和医学专家的意见和预测,以了解AIO - 001的感知价值和潜力。
监管文件审查:
- 美国食品药品监督管理局(FDA)和欧洲药品管理局(EMA)文件:检查来自FDA(美国)和EMA(欧洲)的监管文件和通信,以了解AIO - 001的监管状态和任何挑战。
- 知识产权状态:审查与AIO - 001相关的专利和知识产权文件,以评估其法律和竞争地位。
数据整合和预测建模:
- 数据整合:将这些不同来源的数据结合起来,形成一个全面的图景。
- 预测分析:使用统计模型和机器学习算法预测AIO - 001的潜在市场影响以及此次收购对相关公司和更广泛制药行业的长期影响。
持续监测和调整:
- 定期更新:持续监测这些数据源以获取新信息,并相应调整分析。
- 情景分析:进行情景分析,以预测潜在的未来发展及其影响。
这种结构化的方法可以提供一个全面和可量化的理解,即这一重大行业事件如何影响制药行业格局。
📄 许可证
本项目采用Apache - 2.0许可证。



