模型概述
模型特點
模型能力
使用案例
🚀 深度財經模型(Deepmoney)
Deepmoney 是一款專門為金融投資領域打造的大模型。它突破了傳統金融模型僅依賴公開知識訓練的侷限,能更精準地對市場變化做出反應,為投資者提供更具價值的投資分析和決策支持。
Sft版本:
本模型屬於“七宗罪”系列模型中的“貪婪(Greed)”模型,具備以下特性:
- 在Yi - 34b上進行全參數預訓練。
- 採用高質量的研究報告數據。
- 經過高端的數據清洗流程。
🚀 快速開始
本模型旨在為金融投資領域提供更有效的分析工具。在當前金融市場中,大多數所謂的金融模型主要基於公開知識進行訓練,然而這些公開知識對於市場的可解釋性往往不足。而 Deepmoney 模型通過獨特的數據選擇和訓練方式,能夠更好地應對市場變化,為投資者提供更有價值的投資建議。
✨ 主要特性
- 全參數預訓練:在Yi - 34b上進行全參數預訓練,使模型能夠掌握大量的金融知識和分析方法。
- 高質量數據:選用高質量的研究報告數據,這些數據來自多種渠道,包括傳統券商和專業研究機構,確保模型訓練數據的有效性和實用性。
- 高端清洗流程:對訓練數據進行高端清洗,去除無效和錯誤信息,提高模型的準確性和可靠性。
📚 詳細文檔
1. 模型目標
當下大多數金融模型基於公開知識訓練,如普通教材、入門分析師考試資料和公司公開報告等。但在實際金融領域,這些公開知識對市場的可解釋性嚴重不足。例如,凱恩斯、弗裡德曼的經濟理論以及當下行為金融學的各類主張,在這些普通訓練數據中往往體現不足。因此,大多數金融模型難以做出有效的投資判斷。
而本模型作為整個投資分析流程的基礎模型,計劃搭配信息蒐集者、標的判斷者、定性分析者、定量分析者和數據提取者等模型,共同完成投資分析任務。模型本身需要掌握大量的定性和定量分析方法,以應對複雜多變的金融市場。
2. 數據來源
公開知識雖然有一定價值,但有效性存在疑問。本模型的訓練數據主要包括兩部分:
- 專業書籍:挑選了一些大學教材和專業書籍,數量不多但質量較高。
- 研究報告:選取了2019 - 2023年12月期間的大量研究報告數據,這些報告由多種發佈者提供,包括傳統券商和專業研究機構,且大多為付費內容,僅對機構開放。
為了從研究報告中提取數據(大多以圖形或表格形式呈現),嘗試了多種多模態模型,發現cog - agent和emu2效果較好。同時,為了更好地提取信息,還創建了一套將研究報告上下文總結作為提示(prompt)一部分的流程。最終,將這些數據進行混合,未使用通識數據,因為模型專注於金融投資領域。
3. 訓練方式
採用原始文本進行全參數訓練,基座模型選用長上下文的yi - 34b - 200k,這有助於模型理解和處理深度的金融研究報告。此外,還進行了一次監督微調(SFT),微調後的模型在實際應用中表現出色。
4. 模型評估
通過採樣最近發生的事件,模擬真實世界中事件驅動的證券分析流程,對 Deepmoney 和GPT - 4進行對比測試。由於事件對市場的影響較為隱形,且評估產出需要使用多種定量方法,因此將測試結果展示如下,供大家對模型的生產結果進行感性評價。
具體流程如下:
- 擁有一套全球新聞爬取系統,對爬取的新聞進行去重和主客觀判斷,可通過傳統的BERT模型完成。
- 對於 Deepmoney 模型,使用三個步驟處理傳入的新聞:
- 主觀判斷:判斷新聞可能影響的行業板塊或投資標的,這主要依賴模型的主觀分析能力。
- 設計定量方法:根據新聞內容,設計一套定量方法研究新聞對特定行業的影響,並說明所需數據。
- 具體定量分析:根據給定數據,設計具體的定量方法,對新聞對特定行業的影響進行定量分析。
以下是 Deepmoney 和GPT - 4針對某一新聞的三步回答示例:
Deepmoney
(1).
近日,英國藥企葛蘭素史克(GSK.US)宣佈,以10億美元的首付款,以及4億美元的里程碑付款,收購美國一家臨床階段生物製藥服務商Aiolos Bio。GSK瞄準的,是Aiolos Bio唯一的核心管線——用於治療成人哮喘的單克隆抗體AIO - 001。IO - 001管線並非Aiolos Bio自研,它授權自中國醫藥一哥——恆瑞醫藥。醫藥分析師稱,總體來看,此次的AIO - 001單抗交易中,所謂“中間商賺差價”的說法有媒體炒作嫌疑,對“恆瑞醫藥輕易出手”的觀點,他表示:“一個(Aiolos Bio)是賭博,下注,幾年吃一次大單;一個(恆瑞醫藥)是製造業順便做海外增量。大家做的完全不是一個生意,恆瑞依然是賺錢方。”(澎湃新聞)
Which industry sectors or investment targets may the above news affect?
ANS:
上述新聞主要影響製藥、生物技術和醫療保健行業。該新聞涉及葛蘭素史克收購Aiolos Bio,後者專注於使用名為AIO - 001的單克隆抗體開發哮喘治療方法。此交易對這些行業中可能參與類似交易或合作以擴展產品線和市場份額的公司也有影響。
******************************************************************************
(2). 近日,英國藥企葛蘭素史克(GSK.US)宣佈,以10億美元的首付款,以及4億美元的里程碑付款,收購美國一家臨床階段生物製藥服務商Aiolos Bio。GSK瞄準的,是Aiolos Bio唯一的核心管線——用於治療成人哮喘的單克隆抗體AIO - 001。IO - 001管線並非Aiolos Bio自研,它授權自中國醫藥一哥——恆瑞醫藥。醫藥分析師稱,總體來看,此次的AIO - 001單抗交易中,所謂“中間商賺差價”的說法有媒體炒作嫌疑,對“恆瑞醫藥輕易出手”的觀點,他表示:“一個(Aiolos Bio)是賭博,下注,幾年吃一次大單;一個(恆瑞醫藥)是製造業順便做海外增量。大家做的完全不是一個生意,恆瑞依然是賺錢方。”(澎湃新聞)
Please design a quantitative method to study the impact of the above news on the pharmaceutical industry. And accordingly explain what data needs to be used.
ANS:
為了定量分析此次收購新聞對製藥行業的影響,我們可以使用迴歸分析或其他統計建模技術。關鍵是確定可能影響製藥行業股票價格的自變量,然後確定每個變量對股票價格變化的影響程度。
以下是設計這種定量方法的步驟概述:
步驟1:數據收集
從彭博社、雅虎財經等各種來源收集你希望研究的時間段(例如季度或年度)的歷史數據。以下是一些可能需要的數據集列表:
- 與製藥行業相關的本地(例如標準普爾製藥指數)和全球(例如標準普爾全球醫療保健指數)股票市場指數。
- 與葛蘭素史克/Aiolos Bio處於同一領域且受其收購影響的主要參與者的財務績效指標。
- 過去類似交易的新聞情緒得分。
- 宏觀經濟因素,如GDP增長率、通貨膨脹率、利率等。
- 行業特定因素,如研發支出趨勢、監管環境變化、專利到期等。
步驟2:模型選擇
收集所有相關信息後,根據因變量和自變量之間關係的性質選擇合適的計量經濟模型。如果線性假設成立,普通最小二乘法迴歸將適用;否則,也可以考慮Logit/Probit模型。
步驟3:變量選擇
使用方差膨脹因子(VIF)值檢查變量之間的多重共線性後,選擇合適的解釋變量。這將幫助我們瞭解哪些變量對股票回報有顯著影響。
步驟4:假設檢驗
進行假設檢驗,如F檢驗、t檢驗、杜賓 - 沃森檢驗等,以檢查我們選擇的迴歸變量在不同顯著性水平下是否具有統計學意義。
步驟5:係數解釋
解釋從步驟4中獲得的係數,同時要記住符號和大小必須與經濟理論一致。正係數表示正相關,而負係數表示負相關。
步驟6:模型評估
評估擬合優度指標,如R²、調整後的R²、赤池信息準則(AIC)、貝葉斯信息準則(BIC)、均方根誤差(RMSE)、平均絕對偏差(MAD)等,以確定模型的擬合度。
步驟7:預測
使用估計的參數和未來外生變量值,預測任何給定時間段的未來結果。
總之,這種定量方法旨在通過研究此次收購對製藥行業多家公司的股票價格和財務績效的影響,來衡量葛蘭素史克收購對整個製藥行業的影響。
****************************************************************************
(3). 近日,英國藥企葛蘭素史克(GSK.US)宣佈,以10億美元的首付款,以及4億美元的里程碑付款,收購美國一家臨床階段生物製藥服務商Aiolos Bio。GSK瞄準的,是Aiolos Bio唯一的核心管線——用於治療成人哮喘的單克隆抗體AIO - 001。IO - 001管線並非Aiolos Bio自研,它授權自中國醫藥一哥——恆瑞醫藥。醫藥分析師稱,總體來看,此次的AIO - 001單抗交易中,所謂“中間商賺差價”的說法有媒體炒作嫌疑,對“恆瑞醫藥輕易出手”的觀點,他表示:“一個(Aiolos Bio)是賭博,下注,幾年吃一次大單;一個(恆瑞醫藥)是製造業順便做海外增量。大家做的完全不是一個生意,恆瑞依然是賺錢方。”(澎湃新聞)
Based on the following data, please design a specific set of quantitative methods to quantitatively analyze the impact of the above news on the pharmaceutical industry.
* Stock market indices related to pharmaceutical industries both locally (e.g., S&P Pharmaceutical Index) and globally (e.gs&p Global Healthcare Index)
* Financial performance indicators of major players within the same space as GSK/Aiolos Bio and those affected by their acquisitions
* News sentiment scores around similar deals in the past
* Macroeconomic factors like GDP growth rate, inflation rates, interest rates, etc.
* Industry specific factors like R&D spending trends, regulatory environment changes, patent expirations, etc.
ANS:
為了定量分析此新聞對製藥行業的影響,我們可以使用多種定量方法,包括分析股票價格、財務績效指標、新聞情緒得分、宏觀經濟因素和行業特定因素。以下是具體的操作方法:
1. 股票市場指數分析:監測收購公告前後,與製藥行業相關的本地(如標準普爾製藥指數)和全球(如標準普爾全球醫療保健指數)股票市場指數的每日或每週波動。使用迴歸分析、方差分析(ANOVA)測試或時間序列分析等統計技術分析這些波動,以確定此次事件是否導致了顯著的價格變動。
2. 財務績效指標分析:檢查在收購公告前,與Aiolos Bio和葛蘭素史克在同一治療領域運營的其他公司的財務績效指標。這些指標可能包括收入增長率、淨利潤率、淨資產收益率(ROE)比率、每股收益(EPS)等。然後將這些指標與收購後的數字進行比較,以查看交易是否導致了明顯的差異。你還可以觀察同一領域公司的整體盈利能力趨勢,以評估其對投資者信心的潛在影響。
3. 新聞情緒得分分析:收集過去一定時期(例如5年)內,涉及與Aiolos Bio類似的生物技術初創公司的併購(M&A)的媒體報道。使用自然語言處理工具或機器學習算法提取每篇文章的正面/負面情緒。將這些得分與製藥行業內併購的歷史平均得分進行比較;如果它們有顯著偏差,則可能表明投資者對未來交易的樂觀或悲觀情緒加劇。
4. 宏觀經濟因素分析:跟蹤製藥行業主要參與者所在不同國家的關鍵經濟指標,如GDP增長率、通貨膨脹率、利率、匯率、失業率等。評估這些變量與製藥股票表現變化之間的相關性,以瞭解它們對更廣泛經濟條件的敏感性。
5. 行業特定因素分析:跟蹤醫療保健行業的最新發展,如監管環境的變化、專利到期、藥物發現技術的進步和定價政策等。評估這些事件對參與類似交易的公司估值的影響程度,並確定影響整個行業的共同模式。
6. 迴歸建模:開發多元線性迴歸模型,將上述所有確定的驅動因素作為自變量,因變量可以是單個公司的股票回報或代表整個製藥行業的指數水平變化。使用反向消除技術得出最簡約的模型,該模型在僅保留具有統計學意義的預測變量的同時,解釋因變量的最大變化。這將幫助我們分離出每個因素(包括上述新聞事件)的獨特貢獻。
7. 蒙特卡羅模擬:最後,根據最終迴歸模型的估計係數運行蒙特卡羅模擬,通過生成數千個反映每個驅動變量分佈假設的隨機樣本。通過多次重複該過程,我們可以獲得在各種情景下考慮參數估計不確定性的預測結果的概率分佈。
8. 結論:根據上述分析結果,推斷此次交易對同一領域可比公司或整個行業估值倍數的可能影響。考慮風險偏好和整個調查過程中使用的可用信息來源,為投資決策提供建議。
GPT - 4
(1).
近日,英國藥企葛蘭素史克(GSK.US)宣佈,以10億美元的首付款,以及4億美元的里程碑付款,收購美國一家臨床階段生物製藥服務商Aiolos Bio。GSK瞄準的,是Aiolos Bio唯一的核心管線——用於治療成人哮喘的單克隆抗體AIO - 001。IO - 001管線並非Aiolos Bio自研,它授權自中國醫藥一哥——恆瑞醫藥。醫藥分析師稱,總體來看,此次的AIO - 001單抗交易中,所謂“中間商賺差價”的說法有媒體炒作嫌疑,對“恆瑞醫藥輕易出手”的觀點,他表示:“一個(Aiolos Bio)是賭博,下注,幾年吃一次大單;一個(恆瑞醫藥)是製造業順便做海外增量。大家做的完全不是一個生意,恆瑞依然是賺錢方。”(澎湃新聞)
Which industry sectors or investment targets may the above news affect?
ANS:
葛蘭素史克(GSK)收購Aiolos Bio的新聞,涉及從恆瑞醫藥授權的單克隆抗體療法(AIO - 001),可能會影響多個行業板塊和投資目標:
- 製藥和生物技術行業:此次收購直接影響製藥和生物技術行業。參與單克隆抗體療法,特別是專注於哮喘等呼吸道疾病的公司,可能會受到更多關注。
- 醫療保健投資:這一舉措可能會影響醫療保健行業的投資策略,特別是在開發類似治療方法或從事創新研究的公司方面。
- 中國製藥公司:鑑於AIO - 001是從中國領先的製藥公司恆瑞醫藥授權的,這筆交易可能會吸引人們對中國製藥公司作為潛在合作伙伴或授權協議目標的關注。
- 臨床階段生物製藥公司:此次收購凸顯了臨床階段生物製藥公司的價值,特別是那些在其產品線中有有前景的候選藥物的公司。
- 呼吸道疾病治療:開發呼吸道疾病治療方法,特別是哮喘治療方法的公司,可能會獲得投資者的關注,因為此次收購凸顯了該領域的市場潛力。
- 跨境醫療保健交易:這筆交易反映了醫療保健行業跨境合作和收購的增長趨勢。促進或受益於此類國際合作的公司可能會受到影響。
- 醫療保健授權和知識產權管理:製藥合作中授權協議和知識產權的作用可能會受到更多關注,影響專門從事這些領域的公司。
這些行業的投資者和公司應密切關注與此次收購相關的發展,以尋找潛在機會,並評估其對自身戰略和運營的影響。
******************************************************************************
(2). 近日,英國藥企葛蘭素史克(GSK.US)宣佈,以10億美元的首付款,以及4億美元的里程碑付款,收購美國一家臨床階段生物製藥服務商Aiolos Bio。GSK瞄準的,是Aiolos Bio唯一的核心管線——用於治療成人哮喘的單克隆抗體AIO - 001。IO - 001管線並非Aiolos Bio自研,它授權自中國醫藥一哥——恆瑞醫藥。醫藥分析師稱,總體來看,此次的AIO - 001單抗交易中,所謂“中間商賺差價”的說法有媒體炒作嫌疑,對“恆瑞醫藥輕易出手”的觀點,他表示:“一個(Aiolos Bio)是賭博,下注,幾年吃一次大單;一個(恆瑞醫藥)是製造業順便做海外增量。大家做的完全不是一個生意,恆瑞依然是賺錢方。”(澎湃新聞)
Please design a quantitative method to study the impact of the above news on the pharmaceutical industry. And accordingly explain what data needs to be used.
ANS:
為了研究葛蘭素史克(GSK)收購Aiolos Bio對製藥行業的影響,我們可以設計一個涵蓋幾個關鍵方面的定量方法。以下是一個結構化的方法:
1. 事件研究方法:
目標:分析股票市場對收購公告的反應。
所需數據:
- 葛蘭素史克、Aiolos Bio、恆瑞醫藥和其他相關製藥公司的每日股票價格。
- 同一時期的市場指數(例如標準普爾500指數、納斯達克生物技術指數)。
分析:
- 計算公告日期前後一段時間內的異常回報(AR)和累積異常回報(CAR)。
- 將葛蘭素史克和其他公司的表現與整體市場進行比較。
2. 產品線影響分析:
目標:評估AIO - 001在葛蘭素史克和恆瑞醫藥產品線中的戰略價值。
所需數據:
- AIO - 001的臨床試驗階段、成功率和市場潛力的信息。
- 葛蘭素史克和恆瑞醫藥當前的產品線組合數據。
分析:
- 預測AIO - 001未來的收入流。
- 評估AIO - 001在收購公司產品線中的多元化和戰略契合度。
3. 行業情緒分析:
目標:評估行業對這筆交易的反應。
所需數據:
- 公告前後的新聞文章、新聞稿和分析師報告。
- 社交媒體情緒分析。
分析:
- 使用自然語言處理(NLP)技術分析情緒。
- 識別行業利益相關者提出的主要主題和擔憂。
4. 競爭對手反應分析:
目標:瞭解競爭對手可能的反應。
所需數據:
- 關鍵競爭對手的市場份額、研發支出和戰略舉措。
- 行業趨勢和創新指標。
分析:
- 確定公告後競爭策略的任何變化。
- 評估新合作或併購活動的可能性。
5. 監管影響評估:
目標:評估收購的監管影響。
所需數據:
- 與交易相關的監管文件和批准。
- 類似收購及其監管結果的歷史數據。
分析:
- 評估監管挑戰的可能性。
- 瞭解監管變化對交易成功的影響。
數據來源:
- 金融數據來自彭博社、雅虎財經或路透社等數據庫。
- 臨床試驗數據來自ClinicalTrials.gov等公共數據庫或公司報告。
- 行業報告和出版物用於市場趨勢和分析。
- 社交媒體數據和在線新聞存檔用於情緒分析。
- 監管文件來自美國食品藥品監督管理局(FDA)或歐洲藥品管理局(EMA)等政府網站。
結論:
這種定量方法結合了財務分析、戰略評估、情緒分析、競爭格局評估和監管考慮。它提供了一個全面的視角,展示了此次收購對葛蘭素史克、Aiolos Bio、恆瑞醫藥和更廣泛的製藥行業的影響。通過利用不同的數據來源和分析技術,利益相關者可以做出明智的決策,並有效地制定應對這一重大行業事件的策略。
****************************************************************************
(3). 近日,英國藥企葛蘭素史克(GSK.US)宣佈,以10億美元的首付款,以及4億美元的里程碑付款,收購美國一家臨床階段生物製藥服務商Aiolos Bio。GSK瞄準的,是Aiolos Bio唯一的核心管線——用於治療成人哮喘的單克隆抗體AIO - 001。IO - 001管線並非Aiolos Bio自研,它授權自中國醫藥一哥——恆瑞醫藥。醫藥分析師稱,總體來看,此次的AIO - 001單抗交易中,所謂“中間商賺差價”的說法有媒體炒作嫌疑,對“恆瑞醫藥輕易出手”的觀點,他表示:“一個(Aiolos Bio)是賭博,下注,幾年吃一次大單;一個(恆瑞醫藥)是製造業順便做海外增量。大家做的完全不是一個生意,恆瑞依然是賺錢方。”(澎湃新聞)
Based on the following data, please design a specific set of quantitative methods to quantitatively analyze the impact of the above news on the pharmaceutical industry.
Financial data from databases like Bloomberg, Yahoo Finance, or Reuters.
Clinical trial data from public databases like ClinicalTrials.gov or company reports.
Industry reports and publications for market trends and analyses.
Social media data and online news archives for sentiment analysis.
Regulatory filings from government websites like the FDA or EMA.
ANS:
為了定量分析葛蘭素史克收購Aiolos Bio的新聞及其對製藥行業的影響,我們可以設計一個多方面的方法,結合不同的數據來源和分析技術。以下是一個結構化的方法:
財務數據分析:
- 股票表現:使用彭博社、雅虎財經或路透社跟蹤收購公告前後葛蘭素史克、Aiolos Bio和恆瑞醫藥的股票價格。分析波動率、交易量和任何異常回報。
- 財務健康指標:檢查關鍵財務指標,如市盈率(P/E)、息稅折舊攤銷前利潤(EBITDA)、收入增長率和研發支出,以評估這些公司的財務健康狀況。
- 同行比較:將這些指標與製藥行業的其他公司進行比較,以瞭解更廣泛的市場反應。
臨床試驗數據評估:
- 產品線分析:使用ClinicalTrials.gov或公司報告檢查AIO - 001的臨床試驗細節,包括階段、入組人數和研究結果。
- 比較療效和安全性:將AIO - 001的臨床試驗數據與現有的哮喘治療方法進行比較,以評估其潛在的市場影響。
- 開發時間表:評估AIO - 001的預計上市時間和潛在的監管障礙。
市場趨勢分析:
- 行業報告:利用行業報告瞭解哮喘治療和單克隆抗體療法的當前趨勢。
- 市場規模和增長預測:分析AIO - 001如何影響哮喘治療市場的規模、增長率和競爭格局。
情緒分析:
- 社交媒體和新聞情緒:對社交媒體平臺和在線新聞存檔進行情緒分析,以評估公眾和投資者對此次收購的情緒。
- 專家意見:分析行業分析師和醫學專家的意見和預測,以瞭解AIO - 001的感知價值和潛力。
監管文件審查:
- 美國食品藥品監督管理局(FDA)和歐洲藥品管理局(EMA)文件:檢查來自FDA(美國)和EMA(歐洲)的監管文件和通信,以瞭解AIO - 001的監管狀態和任何挑戰。
- 知識產權狀態:審查與AIO - 001相關的專利和知識產權文件,以評估其法律和競爭地位。
數據整合和預測建模:
- 數據整合:將這些不同來源的數據結合起來,形成一個全面的圖景。
- 預測分析:使用統計模型和機器學習算法預測AIO - 001的潛在市場影響以及此次收購對相關公司和更廣泛製藥行業的長期影響。
持續監測和調整:
- 定期更新:持續監測這些數據源以獲取新信息,並相應調整分析。
- 情景分析:進行情景分析,以預測潛在的未來發展及其影響。
這種結構化的方法可以提供一個全面和可量化的理解,即這一重大行業事件如何影響製藥行業格局。
📄 許可證
本項目採用Apache - 2.0許可證。



