在投资组合管理中应用大型语言模型(LLM):创建主题宇宙指数
由googleglass创建,最终由googleglass 被浏览 4 用户
在这篇文章中,我们将探讨大型语言模型(LLM)在金融领域的应用,涵盖以下主题:
- 量化金融
- 投资组合管理
- 情感分析
- 新闻分析
- OpenAI API和Python
我们将展示如何将LLM与OpenAI API和Python等工具结合使用,以简化生成主题投资组合和分析趋势等流程,从而做出更明智的投资决策。
如果你对以下内容感兴趣,那么这篇博客适合你:
- 创意:学习在金融和量化分析中应用LLM的创新方式。
- 实施:获得将LLM集成到新闻交易策略、情感分析、主题投资或自动化金融研究等任务中的实用指导。
- 效率:发现LLM如何简化量化投资组合管理和金融分析中的复杂、耗时的工作流程。
- \
先决条件
- 你已经基本了解如何使用ChatGPT/QUANTCHAT进行交易。你知道如何编写提示来创建简单的Python代码,并能够进一步增强它。
- 你已经阅读了关于使用LLM进行交易的内容。你了解一些生成性AI和金融/交易中的情感分析如何帮助交易者在动荡的市场环境中找到优势的例子。
如何使用GenAI创建投资组合策略的主题宇宙
什么是主题指数投资?
主题投资专注于捕捉长期趋势、颠覆性技术或与投资者偏好一致的特定行业。一种流行的策略是主题指数投资,投资者关注符合某些标准的公司,例如可持续性、技术采用或人口趋势。
在这篇博客中,我们展示了如何为开发AI解决方案的医疗保健公司创建主题宇宙。手动进行此类研究既耗时又耗费资源,而且容易出现疏漏。通过利用生成性AI(GenAI),我们可以自动化这个过程,提取有意义的洞察,并创建与我们主题目标一致的公司候选名单。
主题焦点:医疗保健和AI
假设我们想要投资积极开发AI解决方案的医疗保健公司。这是一个非常相关的主题,因为AI正成为诊断、治疗和医学研究进步的关键组成部分。
问题说明
手动识别和分析符合这一主题的公司需要梳理:
- 像标普500这样的大型数据集。
- 特定行业的信息,例如医疗保健公司。
- 新闻文章或公司报告等公开可用的信息。
这个过程不仅资源密集,而且容易出错。
使用GenAI的方法
通过使用生成性AI,我们自动化这个过程:
- 获取标普500数据并按行业过滤,隔离医疗保健公司。
- 获取股票代码的新闻。
- 分析每家公司的可用信息,例如:
- 解决方案:他们提供的产品和服务。
- 技术:他们正在利用的具体工具或平台。
- 研发:正在开发的创新。
- 根据公开可用的信息,如新闻文章,总结这些公司如何使用AI。
- 筛选与医疗保健和AI主题目标一致的公司。
结果
- 初始宇宙:在按行业过滤后,标普500包含62家医疗保健公司。
- 最终主题宇宙:应用GenAI驱动的过程后,我们确定了19家积极开发或使用AI解决方案的公司。
- 时间效率:手动研究可能需要数小时或数天,而使用提供的代码在几分钟内就完成了。
使用的API
- OpenAI API:一个付费服务,为生成性AI分析提供动力,用于总结和分类公司信息。
- NewsAPI:一个免费的开发者版本(https://newsapi.org/),每天有100次请求的限制,用于获取与公司相关的新闻文章。
免责声明
- 这篇博客和代码仅用于教育和研究目的。
- 我们不推广或支持本博客中提到的任何公司、品牌或产品。
- 一些信息是LLM生成的,可能需要交叉验证以确保准确性。
- 这不是投资建议,也不应被解释为投资任何提及公司的建议。
如何使用GenAI创建投资组合策略的主题宇宙?
通过这种方法,我们展示了如何使用生成性AI简化为投资组合策略创建主题宇宙的过程,并确定主题指数投资的潜在候选公司。
公司 | GICS行业 | GICS子行业 | 解决方案 | 技术 | 研发 | 符号 | 安全 | 总部位置 | 添加日期 | CIK | 成立年份 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 雅培实验室 | 医疗保健 | 医疗保健设备 | ['快速病原体检测的基因组测试。',...] | ['用于病原体检测的基因组测试技术... | [{'创新': '雅培实验室的Lingo设备... | ABT | 雅培实验室 | 伊利诺伊州北芝加哥 | 1957-03-04 | 1800 | 1888 |
1 | 艾伯维 | 医疗保健 | 生物技术 | ["ALIA-1758,一种用于治疗...的实验性抗体... | ["用于阿尔茨海默病的抗体疗法。"... | [{'创新': '艾伯维的Emraclidine,一种每日一次的... | ABBV | 艾伯维 | 伊利诺伊州北芝加哥 | 2012-12-31 | 1551152 | 2013 (1888) |
2 | 安捷伦科技 | 医疗保健 | 生命科学工具与服务 | ['实验室自动化样本稀释技术... | ['自动化样本稀释技术', 'Whole... | [{'创新': '全外显子组测序套件... | A | 安捷伦科技 | 加利福尼亚州圣克拉拉 | 2000-06-05 | 1090872 | 1999 |
3 | Align Technology | 医疗保健 | 医疗保健用品 | ['体外受精(IVF)服务', '自动化... | ['人工智能(AI)', '机器人手术... | [{'创新': 'AI驱动的机器人手术', ... | ALGN | Align Technology | 亚利桑那州坦佩 | 2017-06-19 | 1097149 | 1997 |
4 | 安进 | 医疗保健 | 生物技术 | ['减肥药、肥胖症药物、胆固醇... | ['实验性肥胖症药物(MariTide),口服... | [{'创新': 'MariTide(maridebart cafraglu... | AMGN | 安进 | 加利福尼亚州千橡市 | 1992-01-02 | 318154 | 1980 |
这项分析突出了19家在诊断、药物开发、患者护理、手术精度、研究、可持续性以及医疗保健工具等领域利用AI的医疗保健公司。该列表基于过去六个月的新闻,受到新闻API的数据访问限制。虽然可能有更多的公司超出这个范围,但精选的选择提供了一个专注的起点。
由LLM生成的分析可能包括幻觉、重叠或误解,需要手动验证以确保准确性。尽管如此,它通过缩小领域为更深入的探索节省了时间。
投资组合经理和交易者可以利用这个宇宙与量化工具一起识别市场机会,优化时机,多元化投资。专注于医疗保健的投资者可以战略性地超配具有高增长潜力的特定类别的公司,而交易者可以积极跟踪接近关键里程碑的公司,如药物批准,进行积极的监控和战略性市场进入。
总结
生成性AI正在通过提供创新工具来转变投资研究,以无与伦比的速度和精度揭示机会和趋势。
在这篇博客中,我们探讨了如何使用生成性AI为积极开发AI解决方案的医疗保健公司创建主题宇宙。我们的方法包括过滤标普500医疗保健公司,收集相关新闻,使用大型语言模型(LLM)进行分析,并以结构化格式提取关键信息。通过结合AI特定的关键词过滤器,我们识别了致力于创新技术和解决方案的公司。
这个过程生成了一个全面的数据库,概述了每家公司的解决方案、技术和研发工作。这样的数据库可以用来创建或完善主题。例如,专注于糖尿病/癌症解决方案的公司可以很容易地从现有方法中识别出来。传统上,对大型宇宙进行如此广泛的研究可能需要数周。然而,我们的分析在几分钟内就实现了专注的输出,显著减少了时间和劳动力。尽管如此,手动验证仍然至关重要,以确保准确性,因为洞察的质量在很大程度上依赖于可用数据和LLM模型。
对于投资者和交易者来说,这种方法为决策增添了新的维度。专注于医疗保健的投资者可以战略性地超配具有强劲增长潜力的特定类别的公司,而交易者可以积极跟踪接近关键里程碑的公司,如药物批准。通过将这种主题分析与量化工具结合起来,市场参与者可以更有效地优化时机、多元化投资,并发现可操作的机会。