隐秘AI巨头“幻方量化”：大模型，不止用来炒股｜焦点分析|焦点速看-非洲收藏网

隐秘AI巨头“幻方量化”：大模型，不止用来炒股｜焦点分析|焦点速看

日期：2023-04-21 09:59:31 来源：36氪

文｜周鑫雨

(资料图片仅供参考)

编辑｜苏建勋

4月14日，千亿量化私募巨头幻方量化公告称，将集中资源和力量，投身人工智能技术，成立新的独立研究组织，探索AGI（通用人工智能）。

当幻方量化的公告卷起“AI炒股说”之时，两天天后，幻方量化董事总经理陆政哲在朋友圈泼了盆冷水：“我用中文重申一下：AGI不是用来炒股的，有大得多的用处和大得多的价值。”

自概念诞生之初，量化投资就与AI挂了钩。与人为管理基金产品不同，量化投资仰赖的是数学和统计模型进行预测和风控，并通过计算机技术实现下单交易。

对于量化私募基金而言，准确性和速度是核心竞争力。这也意味着，一家量化私募基金需要在程序化技术上烧大量的钱——其一，需要专业人才搭建效果更优的预测和风控模型，其二，还需要使用处理速度更快的设备和与交易所服务器物理距离更近的服务器，以提升交易速度。

当“AGI不是用来炒股的”一句从幻方量化口中说出，一方面，我们有理由相信，拥有万张英伟达A100显卡储备的幻方量化具有训练出AGI的资源储备；但另一方面，在这一轮AI浪潮中，金融领域除了拥抱，别无选择。

非AI领域出身的金融机构，也能用大模型打仗

翻阅公开资料就能发现，高算力是不少量化机构宣传的重点。

比如2022年9月，头部量化私募基金明汯投资合伙人、投资总监解环宇就在世界人工智能大会上强调：“2021年，我们自有的高性能计算集群已经位居世界超算排名TOP500榜单前列。预计到今年（2022年）底，我们的计算集群将拥有1500张GPU卡，3万CPU核、1Pb内存以及5Pb磁盘存储，在金融数据的应用场景下AI算力达到400P Flops。”

重算力的特性与长期以来我国的算力资源较为分散不无关系，能够靠高性能算力集群支撑起模型训练的金融机构更是少之又少。

据《财经十一人》介绍，国内GPU持有量超过1万张的企业不超过5家，即使规模最大的企业也不超过5万枚，而且这里面有不少都是英伟达中低端数据中心芯片。

但幻方量化担得起金融领域“卡王”之称。

作为目前国内唯一公开宣称拥有万张英伟达A100显卡的企业，幻方量化即便出了金融圈，其算力储备量在一众科技公司中也豪不逊色。

2019年，幻方量化就成立了AI公司幻方AI。从2020年官方披露的数据来看，幻方AI自研的深度学习训练平台“萤火一号”总投资近2亿元，搭载了1100块GPU。

一年后，“萤火二号”的投入增加到10亿元，算力约为“萤火一号”的18倍，搭载了约1万张英伟达A100显卡。数据显示，“萤火二号”2022年全年运行任务135万个，共计5674万GPU时。用于科研支持的闲时算力高达1533万GPU时，占比27%。

用大算力砸出来的模型表现也是亮眼的。私募排排网数据显示，幻方量化自成立以来的累计收益率为181.63%，年化收益率达18.02%。截至2023年3月24日，幻方量化旗下管理的具有历史数据的100只基金中，94只均为正收益。

大算力固然重要，但多个案例证明，比起算力，大量高质的数据是金融垂直领域跑出高性能模型更关键的资源。

即便具有丰富的算力储备，幻方量化仍然发文表示，数据才是Alpha（超额收益）的根本来源。截至2021年，幻方量化累积的数据量超过了10PB，每天还在从数十个不同数据源持续更新。

一个更典型的“薄算力，厚数据”的案例则发生在最近。

3月31日，金融商业咨询平台彭博社（Bloomberg）推出了其为金融界打造的大语言模型BloombergGPT。从官方发布的技术细节来看，BloombergGPT的参数规模为500亿，远不到GPT-3 1750亿的参数规模。

在算力上，BloombergGPT在训练中备份了4个模型，共使用了约512块内存为40GB的A100——这对于不少头部金融机构而言，是可复制的路径。

但官方测试的结果显示，BloombergGPT对金融任务的执行效果已经超过了现有的通用语言大模型，在通用场景的表现则持平——优异表现的根源在于Bloomberg构建了目前规模最大的金融数据集FINPILE，其中涵盖了7000亿预训练数据量。

这一案例或许也能将不少机构从“算力焦虑”中解放，优质开源模型底座+优质垂直领域数据的思路，依然可以在垂直领域训练出专精的大模型。

AI代替人炒股，仍在征途

不可否认的是，ChatGPT引起的大模型热潮，对包括量化在内的金融行业会产生广泛的影响。

一方面，接入大模型有助于提升投研的效率，以个人智能助手为应用形态的AI能够理解分析师和研究员所输入的信息，并呈现出经过逻辑分析的检索结果。

另一方面，AI可以通过基于大量数据的深度学习，辅助人们做出更准确的投资决策、优化交易策略，以及进行风险管理。

不少业内人士也指出，大模型对金融领域的重要意义在于超越人有限的思维，站在更高的维度对行业进行全面的解构。

“AI做金融风险评估，不是基于人的规则，因为人的规则容易被破解，需要更高维的AI模型来做。”氪信科技CEO朱明杰为36氪举了个例子：比如对交易风险的检测，银行每天有上亿笔交易，靠专家人力无法一一审核。而通过金融数据和金融专家经验数据去训练AI模型，就能够拥有更多的“专家”。

但相对地，让AI通过深度学习从而产生超越人的思维能力，在现阶段是不少金融机构可望而不可即的图景。

就决定垂直领域模型核心能力的数据而言，出于数据安全等因素的考虑，不同金融机构之间的数据并未打通，这也意味着单一机构的数据资源较有限。尤其对于成立初期、规模有限的中小型金融机构而言，难以具备构建垂直领域模型的能力。

另一亟待完善的层面在于算法。朱明杰认为，目前ChatGPT有模仿的能力，但本质上还是人的思维，没有自主创新的能力，很难应对一些黑天鹅事件，“大模型涌现的能力还很有限”。

一个案例是，随着2020年下半年小票市场行情分化，明汯投资在同年Q4调整了选股模型，从而存在过度风格暴露（指基金持有的资产在风格特征上与某个特定的市场、指数或其他资产组合相关联的程度）的嫌疑。

2021年初，招商证券发布的一篇报告提到，量化投资在未来越来越难以靠“单纯的风格、行业暴露”来挣钱，一定会在新的赛道展开激烈比拼，包括基本面因子深度挖掘、舆情等另类数据，以及进一步优化模型与提高算力。

量化投资行业与科技行业的缝隙正在缩窄，这也意味着金融机构在研发上依然需要舍得出血。在瞬息万变的市场环境中，不存在“躺平数钱”的时刻。

36kr制图

标签：

上一篇：前沿热点：提升旅游业态能级打造金山文旅高地——枫泾镇党委书记胡晓岚做客“2023金山区街镇（社区）书记访谈”

下一篇：最后一页