作者:M31 Capital 的 David Attermann
Subsquid网络是行业内首个模块化区块链数据索引和查询解决方案,使开发者能够高效地访问和分析链上信息。它提供了独特的模块化和可扩展架构,允许高度定制的数据处理管道和实时更新。由于市场对其了解不多,这为投资者提供了一个罕见且极具吸引力的投资机会。
区块链数据管理的现状
当前,Web3开发者面临的最大挑战之一是大规模访问数据。目前,查询和汇总区块链(交易和状态数据)、应用程序(解码智能合约状态)和任何相关的链下数据(如IPFS和Arweave中存储的价格数据)极其复杂。这些数据通常分散在多个生态系统、链和技术中,导致结构不标准和数据孤岛的出现,最终使数据集不完整,难以提取有意义的见解。
在Web2中,数据存储在类似BigQuery、Snowflake、Apache和Iceberg的集中式数据湖中,以便于访问。然而,将Web3数据存储在类似的集中式数据湖中,会违背开放和弹性访问的初衷。如果能够对Web3应用数据进行汇总、过滤和便捷提取,将在多链范式下释放行业的潜力,推动下一代应用功能的发展。
解决方案:Subsquid network
Subsquid是一个去中心化的查询引擎,优化用于高效提取大量数据。它目前处理来自超过100个EVM和Substrate网络的历史链上数据,以及处于测试阶段的Solana和Starknet的数据。这些数据包括EVM的事件日志、交易收据、追踪和每笔交易的状态差异等详细信息。它还在开发利用其多链索引功能的协处理器和RAG功能,通过零知识证明市场和可信执行环境(TEE)与链下数据湖资源网络进行无信任连接。
传统的区块链数据查询方法速度慢、分散且成本高,开发者难以提取有意义的见解。Subsquid的去中心化查询引擎提供了可扩展的模块化架构,允许定制数据管道和实时更新,使数据提取速度提高最多100倍,成本降低最多90%。
目前的产品套件
这些工具使开发者能够高效地访问和分析大量区块链数据,从而更轻松地构建和扩展复杂的去中心化应用。
1. Subsquid网络:一个分布式查询引擎,处理来自100多个EVM和Substrate网络以及测试阶段的Solana和Starknet的历史链上数据。
2. Squid SDK:一个用于在Subsquid网络上构建索引器的TypeScript工具包,提供用于数据提取、转换和加载的高级库。
3. Subsquid云:一个平台即服务(PaaS),用于部署Squid SDK索引器,提供Postgres资源配置、零停机迁移和高性能RPC端点。
4. Subsquid Firehose:一个开源轻量级适配器,便于开发和部署子图,无需大量设置。
模块化架构
与市场上的其他解决方案不同,Subsquid独特的模块化架构允许开发者进行最佳的灵活性和定制。这将在进入Web3开发的下一阶段时成为关键差异,使应用程序和用例更加复杂和功能丰富。
1. 定制化:开发者可以根据特定需求定制数据处理管道的每个组件,从而实现更高效和有效的数据处理。
2. 可扩展性:模块化特性使横向扩展更容易,通过简单地增加处理节点来处理不断增加的数据负载。
3. 灵活性:能够独立开发和优化管道的不同阶段,使Subsquid能够适应各种用例和性能要求。
4. 效率:通过对数据流和处理逻辑的精细控制,Subsquid在索引和查询任务中可以实现更高的性能和效率。
为了说明模块化数据访问方法的强大功能,我们可以比较分析和实时数据访问用例。两者都需要高效的链上数据源(Subsquid 网络),但其余管道需要完全不同的技术。在 Web2 世界中,应用程序的实时数据访问通常由相对较小的事务数据库(Postgres、SQLite)提供支持,而分析则需要 Snowflake、BigQuery 或 Trino 等大数据解决方案。同样的区分也适用于 Web3 用例,而Subsquid 具有独特的优势,可以从两个垂直领域获取有意义的价值份额。
目标市场和用例
Subsquid的技术在区块链生态系统的所有领域都具有高度相关性:
1. 去中心化应用项目(dApp Projects):提高去中心化应用在DeFi、NFT、游戏、社交媒体等领域的性能和用户体验。
2. 区块链网络(Blockchain Networks):改进L1和L2网络的数据基础设施,帮助开发者构建更高效的数据驱动应用。
3. 分析和研究(Analytics and Research):帮助公司处理大量区块链数据,提取见解和趋势。
链上和Web3数据的每字节价值比Web2高出几个数量级,并被智能合约、索引器、分析API和边缘技术(如AI代理)消费。
客户案例研究
1. Railgun:隐私聚焦的EVM钱包基础设施
• Railgun曾使用内部工具直接调用RPC扫描余额,但速度较慢。尝试使用The Graph后,发现其在所有链上并不具备功能一致性。Subsquid使其新的“隐私池”产品在余额扫描速度上得到提升。
2. CoinList:领先的代币发布平台
· 由于 CoinList 经常处理新项目,因此为他们打算支持的链寻找节点提供商通常很麻烦。大型提供商不支持新的小型链,而依赖小型提供商可能很困难且不可靠。从项目团队本身获取数据也是不可取的,因为这个基础设施可能会被篡改或维护不善。Subsquid使 CoinList 能够完全绕过这个问题。
· 该平台对 Subsquid 即将推出的对数据湖中热块的原生支持非常感兴趣,因为这将完全消除 RPC 约束。这为碎片整理提供了机会,不仅适用于 CoinList 等代币发布平台,还适用于各种 dApp 和多链平台,如游戏和社交,它们可能需要来自各种规模生态系统的信息。
被忽视和误解
Subsquid目前被市场低估的主要原因是其缺乏知名度。尽管其技术差异、功能价值、早期用户吸引力和巨大潜力,但项目并未获得应有的关注。原因包括:
· 品牌营销薄弱:Subsquid 承认,其最初几年只专注于产品开发和客户获取,品牌营销投入不足。迄今为止,其社交媒体影响力和营销活动尚未有效地将其价值主张传达给更广泛的受众。
· 代币发行乏善可陈:鉴于其营销工作不尽如人意,SQD 代币的发行并未像其他区块链项目那样引起轰动,导致其初始估值较低。
· 深奥的技术差异:Subsquid 产品的先进性和技术性可能难以被更广泛的市场理解和欣赏。
现在团队专注于品牌知名度,并在 M31 Capital 等战略合作伙伴的帮助下,我们相信该项目将能够更好地向市场传达其价值,这将推动近期估值的大幅提升。
竞争格局
Subsquid的主要竞争对手包括The Graph、Zettablock和Space and Time。每个平台都有其独特的优势和劣势,选择取决于具体项目的需求。我们相信,Web3数据湖/仓库市场长期来看将是巨大的,有多个大型赢家。
The Graph:
· 预定义子图:The Graph 依赖于子图,子图是用于索引和查询数据的预定义指令集。虽然这种方法提供了一种结构化且用户友好的方法,但它缺乏 Subsquid 模块化处理器提供的深度定制。
· 索引机制:Graph 使用更为严格的索引机制,索引逻辑的更改通常需要对子图进行重大调整或重新部署。
· 性能:根据子图的复杂性和网络负载提供中等到高性能。它为查询提供低延迟,并且可以通过添加更多索引器进行水平扩展。
•
Zettablock:
· 集中控制,去中心化意图:ZettaBlock 将集中式基础设施与去中心化信任机制相结合。这种方法提供了实时数据索引和查询功能,但不提供 Subsquid 中相同级别的模块化定制。
· 数据管道:ZettaBlock 专注于具有可定制 ETL(提取、转换、加载)流程的实时数据管道,但与 Subsquid 的完全分散和模块化方法相比,它采用更集中的控制框架。
· 性能:专为实时数据索引而设计,查询响应时间短。它具有高度可扩展性,适用于需要实时数据管道的应用程序。
Space and Time:
· SQL 证明和混合处理:Space and Time 通过 SQL 证明强调数据完整性,并支持混合事务和分析处理。虽然它提供了用于数据完整性和处理的高级功能,但其架构在索引管道方面并不像 Subsquid 那样模块化或可定制。
· 数据仓库:Space and Time 的架构以分散式数据仓库为中心,虽然它对于大规模数据查询功能强大,但与 Subsquid 灵活的模块化管道相比更加单一。
· 性能:为区块链和链下数据提供高性能优化。支持混合交易和分析处理,确保低延迟和可扩展性。
Subsquid的差异化
Subsquid独特的模块化和可定制数据处理方法,加上其对灵活性、性能和可扩展性的关注,使其在区块链数据索引和查询平台中脱颖而出。随着行业的成熟和应用程序变得越来越多链和复杂,这种功能将变得越来越有价值。
1. 定制化索引器和处理器:
• 灵活索引:允许开发者构建高度可定制的索引器和处理器,便于处理复杂的数据集成任务并从区块链数据中提取有意义的见解。
• 性能优化:自定义处理器可以优化性能,确保索引和查询高效且可扩展。
2. 多阶段处理管道:
• 数据流架构:多阶段处理管道将数据提取、转换和存储分为独立的阶段,提高数据处理任务的可管理性和可扩展性。
• 模块化:管道的每个阶段可以独立开发和优化,提供更大的数据处理工作流控制。
3. 支持多种数据源:
• 多样的区块链集成:支持多种区块链并能集成各种数据库,使其成为开发者在不同区块链生态系统中工作的多功能工具。
• 适应性:平台处理多种数据源的能力确保其能够适应区块链行业不断变化的需求。
4.开发者友好的工具和SDK
· 综合SDK:提供一个软件开发工具包(SDK),包括简化开发定制数据索引器和处理器的工具和库。
· API支持:支持多种API进行数据查询,包括GraphQL和SQL,为开发者提供灵活性。
5.去中心化和可扩展架构
· 去中心化处理:与The Graph和Space and Time类似,Subsquid利用去中心化节点网络处理和索引数据,确保高可用性和容错性。
· 可扩展性:平台设计为横向扩展,能够高效处理不断增加的数据量和查询量。
6.性能和效率
· 高性能:通过在数据处理管道的各个阶段进行自定义优化,Subsquid能够在数据索引和查询任务中实现高性能。
· 资源使用效率:平台架构确保计算资源的高效利用,降低数据处理的成本和复杂性。
在将 Subsquid 与该领域最成熟的竞争对手 The Graph 进行比较时,最后一点尤为重要,后者的网络运营效率极低,经济效益不可持续。如下图所示,代币激励每月远远超过网络收入 50 倍至 100 倍:
从架构上看,The Graph 的“单片”索引节点是一个黑匣子,用于执行编译成 WASM 的子图。数据直接来自存档节点和本地 IPFS,处理后的数据存储在内置的 Postgres 数据库中。相比之下,Subsquid Network 提供几乎零成本的数据访问、从多个区块进行更细粒度的数据检索以及卓越的批处理和过滤功能。
相对估值
Subsquid 流动性最好的代币是 GRT,其交易价格是 SQD 的 FDV 溢价的 18 倍。Space and Time 将是另一个直接的同类代币,当该代币在今年晚些时候开始交易时,这也应该成为 SQD 的催化剂,吸引市场关注 Web3 大数据领域的价值。
从长远来看,随着 Web3 行业的成熟,将 Subsquid 与当今类似的 Web2 公司进行比较是合理的,这意味着如果该项目(以及整个 Web3)成功,其上涨空间高达 270 倍。
2030 年 TAM 和上升潜力
尽管区块链数据管理和 Web3 总体而言仍处于起步阶段,但我们可以将 Web2 作为 Subsquid 长期 TAM 的参考。我之前曾估算过整个2030 年 Web3 市场的潜在上升空间,到 2030 年 Web3 GDP(总收入)将达到 5.6 万亿美元。如果我们将 Web2 数据湖和仓库市场占 Web2 GDP 总量的百分比,我们可以将其应用于 Web3 GDP 预测,到 2030 年 Web3 数据湖和仓库市场将达到 236 亿美元。
(来源:omnichain 观察、未来市场洞察、专家市场研究)
如果我们假设 Subsquid 在 2030 年拥有 20% 的市场份额,并应用 10 倍的收入倍数(对于高增长资产来说是合理的,下文将详细介绍),SQD 的价值将达到 470 亿美元,是今天 FDV 的 240 倍!
为什么是 20% 的市场份额?纵观 Web2 数据管理提供商的竞争动态,市场领导者长期以来一直保持 40% 以上的份额。考虑到 Web3 更加分散的性质,我们认为 20% 是 Subsquid 上行情景的合理假设。
为什么是 10 倍收入?这是公共云计算公司的 10 年平均值(2020 年达到了 22 倍的高点!)。
Subsquid 2030 年 FDV (十亿美元)和回报倍数的敏感度表如下:
投资论点
· 高度不对称的风险/回报投资机会;Subsquid 目前的 FDV 提供 18 倍的上涨空间,以实现与 The Graph (GRT) 的估值平价,我们认为 The Graph (GRT) 的技术和网络经济客观上较差,而长期上涨空间则为 240 倍以上。
· Web3 技术堆栈(数据湖和仓库)中非常有价值部分的独特且差异化的资产,随着应用程序复杂性不断加速、去中心化 AI 的激增以及一般行业采用的扩大,它将变得更加重要,从而导致链上数据呈指数级增长。
· 由于品牌营销无效、代币发行活动乏善可陈以及技术差异化深奥,因此被忽视且定价严重错误。
· 尽管缺乏市场关注,Subsquid 拥有优于大型现有公司的网络架构、令人印象深刻的早期客户吸引力以及提供完整数据仓库功能以及协同处理和 RAG 功能的令人兴奋的路线图。
· 多个近期催化剂包括 6 月份主网启动、即将进行的网站更新和品牌重塑工作,以及对营销和战略合作伙伴计划的新关注。
技术设计
Subsquid 旨在提供无限的水平可扩展性、无需许可的数据访问、最小化信任的查询和低维护成本。其架构确保:
· 原始数据由数据提供商上传到永久存储器中。
· 数据被压缩并分布在网络节点之间。
· 节点运营商会缴纳一笔保证金,这笔保证金可能会因拜占庭行为而被削减。
· 每个节点都使用 DuckDB 高效地查询本地数据。
· 可以通过向链上智能合约提交签名的响应来验证查询。
网络架构
1. 数据提供者:数据提供者确保数据的质量和及时提供。在启动阶段,Subsquid Labs GmbH是唯一的数据提供者,代理从各个链逐块提取的数据。这些数据通过对比哈希进行验证,然后分割成小的压缩块并保存到持久存储中。这些块随机分配给工人。
2. 工作者:为网络贡献存储和计算资源,以点对点方式提供数据,并获得SQD代币作为补偿。每个工人必须在链上注册并抵押100000 SQD代币,违反协议将被削减。SQD持有者也可以将代币委托给特定工人,表示其可靠性并获得部分奖励。
3. 调度程序:分配数据提供者提交的数据块给工人。它监控数据集和工人集的更新,向工人发送请求以下载新块或根据容量和冗余目标重新分配现有块。收到更新请求后,工人从持久存储中下载缺失的数据块。
4. 日志收集器:收集工人的活跃ping和查询执行日志,进行批处理并保存到公共持久存储中。这些日志由工人的P2P身份签名并固定在IPFS上。这些数据至少存储六个月,供其他网络参与者使用。
5. 奖励管理器:访问日志,计算奖励并在每个周期提交可认领的承诺。工人然后各自领取他们的奖励,奖励可能在一段时间后过期。
6. 数据消费者:通过操作网关或使用外部提供的服务(公共或私人)查询网络。每个网关绑定到一个链上地址。网关可提交的请求数量由锁定的SQD代币数量决定,锁定周期越长,虚拟“计算单元”(CU)越多。所有查询成本为1 CU,直到复杂的SQL查询实现。
查询验证
Subsquid网络通过经济担保提供查询数据的有效性,并可能进行链上验证。所有查询响应由执行查询的工人签名,作为对响应的承诺。如果被认定为不正确,工人的保证金将被削减。验证逻辑可能是数据集特定的,包括以下选项:
1. 权威证明:链上身份白名单决定响应的有效性。
2. 乐观链上验证:验证请求后,任何人都可以提交错误响应的证明。
3. 零知识证明:零知识证明验证响应与请求完全匹配。证明由链下的证明者生成,并由智能合约在链上验证。
未来产品开发
虽然我们坚信Subsquid平台目前的索引和查询能力及用户吸引力被严重低估,其长期增长潜力将由即将推出的产品驱动,如TEE/ZK协处理和RAG功能,这将成为未来高效能Web3应用不可或缺的基础设施。
1. TEE/ZK协处理器:
• Subsquid正在开发协处理器解决方案,将其强大的多链索引能力与第三方TEE和ZK证明者(如Brevis、Polyhedra、Phala)结合,实现链上智能合约与其链下数据湖资源网络的无信任连接。Subsquid认为,提供多种验证选项是优化特定用例和工作负载性能的理想方式,而不是开发单一的ZK解决方案。
• 这为高计算和数据驱动的链上应用程序(如订单簿DEX、借贷协议和永久合约)开辟了大门,即使在TPS低和编程语言严格的区块链上也能实现。
2. AI代理/RAG功能:
• 可以预见,在未来10年内,大部分互联网流量将由AI代理生成和消费。一个逆向观点认为,没有一个即用型AI代理平台可能会主导市场,类似于网站建设平台(如Wordpress)仅服务于特定的业余爱好领域。与此同时,2000年后增长的最大份额由基础设施侧的亚马逊云服务(AWS)占据。
• 我们预计在AI与区块链空间中也会出现类似的动态。然而,这次的关键瓶颈可能是数据访问。Subsquid的目标是提供高吞吐量的最小可行接口,使数据访问成为增长飞轮。
客户吸引力和战略合作伙伴
自去年年底测试网启动以来,用户数量、Squids(云索引器)和存档查询(网络查询)以及网络数据流量都呈现上升趋势。
为了与 The Graph 进行同类比较,我们需要比较最终用户查询。Subsquid 最终用户查询可以从云(可以跟踪)或自托管解决方案(目前无法跟踪)发送。对于 2024 年第一季度,云查询总计 12 亿次。由于自托管实现的存档查询大约是 9 倍(上面的存档源分布图),我们可以假设自托管用户的最终用户查询数量也是 9 倍。因此,我们可以估计Subsquid 在第一季度的最终用户查询总数约为 100 亿次,大大超过 The Graph,后者在同一时期的最终用户查询数量为 16 亿次。
谷歌云合作伙伴关系(BigQuery集成)
谷歌云的BigQuery是一种强大的企业数据仓库解决方案,允许公司和个人存储和分析PB级的数据。设计用于大规模数据分析,BigQuery支持多云部署并提供内置的机器学习功能,使数据科学家能够使用简单的SQL创建ML模型。BigQuery还与谷歌自己的商业智能和外部工具完全集成,允许用户在BigQuery中运行自己的代码,使用Jupyter Notebooks或Apache Zeppelin。
多链项目可以利用Subsquid与BigQuery的结合,快速分析其在不同链上的使用情况,并获得费用、运营成本和趋势的洞察。将自定义策划的数据保存到BigQuery,开发者可以利用谷歌的分析工具,了解其产品的使用情况,超越单一链或平台的背景。
路线图和即将到来的催化剂
1. 主网:于 6 月 3 日正式上线,计划于 7 月份增强 SQD 激励措施以扩大参与规模。
2. 品牌重塑:网站刷新和新品牌战略预计将在未来几周内启动。
3. Cosmos支持:扩展Cosmos生态系统的功能,扩大用户基础。
4. 无需许可的数据集提交:目前由Subsquid GmbH维护数据集,计划进行去中心化提交和策划。
5. 去中心化SQL数据库流:在数据湖中分发和同步数据库,确保准确性和及时性。
6. 企业工具:实现Kafka用于实时数据处理,Snowflake用于大数据分析和存储。
7. 协处理和RAG功能:目前处于 PoC 阶段,团队将在不久的将来发布更具体的产品路线图。
短期重新估值和长期增长故事
SQD 是我见过的最具吸引力的流动性代币投资机会之一。随着多个即将到来的催化剂,我们相信该代币可以在短期内重新升值 10-20 倍,但其长期 TAM 提供了 240 倍以上的令人兴奋的上行潜力。。
来源:金色财经