FX168财经网_全球视野外汇黄金加密货币NFT资讯网

【小萧说币】微信、支付宝与脸书受威胁！“美国公链领头羊”实现DePIN重大技术突破

0-65000 TPS，这一壮举使其与Visa等传统全球支付网络保持一致。而随2024年中期Firedancer升级，预计TPS性能为600000-1000000，应该是跑智能合约公链里面的第一。” “Solana独特之处在于拥有自己的手机，展现了对生态应用集成的承诺。Solana Saga 1已经拥有20000名用户群，而Solana Saga 2则有超过50000名预订单。而诸多Solana应用将集成其中，包括免费试用的Helium Network 5G网络，SHDW个人云盘存储等，”他重点提到。 “从监管的角度来看，DePIN向监管机构和政策制定者展示了Solana的实际应用和价值，增强了其合法性和品牌。” 正如Rocky所指，市场正进入“瘦协议、胖应用”的时代。比特币牛市回归之际，他提提出了核心论点，即“这轮周期会诞生如同微信，支付宝，脸书(Facebook)等顶级应用”。他强调，目前Solana作为美国公链的标签，已经深入人心，尤其是美国一级和二级资本心中，这种地位，将随着胖应用时代的大爆发，逐渐深入，这个周期，Solana必将大放异彩。

小萧03-05 16:26

中俄突传重磅消息！美国新闻周刊：中国支付禁令对俄罗斯造成重大打击

系统银联(UnionPay)的问题。在Visa和万事达(Mastercard)因乌克兰战争退出俄罗斯后，银联在俄罗斯被广泛吹捧为Visa和万事达的替代品。 (截图来源：美国《新闻周刊》) 据当地新闻门户网站66.ru周二报道，与华为支付(Huawei Pay)服务相关的银联卡在俄罗斯已停止使用，用户表示他们无法支付。《莫斯科时报》称，这些限制可能是美国对俄罗斯国家支付卡系统(NSPK)制裁的结果，该系统处理该国所有银联卡交易。在俄乌战争期间，北京和莫斯科一直保持着密切的关系，并在2022年2月战争开始前几天宣布建立“无限制”的伙伴关系。中国尚未公开批评俄罗斯总统普京(Vladimir Putin)入侵乌克兰的决定。根据卡内基国际和平基金会(Carnegie Endowment for International Peace)的数据，俄罗斯经济在2022年2月战争开始后受到打击，当时俄罗斯受到1.3万多项限制，成为世界上受制裁最多的国家。外汇储备被冻结，俄罗斯被切断全球银行间金融电信协会(SWIFT)银行系统的联系。在Visa、万事达和美国运通(American Express)因乌克兰战争而暂停在俄罗斯的业务、SWIFT被封锁后，银联被广泛吹捧为中国对俄罗斯的救援行动。它成为俄罗斯人在国外支付的唯一方法之一。据新闻门户网站66.ru报道，虽然实体银联卡似乎可以正常支付，但与华为支付服务关联的相同卡在俄罗斯却遭到拒绝。据俄罗斯Telegram频道Market Overview报道，华为支持方面表示，由于支付服务提供商的运营变化，华为支付目前无法在俄罗斯使用。《新闻周刊》通过电子邮件联系了俄罗斯外交部、银联和华为，请其置评。几天前，有报道称，中国最大的三家银行已停止接受受制裁的俄罗斯金融机构的付款。据俄罗斯《消息报》报道，考虑到美国“二级制裁的风险”，中国工商银行、中国建设银行和中国银行做出了这一决定。这些银行在中国的资产规模分别排名第一、第二和第四。《消息报》称，与非制裁银行的交易仍在进行。去年12月，华盛顿威胁要阻止与支持俄罗斯国防工业的公司有业务往来的外国银行进入其金融体系。

风枫03-01 14:45

稳定币要实现可持续增长的三个必备核心功能

量正在超过支付巨头 PayPal 和 Visa 等公司，后者也开始开发自己的稳定币。 Centrifuge 业务开发主管 Asad Khan 指出，到目前为止，稳定币行业已经能够提供多种不同类型的稳定币，每种稳定币都有自己独特的功能和不同的吸引力。 “我相信这种趋势将持续下去，虽然会在一定程度上发生一些整合，但我相信稳定币平台将有很多机会吸引特定的细分市场并提供相对独特的价值主张，”Khan说。随着时间的推移，由于区块链支持的即时结算和 24/7 交易功能，稳定币很可能成为资本市场交易的主要媒介。 Khan 表示：“最终，稳定币是一种新的金融平台，可以更轻松地构建和使用交易通道，因此不同的提供商将能够利用其独特的特性来使自己的系统脱颖而出，这似乎很自然。” 价值储存尽管稳定币可以轻松兑换很重要，但 Steakhouse Financial 的马克·菲利普斯 (Mark Phillips) 在报告中指出，保持价值储存也是稳定币的一个重要用例。 “美国和第一世界国家的人们没有意识到，当存在腐败和经济不稳定时，能够将他们辛苦赚来的收入放入一个可靠的媒介中，他们可以用它来购买商品是多么重要。”菲利普斯说。 Khan 表示，由于加密货币行业与当地或区域市场没有重大联系，因此当今大多数稳定币都锚定于世界全球储备货币美元，这是有道理的。他表示：“这些离岸美元市场使用美元的原因有多种，但主要是因为它允许金融机构在其服务的特定市场与可用资本池之间建立联系，无论它们位于世界何处。” 尽管非美元挂钩的稳定币可能会开始解决更多特定区域的机会，但 Khan 认为，在可预见的未来，美元可能仍然是稳定币的主要工具。记账单位如今许多中心化稳定币都依赖于传统金融市场及其相应的记账单位。该报告表明，这一点通过铸币和赎回机制显而易见，这些机制通常需要与法定货币的传统银行账户连接。然而，对于去中心化稳定币来说，确保挂钩稳定性、防止另一次 Terra/Luna 崩溃并优化账户功能是很重要的。监管考虑在不久的将来，稳定币面临的另一个主要障碍是应对主流和成熟市场不断变化的监管环境。 Khan 表示：“如果没有政策制定者的明确说明和支持，在更传统的用例（例如消费者-商家支付或传统资本市场交易）中建立采用将面临极大的挑战。” Khan 认为，今天政策制定者的情绪相当消极，稳定币被视为市场的麻烦而不是基本机会。不过，他指出，在市场摆脱投机用例并迎来更多可持续机会后，这种情况可能会发生变化。具体来说，他认为有两个有前途的领域可以解决这些监管障碍：链上资本市场和新兴市场的交易。 “稳定币提供商认为这些市场更容易进入，而且用户对稳定币的功能有天然的需求。无论是参与 DeFi 市场还是促进点对点交易，大多数稳定币将继续瞄准这些领域来建立自己的品牌和网络。” 来源：金色财经

金色财经02-29 14:55

Worldcoin (WLD) 到底是什么？如何用钱包买？

密货币。该服务接受多种支付方式，包括 Visa、Mastercard、Apple Pay、Google Pay 和美元信用卡。 1.打开Bitget钱包，进入“钱包”页面。在这里，选择“购买”选项。 2.选择您要使用的法定货币，然后从下拉菜单中选择“ETH”（乐观）。 3.输入您要购买的金额，确认购买，然后选择付款方式。 4.交易完成后，购买的ETH将出现在您的Bitget钱包主页上。 5.要购买 WLD，请点击“市场”并搜索“WLD”。选择“购买”即可访问Bitget Swap并开始交易！如何将世界币（WLD）代币存入Bitget钱包？要将 WLD 从其他加密货币钱包或交易所存入您的 WLD 钱包，只需： 1.进入Bitget钱包首页，选择“接收”。 2.选择 Optimism 网络并找到 WLD。 3.复制您的 WLD 钱包地址，或使用二维码更轻松地转账。 4.从您选择的交易所或钱包中，开始提款或转账流程并粘贴您的 WLD 钱包地址以存入资金。请记住，在完成存款过程之前，仔细检查地址并确认网络兼容性至关重要。如何从World App提取Worldcoin（WLD）代币到Bitget钱包？要从您的 World 应用程序中撤回 WLD，只需： 1.打开您的 World 应用程序并在钱包页面上选择“WIthdraw”。 2.选择您首选的提款目的地。如果您想将您的世界币（WLD）提取到 Bitget 钱包，请选择“加密钱包”。 3.选择“其他Optimism钱包”，输入您的Bitget钱包Optimism地址。来源：金色财经

金色财经02-28 08:59

被踢出道指的股票命运如何？可能和你想象的不一样

这只铝业股与惠普和美国银行一起被耐克、Visa和高盛取代。在随后的一年里，美国铝业大涨 91%，惠普上涨约 72%，美国银行上涨 18%。在当年新增的三家公司中，耐克的股价升幅最大，约为 16%。其他退出道琼斯指数的公司也取得了丰厚的回报。RTX 、Exxon Mobil和Pfizer也在 2020 年被逐出道指，并在随后的一年中分别飙升了约 39%、37% 和 29%。取而代之的两家公司--Salesforce 和Amgen--则分别下跌了约 3% 和 11%。就连苹果也未能幸免，在跻身道琼斯指数后的一年里，跌幅超过 17%。这种趋势并非全部。例如， Honeywell International在加入道指一年后大涨 40% 以上，而UnitedHealth则上涨了近 28%。通用电气是最初 12 只道指股票中的最后一只，在 2018 年离开平均水平一年后暴跌了约 58%。AT&T和DuPont de Nemours在被逐出道指后的一年里分别下跌超过 14% 和 21%。

金融界02-28 02:16

种子轮融资 2700 万美元创始人亲述Avail“三位一体”解决方案和愿景

n是一组专门从事电子商务的相关微服务。Visa运营着一系列处理支付的微服务。 ● 当用户在Amazon上单击产品的购买按钮时，就会触发从浏览器到Amazon产品微服务的调用。 ● 然后会调用Visa微服务向用户发送支付页面。 ● 一旦用户填写了支付详情，另一个验证支付请求就会发送给Visa微服务。 ● 一旦支付通过验证，就会向Amazon产品微服务发送一个回调，让用户知道产品已购买并且支付已完成。如果碰到黑色星期五这样的节假促销日，Amazon和Visa微服务将扩大规模，满足更多的互联网需求。关键是，互联网只有通过异步微服务才能扩展到如此大的规模。区块链也将如此。我们如何在web3中实现这一点？ UPI是一个很好的学习榜样。就用户量和交易量而言，它是世界上最大的支付系统之一。目前，UPI每月处理交易超过100亿笔，这证明了该系统的规模之大。 UPI是一个使不同银行的客户能够交互的系统。但它在刚推出时并没有那么成功。银行最初对是否加入该系统非常犹豫——政府并没有强制要求加入UPI。银行表示主要顾虑是，如果它们支持了UPI交易，最终结果将是客户账户里的资金转移到其他银行（流动性外流）。解决这个问题使用了互惠原则。互惠原则取代了经济激励，被用来传达这样一种观念：银行只有在允许“pay-out”（向外支付）的情况下，才能加入UPI获取其他银行客户的“pay-in”（支付流入）。尽管这是一个有关需许可设置的例子（web2中的银行），web3的无需许可统一层仍然应该内嵌互惠原则，这对整个生态系统来说是有益无害的。互惠原则有助于各银行打开他们的客户和钱包之门，进行有效合作，以确保最终客户尽可能获得最佳用户体验。这样的合作对生态系统有益无害。但这只有在底层技术使用正确原语来实现合作的情况下才有可能实现。UPI拥有这些，我们设计了Avail，将全球范围的web2系统的经验带入web3。将web2的经验带入web3 互联网的发展为区块链世界提供了珍贵的见解。互联网的扩展主要是通过异步微服务实现的，异步微服务是一个由相互连接的计算机组成的网络，每个计算机执行特定的任务，在需要事进行通信。 ● Amazon和Visa等平台就是这种模式的范例，它们分别针对电子商务和支付处理提供一系列专门的微服务。 ● 这些服务独立扩展以满足需求，展示了去中心化异步操作的效力。 ● 像UPI（统一支付接口）这类系统的成功进一步突显了互联互惠在扩展大型复杂系统中的重要性。在web3中，我们正在见证一个类似的复杂性和增长阶段。如今，以太坊上出现了许多rollup和Layer 2解决方案，这导致了用户和流动性的碎片化问题，以及用户体验的脱节，让人想起早期的互联网挑战。现在我们来深入了解这些问题，以及Avail是如何协助解决这些问题的。模块化生态系统现状 Rollup已经成为公认的区块链扩展解决方案。随着rollup技术的成熟和发展，以及不断融合更高效的、特定于应用程序的新的先进技术，它们正在成为各区块链平台的标准功能。我们看到rollup正越来越多地获取多链采用，这种发展趋势是显而易见的。然而，这一发展引起了人们对用户体验的重大关注，因为有数百个链，每个链上都有无数的用户交互。主要的L2参与者在应对这些挑战的过程中，都制定了各自独特的解决方案。不幸的是，这导致了进一步的碎片化问题。虽然这些生态系统允许在其边界内进行顺畅的整合操作，但跨生态系统操作会产生摩擦，这对用户在更广泛的区块链领域中寻求无缝的互操作性构成了障碍。基于有效性证明的DA层为基础基于第一性原理的思维，统一堆栈的底层需要是一个基于有效性证明的使用数据可用性抽样构建的DA层。 DA层是区块链中必不可少的一层，因为它是共识和排序的整合点。虽然DA层需要其他组件（即执行）来构建区块链，但它充当的是信任的根，对交易进行排序并就这些交易顺序达成共识。当执行层从基础层检查排序和DA保证时，最有效且信任最小化的执行方法是对排序承诺进行抽样。通过使承诺以有效性证明为基础，使其成为无可辩驳的事实之源。这正是KZG承诺在Avail DA中发挥的作用。然而，为了获得针对已提交排序的可用性保证，客户端要么必须下载完整数据，要么必须对纠删码数据执行抽样，以提供高可信度的可用性。前者强制客户端运行基础层全节点，因此Avail使对纠删码数据执行DAS的轻客户端能够高效地验证可用性。有效性证明支持的DAS是Avail DA的超能力，它是我们构建Avail Trinity的支点。 Avail Trinity Avail生态系统旨在为用户和开发人员提供卓越体验，在不妥协的情况下平衡可扩展性，互操作性和安全性三大基本要素。该平台的结构主要为以下三层： ● 基础数据可用性（DA）层这一层是通用基础层，任何区块链都可以利用它来增强其可扩展性和安全性。Avail DA简单而强大的设计非常灵活，适应各链需求，不强加特定的约束或偏见。 ● 面向互操作性的Nexus层 Nexus层是Avail的协调组件，它为rollup内部消息传递提供了一个无需许可的框架。这一层对于创建跨多场景的无缝用户体验至关重要，无论用户使用的是单个rollup，还是在Avail中跨多个rollup，或是与外部生态系统中的链进行交互。 ● Fusion安全层 Fusion允许Avail基础链将非原生代币与Avail原生代币结合在一起，以保护Avail平台安全，从而实现强大可靠的安全层。 Fusion Security将为构建在Avail上的rollup代币提供更高的安全性和更多效用。 Fusion还将有助于将其他区块链的更多流动性引入Avail生态系统并将其锁定。 5、Avail DA DA层是区块链网络的核心基础，充当可扩展的共享事实源。它确保每次诞生一个新区块时，网络中的所有相关数据都在，没有任何隐藏或删除，从而支持它继续运行。虽然很重要，但DA层需要其他层来创建区块链，特别是决定区块链状态变化的执行层。执行层通过rollup被高效扩展，但是如果没有一个优化的DA层，数据可用性很快就会成为瓶颈。（1）Avail DA层工作原理 Avail DA层是一个去中心化区块链网络。它创建区块空间并确保其安全，其他区块链可以将这些区块空间用作自己的数据可用性层。使用专门的AppID，区块链将交易数据发布到Avail，随后这些数据被提交，变得可用。 ● 发布在Avail区块上的数据由Avail网络验证，但并未执行（因为这是执行层的工作）。 ● Avail的数据可用性区块链可以支持任何区块链网络。 ● Avail使用有效性证明，所以开发人员和用户无需信任Avail网络确认数据是可用的；他们可以自己验证。 ● 发布到Avail的数据通过纠删码进行扩展，从增加了数据冗余。 ● Avail使用KZG多项式承诺确保数据在Avail区块头中留下痕迹。 ● 一旦新区块被验证者最终确定，有效性证明就可用来保证数据在区块确认后立即可用。 ● Avail的提名权益证明（NPoS）区块链是使用Polkadot SDK构建的，它将支持多达1000个外部验证者。（2）数据可用性抽样（DAS） DAS是一个核心概念，用于有效验证其他网络、钱包和用户在Avail区块链上可用的数据。使用Avail的Light Client（轻客户端），用户可以快速对Avail区块链进行抽样，以验证证明数据可用的有效性证明。这种高效且简洁的代码可以在不同的产品和设备上轻松部署，包括用户的手机和浏览器。 8、扩展能力通过Avail轻客户端和数据可用性抽样，Avail支持可扩展区块，可增加区块大小，并随着需求的增长支持更多区块。这是由于轻客户端和DAS的独特特性。 Avail轻客户端可以对网络中的数据子集进行抽样，并验证该数据的可用性。轻客户端可以通过8-30个样本快速生成接近100%的数据可用性保证，提供与全节点相当的安全保障。当跨轻客户端网络进行复制时，轻客户端网络本身开始形成链当前状态的副本，为整个网络增加冗余。最终，你将获得带有验证器和轻客户端网络的Avail网络的副本。有了更多的轻客户端，网络就有了更强大的数据抽样能力。随着网络中发生更多的DAS，轻客户端网络的覆盖范围将变得足够大，就可以对更大的区块进行抽样了。这将带来一个正反馈循环，即随着区块空间越来越大，网络中轻客户端的数量也将越来越多。与随着需求增加可用区块空间减少的单体链设计相反，Avail的DA层将能够根据需求扩展DA区块空间。 9、维持排序维持交易排序是构建区块链系统的基本要求。随着每个新的Avail区块的出现，区块链上的交易将出现新的排序。虽然维持发布数据排序的责任在于Avail DA验证器集，但验证责任却外包给了用户。为了确定链的正确性，用户必须： ● 验证数据可用性：就是根据已确立的排序检查数据可用性。用户可以根据Avail验证器集确定的排序执行数据可用性抽样（DAS）来实现这一点。Avail使用Avail DA中的有效性证明可实现大约60秒的最终确定性，可以说是如今的DA层可提供的最快的最终确定性保证。 ● 验证执行：这是通过验证特定于rollup的执行证明来实现的。实际上，在默认情况下，这些验证过程将整合到用户钱包中。这种整合确保用户不需要具备验证技术，也不需要运行专门的软件。这种方法不仅简化了用户体验，还保持了Avail生态系统内交互的可靠性和完整性。 6、Avail Nexus 能够轻松地对rollup提供支持也就意味着将迎来成千上万rollup的到来。也就是说，与这些rollup交互的最终用户体验将是碎片化的。在多链世界中，区块链用户的体验已受到一定影响，如果在不改变可组合性的情况下进一步增加rollup数量，将带来更严重的问题。这就是为什么我们正在构建Avail Nexus，它作为rollup的统一验证中心，使用Avail DA作为信任的根。 Avail Nexus是基于Avail的自定义ZK协调rollup，包括： ● 证明聚合和验证层 ● 排序器/slot拍卖机制 Nexus还将聚合证明定期提交给以太坊和Avail DA层进行验证。由Avail DA中的一个自定义模块来验证聚合证明。背景 Rollup对于解决可扩展性问题至关重要。当涉及到吸引更多用户时，单体链总归是一个瓶颈。在理想化的未来，每个dapp都是自己的rollup，只受自身性能的限制。但是，这一未来最重要的部分是dapp之间的无缝通信。模块化的世界一定会像指示跨rollup通信的消息传递协议一样高效。跨rollup通信涉及到跨链桥，如果要与单体链提供的安全性相媲美，那么对这些跨链桥来说，信任最小化是很重要的。当在同一DA层上的rollup之间进行桥接时，就不会涉及跨信任和安全区域，因为它们都依赖于相同的共识和经济安全来决定排序（存在细微差别），但是对于无需信任的桥接来说，rollup需要知道执行是否正确，这是相当重要的，它必须自己验证，这样它就不必信任其他人依靠其提供这些保证。这就引出了一系列重要的问题。 ● 如何在不成为瓶颈的情况下进行状态验证？ ● Rollup如何了解生态系统内其他rollup上的消息或事件，消息传递是否可异步实现？ ● Rollup A如何知晓rollup B的规范排序？ ● 安全假设是否在不同rollup之间有所变化？ ● 需要多少跨链桥，即使它们是通用的？ Avail Nexus旨在大规模解决这些问题。设计当一条区块链想要与另一条链对话时，为了自身的安全，它需要回答两个重要的问题。 1. 链的规范和最终顺序是什么？ 2. 执行是否有效？共识决定了链的规范顺序，通用的 DA 层在这方面提供了统一的安全性。DA 层为其交易顺序提供 Rollups 共识，对于具有相同 DA 层的 Rollups，这是改变游戏规则的。所有rollup（包括其自己的rollup）的交易顺序由相同的共识决定，因此即使存在重组，所有rollup的顺序也将由该重组决定。然而，即使对于具有公共 DA 层的Rollup来说，确定执行是否有效也是一个难题。让我们想象一下 NFT Rollup 想要确认付款 Rollup 上的付款的情况。跨Rollup通信大致如下所示：红色线表示从支付Rollup到 NFT Rollup的信息流。尽管这看起来很简单，但随着更多的Rollup加入生态系统，复杂性就会增加。即使对于一些想要相互通信的Rollup，结构最终也会看起来像这样，它们之间有独特的桥实例，执行上述所有功能。当我们认识到每个Rollup可能具有独特的状态转换函数，并根据其特定领域定制设计选择时，挑战变得更加明显。执行的验证可能取决于博弈论，结合欺诈证明或依赖于零知识证明（ZK 证明）的有效性证明系统。即使在 ZK rollups 中，证明系统本身也可能表现出变化，从 Groth16 到 PLONK。 Rollup 并不真正需要知道其他 Rollup 的细节和状态转换函数是什么，而只需要能够验证这些状态转换函数的执行是否如实执行，并且需要能够理解这些与他们相关的执行。此外，通过验证单个证明，他们是否可以基本上验证与他们相关的所有执行的有效性，这将改变游戏规则。验证中心为跨链通信和事件启用某些接口，并在其背后抽象Rollup的特定于域的详细信息，正是提供了这一点。Avail Nexus 就是这一理念的体现。聚合证明 ZK 证明有一个非常重要的特性，那就是简洁。验证语句所需的计算资源比得出语句本身要少得多。在区块链的背景下，状态验证比通过执行状态转换函数到达某个状态要容易得多。除此之外，能够通过单个证明（聚合）证明 n 个证明有效的可能性是开创性的。现在，我们不再需要单独验证 Rollup 的有效性证明，而是验证单个聚合证明会验证截至该点参与 Rollup 的所有有效性证明，这意味着验证所有参与 Rollup 的整个历史记录的有效性。 Avail Nexus 在其运行时会验证在满足某些条件的情况下提交给它的所有有效性证明，并创建一个简洁的证明来证明已完成此操作。然后将该证明提交给 Avail 基础层，由所有节点进行验证。本质上，它成为一个神圣的结算层。任何参与的 Rollup 都可以通过验证这个简洁的证明来对任何其他 Rollup 进行状态验证，最重要的是，通过 L1 桥，这个世界就可以访问外部世界。实现细节可能会发生变化，但可以通过验证 Zeth 实例内部的证明或使用更多目标证明聚合工具（例如Nebra构建的工具）来执行聚合。一个重要的细节是Avail Nexus本身就是一个ZK rollup。每个聚合证明在Rollup世界中都是一个新的区块或batch。区块头是某种状态的承诺，用于存储 Nexus 之前的Rollup区块头，以及截至该点为止Rollup生成的所有事件的列表。此外，这甚至允许乐观的Rollup参与。乐观Rollup将能够向 Nexus 提交其收据和状态根，并且欺诈证明将是 ZK 欺诈证明，从而缩短挑战期。如果在挑战期内没有提交欺诈证明，则乐观Rollup生成的收据（或事件）将包含在 Nexus 状态中。回到 NFT 和支付的例子，现在的实现看起来像这样。橙色部分描述了两条链之间的信息流。Avail Nexus 提供的收据根描述了基于历史记录中所有Rollup生成的所有事件构建的树的根。重要的是，可以为事件证明非包含证明。在当前的实现中，事件全部存储为稀疏 Merkle 树，事件的哈希值作为其索引，并且 Nexus 强制每个事件都是唯一的。同步组合的应用程序可以准确预测并且更容易构建。然而，随着用例的扩展和用户体验要求的提高，同步组合并不能提供足够的灵活性。在单片链或单个Rollup中，应用程序位于同一系统中，并且很容易同时拥有两种结构。应用程序之间的任何通信都需要在区块时间内进行，但是像 future 这样的高级结构可以用来存储未来的承诺，并且在这些 future 实现的时候，可以完成某些预先提交的执行（我们在 web2 中知道它们是callback）。当我们从单链世界转向具有许多Rollup的模块化世界时，对异步可组合性的需求变得更加明显。一条链停止的情况并不理想，因为它正在等待另一条链上的付款完成。任何类型的通信都需要能够跨多个区块进行。除此之外，对于任何异步组合的系统，原子属性变得很重要。所有部分完成的执行都需要在外部条件失败时恢复。正如上面所展示的，这些都是 Avail Nexus 解决的挑战。Avail Nexus 通过聚合证明在模块化世界中提供统一的体验。这允许future存储等自定义实现，并跨系统证明未来的完成。（在这种结构中，Rollup本身不会因外部故障而恢复，但Rollup会进入新状态，未来被取消。）本质上，只有在支付完成后，NFT 才能转移给某人。支付Rollup，就像我们在 web2 世界中所熟悉的 UX 一样。订单和执行验证今天以太坊上的 rollups 承担了使用以太坊作为 DA 的成本。当 Gas 费上涨时，他们支付的费用约为 1300-1600 美元/MB，甚至更高。因此，我们看到许多链希望使用 Avail 作为其链的 DA 层。这可降低 70-90% 的运营成本，具体取决于他们的施工选择和batch大小。他们仍然在以太坊上发布证明并将其用作结算层。事实上，他们只是使用以太坊作为他们的规范桥。虽然我们将在接下来的几个月中继续看到这种趋势，但实际上，如果每个区块有数百个Rollup在以太坊上自行解决，以太坊的执行将无法再次扩展。我们希望 Avail 验证者继续在以太坊上建立一座桥梁，以便能够访问那里的用户和流动性。但我们将通过 Avail Nexus 来分摊桥接成本。参与 Avail Nexus 的Rollup将由 Avail Rollup和验证其证明。经过验证的证明将通过 Vector 桥到达以太坊，Vector 桥是一个从 Avail 到以太坊的基于 ZKP 的共识证明桥。以太坊仍然能够验证执行的聚合证明，并且不必依赖 Avail 验证者，除了 DA 和顺序之外，这与 Validiums 的假设相同。现在唯一的区别是 Avail Nexus 成为Rollup的规范桥，而以太坊则使用相同的桥进行保证。该设计降低了以太坊上的执行成本，从每个验证验证一个证明到验证参与 Avail Nexus 的所有Rollup的单个证明。然后，Rollup可以像正常情况一样在以太坊上退出。 7、Avail Fusion 统一的层需要统一的安全性。建立新的Rollup而不是创建单独的 L1 的最大价值主张是能够从基础层继承安全性。要使 Avail 成为 web3 协调层，它需要非常安全，因为加密经济保证和加密保证将最终定义 Avail 生态系统。为了满足这一点，我们正在开发Fusion Security，它采用最成熟的生态系统的原生资产，例如 BTC、ETH 等，并允许它们为 Avail 共识做出贡献。不仅如此，它还允许新的Rollup代币在保护基础层方面发挥作用，从而赋予它们权力。 Fusion Security 是附加的加密经济安全，旨在实现 Avail 的统一愿景。在 Avail 平台的背景下，Fusion Security 允许在 Avail DA 共识中包含除 Avail 原生代币之外的外部代币。 Fusion 允许将两种新类别的代币添加到 Avail 的质押库中，从而增强其整个生态系统的加密经济安全性： ● 成熟的加密货币： BTC、ETH 和 SOL 等代币。 ● 新兴Rollup代币：在 Avail 上创建的新代币，仅限于总质押的一小部分以引导其效用。这种方法将逐步增强 Avail 的加密经济安全性，并标志着利用 ETH 和 BTC 等外部代币在不同区块链上达成共识的首批实例之一。目前，为 Avail 开发的 Fusion 原型遵循两种不同的方法： 1. Avail 区块链上的质押模块：该模块将通过 Avail 节点中的资产托盘支持多种外部代币。 2. 用于资产转换的质押模块：这将使外部资产能够转换为 Avail 的原生代币，并在转换时维护价格转换映射。这些方法的最终选择将在仔细考虑经济风险模型、通胀约束和其他关键因素后确定。这一举措代表了 Avail 生态系统内各种加密货币的集成和互操作性迈出了重要一步。 Fusion 的灵感来自于： ● Eigenlayer，开创了在独立于以太坊共识机制或完整验证者集运行的服务中重新抵押 ETH ● Babylon Chain，正在创建一个允许使用 BTC（比特币）跨不同区块链网络确保安全的平台 ● Osmosis，开创了网状安全性，允许一条链从其他链借用经济安全 Fusion是一种与这些方法相似但又不同的构造。它借用了其他资产的经济安全性，但对 Avail 共识中的安全性和活跃性失败进行了惩罚。 8、Avail代币 Avail 代币将推动网络内的循环经济 ● DA、Nexus 和 Fusion 安全层将通过 Avail 代币质押来保护 ● 交易和桥接费用以 Avail 的原生代币支付，确保网络能够自我维持，并为所有参与者提供一致的激励措施 Avail 代币持有者将构成许多希望在 Avail DA 上构建并利用 Avail 生态系统优势的项目的基础社区。 9、统一愿景在由数百个链组成的环境中，每个链都有自己的安全性和互操作性考虑因素，Avail 的目标是成为在整个生态系统中提供无缝、统一体验的平台。该平台将提供单用户界面，允许用户轻松管理各个区块链上的所有资产。当用户希望执行交易时，他们只需在界面上签署意图即可。然后，Avail 平台的后端就会利用 Avail Nexus 及其对异步消息传递的支持开始行动。该系统与生态系统中的其他链进行通信以满足用户的请求，确保流畅、高效、统一的 web3 用户体验。来源：金色财经

金色财经02-27 17:10

巴菲特的品味，这部分和华尔街重叠

上榜的其他公司还包括信用卡服务提供商Visa和Mastercard、饮料生产商可口可乐和住宅建筑公司 Lennar。

金融界02-27 01:49

2024 年对于以太坊和 ETHDenver 来说会是重要的一年吗

量：预测表明链上稳定币交易量可能会超过Visa的交易量，这表明金融交易正在向基于区块链的方式转变。以太坊和交易流：预计流动性质押的ETH比例将增加，从而增强以太坊生态的流动性和实用性。此外，预计私密交易增长和无Gas交易的普及将上升，rollup在一层交易数量方面的显著增加也在预期之内。 Web3 游戏增强的区块链集成：预计将更复杂地使用区块链元素在游戏机制中，并在不同类型中推出更多样化的Web3游戏。今年还可能见证传统游戏行业玩家与Web3初创公司之间更多的合作。ERC-404可能会革新游戏内资产的拥有、交易和跨不同游戏及平台的集成方式。此外，由ERC-404促进的互操作性可能使游戏宇宙更加连接和统一，使得一个游戏中的资产在另一个游戏中被利用或认可，从而丰富整体游戏体验。主流采用的挑战：吸引更大的玩家基础仍然是一个挑战，但改进开发者工具以整合Web3元素、使区块链组件更直观，可能会推动更广泛的采纳。ERC-404使NFT所有权碎片化，这降低了玩家获取和交易高价值游戏内物品的门槛，有可能导致更活跃和流动的游戏内的经济。 NFT 增长和多样化：NFT有望成为2024年Web3采用的主要推动力，但成功的项目可能会与当前已有的趋势显著不同。焦点可能转向独特的应用和更广泛的数字生态整合。流动性和可访问性：ERC-404使NFT能够作为同质化代币在DEX上交易，同时保留其独特身份。这种混合方法旨在通过增加流动性和可访问性来解决NFT市场面临的一些核心问题。通过解决流动性问题，并启用碎片化所有权，ERC-404标准可能吸引更广泛的NFT市场受众，包括收藏者和投资者。在2024年，Web3领域预计将展现出更深层次的整合、成熟化以及对监管的适应。可以期待链间和生态之间的互联互通，加上游戏和NFT领域的发展，将推动这一年向着显著成熟和主流突破迈进。期待在丹佛见到大家！来源：金色财经

金色财经02-23 14:21

对冲基金回报率是标普两倍，持有最多的是这些公司

al Resources、信用卡公司 Visa 和叫车巨头Uber也榜上有名。

金融界02-23 01:00

AI x Crypto 报告：案例研究、发展瓶颈、技术挑战

聊天内容或图像，因此可能会面临无法接入Visa和Mastercard支付方式的问题。为了解决这个问题，他们开始接受加密货币的支付方式。然而产品的其他部分并没有使用任何区块链技术。 LoverGPT并不是Crypto x AI的一个例子。我们已经确定了AI可以帮助改进加密技术栈，反之亦然，这可以通过Privasea和Dorsa的例子来说明。然而，在LoverGPT的例子中，加密部分和AI部分并没有相互作用，它们只是在产品中共存。要将某个项目视为AI x Crypto项目，仅仅让AI和Crypto为同一个产品或解决方案做出贡献是不够的——这些技术必须相互交织配合以产生解决方案。 AI和加密技术的结合往往流于表面，没有实际价值。加密技术和人工智能技术可以直接结合以产生更好解决方案的技术。将它们结合使用可以使彼此在整体项目中更好地发挥作用。只有涉及这些技术之间协同合作的项目才被分类为AI X Crypto项目。 2.2 AI与Crypto如何相互促进注意：在本报告中，我们使用“加密”一词来指代区块链技术和加密解决方案。零知识证明（ZKP）、加密签名和区块链账本都是“加密”的示例。我们将在适当的部分澄清我们所指的加密的具体方面。图2：AI和crypto在3种不同产品中的结合方式让我们回顾一下之前的案例研究。在Privasea中，FHE（即加密技术）用于生成能够接受加密输入的AI模型。因此，我们正在使用crypto（加密）解决方案来改进AI的训练过程，因此crypto正在帮助AI。在Dorsa中，AI模型被用于审查智能合约安全性。AI解决方案被用来改进加密产品，因此，AI正在帮助crypto。在评估AI X Crypto交叉点的项目时，这给我们带来了一个重要的维度：是crypto被用来帮助AI还是AI被用来帮助crypto？这个简单的问题可以帮助我们发现当前用例的重要方面，即要解决的关键问题是什么？在Dorsa的案例中，我们期望的结果是一个安全的智能合约。这可以由熟练的开发者来完成，Dorsa恰好利用AI提高了这一过程的效率。不过，从根本上说，我们只关心智能合约的安全性。一旦明确了关键问题，我们就能确定是AI在帮助crypto，还是crypto在帮助AI。在某些情况下，两者之间并不存在有意义的交互（例如LoverGPT）。下表提供了每个类别中的几个例子。 1. FHE以保护隐私的方式训练AI模型1.使用AI模型来保护、审计和监控智能合约2. 用于AI模型训练的联邦学习2.AI 模型用于高效搜索链上数据3. 零知识证明用于可验证推理3.用于创建数据分析仪表板的 LLM4. 收集和标注数据集的代币激励机制4.基于意图的交易5. AI agent支付轨道5.为链上游戏定制bots6. 分布式GPU网络6.管理DAO的AI agents表 1：Crypto与AI如何相结合您可以在附录中找到 150 多个项目的概况。如果我们由遗漏的内容，或者您有任何反馈意见，请联系我们! 总结：AI和Crypto是相辅相成的技术。要评估任何产品，关键是要了解是AI在帮助Crypto，还是Crypto在帮助AI。图 3：区别说明 2.3 产品定位让我们举一个Crypto帮助AI的例子。当组成AI的特定技术集合发生变化时，AI解决方案作为一个整体的能力也会发生变化。这种技术集合被称为栈（Stack）。AI栈包括构成AI各个方面的数学思想和算法。用于处理训练数据、训练模型以及模型推理的具体技术都是栈的一部分。栈作为一个整体，具有任何单独部分都不具备的属性和能力。各部分之间的交互，就像钟表中的齿轮一样，决定着栈的高层次行为。在栈中，各个部分之间有着深刻的联系——具体技术的组合方式决定了栈的功能。因此，改变栈就等于改变了整个技术所能实现的目标。在栈中引入新技术可以创造新的技术可能性——以太坊在其加密栈中添加了新技术，使智能合约成为可能。同样，对栈的改变也能让开发者绕过以前被认为是技术固有的问题——Polygon对以太坊加密栈所做的改变使他们能够将交易费用降低到以前认为不可能达到的水平。当一种技术在另一种技术的栈中使用时，这代表了技术之间更深入的集成，我们称之为 “内部集成”。如果两种技术一起使用，相互支持，但组成每个栈的部分没有任何改变，那么这种集成就是 “外部 ”集成。内部支持：加密技术可用于对AI栈进行内部更改，例如改变训练模型的技术手段。我们可以在人工智能栈中引入FHE技术，Privasea就是例子，在AI栈中直接内置了一个加密的部分，形成了一个经过修改的AI栈。外部支持：加密技术用于支持基于AI的功能，而无需对AI栈进行修改。Bittensor就是一个例子，它激励用户贡献数据——这些数据可用于训练AI模型。在这种情况下，模型的训练或使用方式没有任何改变；AI栈也没有发生任何变化。不过，在 Bittensor网络中，使用经济激励措施有助于AI栈更好地实现其目的。图 4：前面讨论的说明同样，AI也可以通过这两种方式帮助Crypto：内部支持：AI技术用于crypto栈内部。AI位于链上，直接与crypto栈内的部分连接。举例来说，链上的AI agents管理着一个 DAO。这种AI不只是协助cypto栈。它是技术栈中不可分割的一部分，深深嵌入技术栈中，使 DAO 正常运行。外部支持：AI为crypto栈提供外部支持。AI用于支持Crypto栈，而不对其进行内部更改。Dorsa等平台使用AI模型来确保智能合约的安全。AI在链外，是一种外部工具，用于使编写安全智能合约的过程更快以及更便宜。基于上述区别，我们现在可以将原始框架扩展到 2x2 矩阵。AI可以通过两种方式帮助Crypto：栈的内部和外部。这同样适用于Crypto帮助AI。这就为我们提供了一个框架的 4 个支柱，如下图所示。图 5：这是升级的模型，包含了内部和外部支持的区别对任何AI x Crypto项目进行分析的第一阶段就是确定它属于哪个类别。 2.4 确定瓶颈与外部支持相比，以深度技术整合为特点的内部支持往往有更多的技术难度。例如，如果我们想通过引入FHE或零知识证明（ZKPs）来修改AI栈，我们就需要在密码学和AI方面都有相当专业知识的技术人员。但很少有人属于这一交叉领域。这些公司包括Modulus (opens new window)、EZKL (opens new window)、Zama(opens new window)和Privasea (opens new window)。因此，这些公司需要大量资金和稀有人才来推进其解决方案。让用户在智能合约中集成人工智能同样需要深入的知识；Ritual (opens new window)和Ora (opens new window)等公司必须解决复杂的工程问题。反之，外部支持也有瓶颈，但它们通常涉及的技术复杂性较低。例如，为AI agents添加加密货币支付功能并不需要我们对模型有太大修改。实现起来相对容易。虽然对于AI工程师来说，构建一个ChatGPT插件，让 ChatGPT从DeFi LLama (opens new window) 网页上获取统计数据在技术上并不复杂，但很少有AI工程师是crypto社区的成员。虽然这项任务在技术上并不复杂，但能够使用这些工具的AI工程师却寥寥无几，而且很多人都不知道这些可能性。 crypto在内部帮助 AI需要解决基本深层技术挑战，包括扩展 ZKML和扩展同态加密crypto从外部帮助 AI良好的经济模型（例如如何激励数据收集，或奖励为AI网络工作贡献 GPU 的用户)AI在内部帮助crypto工程挑战。相对于crypto栈而言，AI工具已经成熟。添加AI需要解决复杂的工程问题AI为crypto提供外部帮助crypto领域AI人才稀缺 2.5 测量效用所有这四个类别中都会有好项目。如果将人工智能集成到加密技术堆栈中，智能合约开发者将能够访问链上的人工智能模型，从而增加可能性的数量，并有可能带来广泛的创新。这同样适用于将加密整合到人工智能堆栈的情况——深度技术融合将产生新的可能性。图 6：在加密堆栈中加入人工智能，为开发者提供新功能在人工智能为加密提供外部帮助的情况下，人工智能技术的集成很可能会改进现有产品，同时产生较少的突破，引入较少的可能性。例如，使用人工智能模型编写智能合约可能会比以前更快、更便宜，也可能会提高安全性，但不太可能产生以前不可能产生的智能合约。这同样适用于加密技术从外部帮助人工智能——代币激励可以用于人工智能堆栈，但这本身不太可能重新定义我们训练人工智能模型的方式。总之，将一种技术整合到另一种技术栈中可能会产生新的功能，而使用技术栈之外的技术则可能会提高可用性和效率。 2.6 评估项目我们可以根据特定项目所处的象限来估算其部分收益，因为技术之间的内部支持可以带来更大的回报，但估算一个项目经风险调整后的总收益则需要我们考虑更多的因素和风险。需要考虑的一个因素是，所考虑的项目在Web2、Web3或两者的背景下是否都有用。具有FHE功能的人工智能模型可用于替代不具有FHE功能的人工智能模型——引入FHE功能对两个领域都有用，在任何情况下，隐私都是有价值的。不过，将人工智能模型集成到智能合约中只能在 Web3 环境中使用。如前所述，人工智能和加密领域之间的技术整合是在项目内部还是外部进行的，也将决定项目上升潜力，涉及内部支持的项目往往会产生新的能力和更大的效率提升，而这是更有价值的。我们还必须考虑这项技术成熟的时间跨度，这将决定人们需要等待多长时间才能获得回报。对项目的投资。要做到这一点，可以分析当前的进展情况，并找出与项目相关的瓶颈问题（见第 2.4 节）。图 7：一个假设的例子，说明与时间跨度相比的潜在上升空间 2.7 了解复杂产品有些项目涉及我们所描述的四个类别的组合，而不仅仅是一个类别。在这种情况下，与项目相关的风险和收益往往会成倍增加，项目实施的时间跨度也会更长。此外，您还必须考虑项目的整体性是否优于各部分的总和——一个项目如果什么都有，往往不足以满足最终用户的需求。重点突出的方法往往会产生优秀的产品。利用加密技术和人工智能的所有四种组合可以使项目更有价值，但前提是整体大于部分之和。 2.7.1 示例一：Flock.io Flock.io (opens new window) 允许在多个服务器之间 "分割 "训练模型，任何一方都无法访问所有训练数据。由于可以直接参与模型的训练，因此您可以使用自己的数据为模型做出贡献，而不会泄露任何数据。这有利于保护用户隐私。随着人工智能堆栈（模型训练）的改变，这涉及到加密在内部帮助人工智能。此外，他们还使用加密代币奖励参与模型训练的人员，并使用智能合约对破坏训练过程的人员进行经济处罚。这并不会改变训练模型所涉及的流程，底层技术保持不变，但各方在都需要遵循链上罚没机制。这是加密技术从外部帮助人工智能的一个例子。最重要的是，加密技术在内部帮助人工智能引入了一种新的能力：模型可以通过去中心化网络进行训练，同时保持数据的私密性。然而，从外部帮助人工智能的加密货币并没有引入新的能力，因为代币只是用来激励用户为网络做出贡献。用户可以用法币获得补偿，而用加密货币激励是一种更优解，可以提高系统的效率，但它并没有引入新的能力。图 8(1)：Flock.io 的示意图以及堆栈的变化情况，其中颜色的变化意味着内部发生了变化 2.7.2 示例二：洛克菲勒机器人洛克菲勒机器人 (opens new window) 是一个在链上运行的交易机器人。它使用人工智能来决定进行哪些交易，但由于人工智能模型本身并不在智能合约上运行，因此我们依赖于服务提供商为我们运行模型，然后告诉智能合约人工智能的决定，并向智能合约证明他们没有说谎。如果智能合约不检查服务提供商是否说谎，服务提供商就可能代表我们进行有害的交易。洛克菲勒机器人允许我们使用ZK证明向智能合约证明服务提供商没有撒谎。在这里，ZK被用来改变人工智能堆栈。人工智能堆栈需要采用ZK技术，否则我们就无法使用ZK来证明模型对智能合约的决定。由于采用了ZK技术，由此产生的人工智能模型输出具有可验证性，可以从区块链上进行查询，这意味着该人工智能模型在加密堆栈内部使用。在这种情况下，我们在智能合约中使用了人工智能模型，以公平的方式决定交易和价格。如果没有人工智能，这是不可能实现的。图 8(2)：Flock.io 的示意图以及堆栈的变化情况，其中颜色的变化意味着内部发生了变化值得深究的问题 3.1 加密领域与深度伪造 (Deepfake) 启示录 "一台电脑就能造成这么大的破坏......如果不了解一些基本的真相，我们该如何运作？ - 谷歌前首席执行官埃里克-施密特（Eric Schmidt）致 Chainlink 联合创始人谢尔盖-纳扎罗夫（Sergey Nazarov） 1月23日，一条人工智能生成的语音信息谎称自己是拜登总统 (opens new window) ，劝阻民主党人不要在 2024 年初选中投票。不到一周后，一名金融工作者因模仿其同事的深度伪造视频通话，损失了2500万美元。与此同时，在X（前身为Twitter）上，人工智能伪造的泰勒·斯威夫特（Taylor Swift）的露骨照片吸引了4500万次浏览，引发了广泛的愤怒。这些事件都发生在2024年的头两个月，它们只是深度伪造在政治、金融和社交媒体领域产生的各种破坏性影响的一个缩影。 3.1.1 它们是如何成为问题的？伪造图像并不是什么新鲜事。1917年，The Strand杂志上刊登了一些被设计成仙女模样的精巧剪纸照片；许多人认为这些照片是超自然力量存在的有力证据。图 10：《科廷利仙子》照片之一。福尔摩斯的创作者阿瑟-柯南-道尔爵士曾将这些伪造图片作为灵异现象的证据随着时间的推移，造假变得越来越容易，成本也越来越低，从而大大提高了错误信息的传播速度。例如，在2004年美国总统大选期间，一张经过篡改的照片虚假地显示民主党提名人约翰·克里（John Kerry）与简·方达（Jane Fonda）一起参加抗议活动，简-方达是一位颇具争议的美国活动家。科廷利仙子需要精心布置，用硬纸板剪出儿童读物中的描摹图画，而这次伪造则是用Photoshop完成的简单任务。图 11：这张照片表明约翰·克里与简·方达在反越战集会上同台。后来发现这是一张伪造的照片，是用Photoshop将两张现有的图片合成的不过，由于我们学会了如何辨别编辑痕迹，假照片带来的风险已经降低。在“游客小哥 ”的案例中，业余爱好者能够通过观察场景中不同物体的白平衡不一致来识别图片是否经过剪辑。这是公众对虚假信息认识提高的产物；人们已经学会注意图片编辑的痕迹。“Photoshoped”一词已成为通用术语：图像被篡改的迹象已得到普遍认可，照片证据不再被视为不可篡改的证据。 3.1.1.1 Deepfake 让造假更容易、更便宜、更好过去，伪造证件很容易被肉眼识破，但深度伪造技术使制作几乎与真实照片无异的图像变得简单而廉价。例如，OnlyFake网站使用深度伪造技术在几分钟内生成逼真的假身份证照片，只需15美元。这些照片被用来绕过OKX（一家加密货币交易所）的反欺诈保障措施，即所谓的“了解你的客户"（KYC）。在 OKX 的案例中，这些深度伪造的ID骗过了他们的员工，而这些员工都受过识别篡改图片和深度伪造的培训。这凸显出，即使是专业人士，也不再可能通过肉眼发现基于深度伪造的欺诈行为。由于图像被深度伪造，人们加强了对视频证据的依赖，但深度伪造不久将严重破坏视频证据（的可信度）。德克萨斯大学达拉斯分校的一名研究人员利用免费的深度伪造换脸工具，成功绕过了KYC提供商实施的身份验证功能。这是一个巨大的进步——过去，要生成具有合格水平的视频既昂贵又耗时。 2019 年，有人需要花费两周时间和552美元，才能制作出一段38秒的马克·扎克伯格深度伪造视频，视频中还会出现明显的视觉缺陷。如今，我们可以在几分钟内免费制作出逼真的deepfake视频。图 12：OnlyFake面板，用于在几分钟内创建自己的假身份证 3.1.1.2 视频为何如此重要在深度伪造技术出现之前，视频曾是可靠的证据。与容易伪造的图像不同，视频在历史上一直是难以伪造的，因此在法庭上被公认为是可靠的证据。这使得视频深度伪造变得尤为危险。与此同时，深度伪造的出现也可能导致对真实视频的否定，美国总统拜登的一段视频就被错误地称为深度伪造。批评者以拜登眼睛一眨不眨和光线差异为证据，这些说法已被推翻。这就导致了一个问题——“深度伪造”不仅让假的看起来像真的，也让真的看起来像假的，进一步模糊了真实与虚构之间的界限，增加了问责的难度。我们仍然相信视频，尽管它们现在可以伪造。深度伪造实现了大规模定向广告。我们可能很快就会看到另一个YouTube，在这个版本中，所说的内容、所说的人以及所说的地点都是针对观众个性化定制的。一个早期的例子是Zomato的本地化广告，广告中演员赫里希克·罗尚（Hrithik Roshan）在观众所在城市的热门餐馆点菜。Zomato生成了不同的深度伪造广告，根据观众不同的GPS位置生成广告内容，介绍观众所在地的餐馆。 3.1.2 目前的解决方案有什么不足？ 3.1.2.1 意识现在的深度伪造技术已经非常先进，足以骗过训练有素的专家。这使得黑客能够绕过身份验证（KYC/AML）程序，甚至人工审核。这表明，我们无法用眼睛将深度伪造与真实图像区分开来。我们不能仅仅通过对图像持怀疑态度来防范深度伪造：我们需要更多的工具来应对深度伪造的流行。 3.1.2.2 平台如果没有强大的社会压力，社交媒体平台并不愿意有效抑制深度伪造。例如，Meta禁止含有虚假音频的度伪造视视频，但拒绝禁止纯捏造的视频内容。他们违背了自己的监督委员会的建议，没有删除一段显示拜登总统抚摸孙女的深度伪造视频，即纯属捏造的内容。 3.1.2.3 政策我们需要制定法律，有效应对新型深度伪造风险，同时又不限制问题较少的用途，如艺术或教育领域，因为这些用途并不试图欺骗人们。泰勒·斯威夫特（Taylor Swift）深度伪造图片未经同意而被传播等事件，促使立法者通过更严格的法律来打击此类深度伪造行为。针对此类案件，可能有必要在法律上强化在线审核程序，但禁止所有人工智能生成内容的提议引起了电影制作人和数字艺术家的警觉，他们担心这会不公正地限制他们的工作。找到正确的平衡点是关键，否则那些合法的创意应用将被扼杀。推动立法者提高训练强大模型的准入门槛，大型科技公司可以确保其人工智能垄断地位。这可能会导致权力不可逆转地集中在少数公司手中——例如，涉及人工智能的第 14110号行政命令就建议对拥有大量计算能力的公司提出严格要求。图 13：美国副总统卡马拉-哈里斯（Kamala Harris）在美国总统乔-拜登（Joe Biden）签署美国首个人工智能行政命令时鼓掌。2023 年 10 月 30 日，华盛顿特区 3.1.2.4 技术直接在人工智能模型中建立防护栏以防止滥用是第一道防线，但这些防护栏不断被破坏。人工智能模型很难审查，因为我们不知如何使用现有低级工具来修改更高维度的行为。此外，训练人工智能模型的公司可以利用实施防护栏作为借口，在其模型中引入不良审查和偏见。这是有问题的，因为大型科技人工智能公司无需对公众意愿负责——公司可以自由地影响其模型，而损害用户的利益。即使强大人工智能的创造权并未集中在不诚实的公司手中，要想建立一个既有防护措施又不偏不倚的人工智能可能仍然是不可能的。研究人员很难确定什么是滥用，因此很难以中立、平衡的方式处理用户请求的同时防止滥用。如果我们无法定义滥用，似乎就有必要降低防范措施的严格程度，可能导致滥用再次发生。因此，完全禁止滥用人工智能模型是不可能的。一种解决方案是在恶意深度伪造出现后立即对其进行检测，而不是阻止其产生。但是，深度伪造检测人工智能模型（如OpenAI部署的模型由于不准确，正在变得过时。虽然深度赝品检测方法已经变得越来越复杂，但制造深度赝品的技术却在以更快的速度变得越来越复杂——深度伪造检测器在技术军备竞赛中败下阵来。这使得仅凭媒体很难识别深度假新闻。人工智能已经足够先进，可以制造出逼真到人工智能无法判断其准确性的假镜头。水印技术能够在深层伪造品上隐蔽地打上标记，无论它们出现在哪里，我们都能识别出来。但是，深度伪造品并不总是带有水印，因为水印必须是刻意添加的。自愿将其伪造图像标出而做出区分的公司（如OpenAI），水印是一个有效的方法。但无论如何，水印都可以用简单易用的工具去除或伪造，从而绕过任何基于水印的防深度伪造解决方案。水印也可能被意外删除：大多数社交媒体平台都会自动删除水印。最流行的深度伪造水印技术是C2PA（由内容出处和真实性联盟提出）。它旨在通过追踪媒体来源并将此信息存储在媒体元数据中来防止错误信息。该技术得到了Microsoft、Google和Adobe等公司的支持，因此C2PA很有可能会在整个内容供应链中推广，它比起其他同类技术更加受欢迎。遗憾的是，C2PA也有自己的弱点。由于C2PA会存储图像的完整编辑历史，并使用符合 C2PA标准的编辑软件中所控制的加密密钥，对每次编辑进行验证，因此我们必须信任这些编辑软件。但是，人们很可能会因为有效的C2PA元数据而直接接受经过编辑的图像，而不会考虑是否信任编辑链中的每一方。因此，如果任何编辑软件遭到破坏或能够进行恶意编辑，就有可能让其他人相信伪造或恶意编辑的图像是真实的。我们需要安全的硬件，否则确保 C2PA 安全的密钥就会被盗。图 14：包含一连串编辑的符合C2PA标准元数据的图像示例。每个编辑都由不同的可信方签名，但只有最终编辑的图像是公开的。资料来源：真实照片与人工智能生成的艺术：新标准（C2PA）利用 PKI 显示图像的历史此外，C2PA水印中包含的加密签名和元数据可以与特定用户或设备联系起来。在某些情况下，C2PA元数据可以将您的相机拍摄的所有图像相互连接起来：如果我们知道某张图像来自某人的相机，我们就可以识别来自该相机的所有其他图像。这可帮助举报人在发布照片时匿名化处理。所有潜在的解决方案都将面临一系列独特的挑战。尽管这些挑战千差万别——包括社会意识的局限性、大型科技公司的缺陷、监管政策的实施难度以及我们的技术局限性。解决深度伪造错误信息的问题没有万全之策。 3.1.3 加密货币能解决这个问题吗？开源的深度伪造模型已经开始流传。因此，有人可能会说，总有一些方法可以利用深度伪造来滥用他人的肖像；即使这种做法被定为犯罪，有人还是会选择生成不道德的深度伪造内容。不过，我们可以让恶意深度伪造内容退出主流来解决这一问题。我们可以防止人们认为深度伪造的图片是真实的，且能够创建限制深度伪造内容的平台。本节将介绍各种基于加密技术的解决方案，以解决恶意深度伪造传播带来的误导问题，同时强调每种方法的局限性。 3.1.3.1 硬件认证经过硬件认证的相机在拍摄每张照片时都会嵌入一个独特的证明，证明照片是由该相机拍摄的。该证明由相机独有的不可复制、防篡改芯片生成，确保图像的真实性。音频和视频也可以使用类似的程序。入侵软件的成本更低，但入侵安全芯片的成本却很高。认证证明告诉我们，图像是由真实相机拍摄的，这意味着我们通常可以相信这是真实物体的照片。我们可以标记没有这种证明的图像。但如果相机拍摄的是伪造场景，而伪造场景的设计看起来就像真实场景，那么这种方法就失效了——你可以直接将相机对准一张伪造的图片。目前，我们可以通过检查捕捉到的图像是否失真来判断照片是否从数字屏幕上拍摄的，但骗子们会找到隐藏这些瑕疵的方法（例如，通过使用更好的屏幕，或通过限制镜头眩光）。最终，即使是人工智能工具也无法识别这种欺诈行为，因为骗子可以找到避免所有这些失真的方法。硬件认证将减少信任伪造图像的情况，但少数情况下，我们仍然需要额外的工具来防止深度伪造图像在摄像头被入侵或滥用情况下传播。正如我们之前所讨论的，使用经过硬件验证的摄像头仍有可能造成深度伪造内容是真实图像的错误印象，原因比如摄像头被黑客攻击，或相机被用来拍摄电脑屏幕上深度伪造的场景。要解决这个问题，还需要其他工具，比如摄像头黑名单。相机黑名单将使社交媒体平台和应用程序能够标记来自特定相机的图像，因为已知该相机过去曾生成过误导性图像。黑名单可以无需公开披露可用于追溯相机的信息，如相机 ID 等。然而，目前还不清楚由谁来维护摄像机黑名单，也不清楚如何防止人们收受贿赂后把举报人的相机也加入黑名单（的报复行为）。 3.1.3.2 基于区块链的图像年表区块链是不可篡改的，因此在互联网上出现图像时，将图像与附加元数据一起添加到带有时间戳的年表中，这样时间戳和元数据就不会被篡改。由于未经编辑的原始图片在恶意编辑扩散之前，就能被诚实的各方以不可更改的方式存储在区块链上，因此访问这样的记录将使我们能够识别恶意编辑并验证原始来源。这项技术已在Polygon区块链网络上实施，作为与福克斯新闻合作开发的事实核查工具 Verify 的一部分。区块链可以防止人们篡改图片的时间顺序，但无法阻止欺骗性图片的出现。图 15：Fox 基于区块链的工具 Verify 的用户界面。可以通过 URL 查找艺术品。从 Polygon 区块链获取并显示来源、交易哈希值、签名、时间戳和其他元数据。 3.1.3.3 数字身份如果“深度伪造”（deepfakes）会破坏我们对未经核实的图片和视频的信任，那么可信来源可能会成为避免虚假信息的唯一途径。我们已经依赖可信的媒体来源来核实信息，因为它们采用新闻标准、事实核查流程和编辑监督来确保所发布内容的准确性和可信度。然而，我们需要一种方法来验证我们在网上看到的内容是否来自我们信任的来源。这就是加密签名数据的用处：它可以用数学方法证明某篇内容的作者是谁。签名是使用数字密钥生成的，由于密钥是由钱包创建和生成的，因此只有拥有相关加密钱包的人才知道。这样我们就能知道谁是数据的作者：您只需检查签名是否与个人加密钱包中的密钥相对应，而该密钥只属于个人。我们可以利用加密货币钱包，以无缝和用户友好的方式为我们的帖子附加签名。如果我们使用加密货币钱包登录社交媒体平台，就可以利用钱包在社交媒体上创建和验证签名的功能。因此，如果某个帖子的来源不可信，平台将能够向我们发出警告——它将使用自动签名校验来标记错误信息。此外，zk-KYC基础设施与钱包连接，可将未知钱包与真实身份绑定，而不会损害用户隐私和匿名性。这意味着骗子无法用虚假身份创建虚假账户来兜售虚假信息。 3.1.3.4 经济激励措施 "（有了Veracity Bonds），如果你的手在饼干罐里被抓到，你实际上会赔钱，而且，作为读者，我会知道你有多可信"。 - 查尔斯-霍斯金森，卡达诺创始人；以太坊联合创始人作者可因错误信息而受到惩罚；用户可因识别错误信息而获得奖励。例如，“真实性债券”使媒体机构能够以其出版物的准确性作为赌注，并因错误信息面临经济处罚。因此，“真实性债券”为这些媒体公司提供了一个经济上的理由来确保信息的真实性。真实性债券将是我们的“真相市场”不可分割的一部分，在这个市场上，不同的系统通过以最高效、最稳健的方式验证内容的真实性来赢得用户的信任。这类似于证明市场，如Succinct Network和=nil Proof Market，但针对的是仅靠密码学还不足以验证真相的模糊问题。智能合约（Smart Contracts）可以作为一种手段，强制实施使这些真相市场发挥作用所需的经济激励措施，因此区块链技术可能会在帮助打击虚假信息方面发挥核心作用。 3.1.3.5 声誉评分 "如果我们不解决内容的声誉和认证（问题），事情就会变得非常奇怪"。 - 伊利亚-波罗苏欣，NEAR 联合创始人；《关注就是你所需要的一切》一书的共同作者我们可以用声誉来代表可信度。例如，我们可以看一个人在推特上有多少粉丝，来判断我们是否应该相信他所说的话。不过，声誉系统也应考虑作者的过往记录，而不仅仅是他们的知名度。我们不能把可信度与影响力混为一谈。我们不能允许人们无限量地生成匿名身份，否则，他们就可以在名誉受损时抛弃自己的身份，以重置他们的社会可信度。这就要求我们使用无法复制的数字身份，如上一节所述。我们还可以利用“真相市场”和“硬件认证”中的证据来确定一个人的声誉，因为这些都是追踪其真实记录的可靠方法。声誉系统是迄今为止所有其他解决方案的集大成者，因此也是最稳健、最全面的方法。图 16：马斯克在 2018 年提出要建立网站对期刊论文、编辑和出版物的可信度评分 3.1.4 加密货币解决方案可以扩展吗？上述区块链解决方案需要快速和高存储量的区块链——否则，我们就无法将所有图像纳入链上可验证的时间逻辑记录中。随着每天发布的在线数据量呈指数级增长，这一点只会变得越来越重要。不过，有一些算法可以以可验证的方式压缩数据。此外，通过硬件认证生成的签名不适用于图像的编辑版本：必须使用 zk-SNARKs 生成编辑证明。ZK Microphone 是音频校验实现的案例。 3.1.5 深度伪造并非天生有害必须承认，并非所有的深度伪造都是有害的。这项技术也有良性的用途，比如这段人工智能生成的泰勒-斯威夫特（Taylor Swift）教授数学的视频。由于深度伪造的低成本和可访问性，更个性化的体验也成为可能。例如，HeyGen允许用户发送带有人工智能生成的酷似自己人脸的个人信息。深度仿真还通过配音翻译帮助缩小语言差距。 3.1.5.1 控制深度伪造并将其货币化的方法基于深度伪造技术的人工智能“仿真人”服务(AI counterpart services)，他们收取高额费用，缺乏问责制和监督。最近，OnlyFans上的头号网红Amouranth发布了自己的数字人服务，粉丝们可以与她私下交流。这些服务，尤其是初创公司，可能会限制甚至关闭访问权限。例如，AI伴侣网站Soulmate关闭后，用户伤心欲绝。托管在链上的人工智能模型可以为用户提供更有力的保证，确保他们不会失去访问权，并通过透明的利润分享来奖励贡献者。智能合约可以访问这些人工智能模型。这样就可以在智能合约中设置精细的规则，规定如何使用这些模型。不过，这也存在技术挑战。目前，Giza、Modulus Labs 和 EZKL 所使用的一种方法——zkML——会产生高达1000倍的开销。这是一个活跃的研究领域，目前正在探索几种替代方案。例如，HyperOracle正在尝试使用 opML，Aizel正在构建一个基于多方计算（MPC）和可信执行环境（TEE）的解决方案。 3.1.6 章节摘要复杂的深度伪造正在侵蚀政治、金融和社交媒体领域的信任，凸显了建立 "可验证网络 "以维护真相和民主诚信的必要性。深度伪造曾经是一项昂贵且技术密集型的工作，但随着人工智能的进步，它已变得很容易制作，从而改变了错误信息的格局。历史背景告诉我们，操纵媒体并不是新的挑战，但人工智能使制造令人信服的假新闻变得更加容易和便宜，因此需要新的解决方案。视频造假带来了独特的危险，因为它们损害了传统上被认为是可靠的证据，导致社会陷入一种困境，即真实行为可能被当作假的。现有对策分为意识、平台、政策和技术方法，每种方法在有效打击深度伪造方面都面临挑战。硬件证明和区块链证明了每张图片的来源，并创建了透明、不可更改的编辑记录，从而提供了前景广阔的解决方案。加密货币钱包和zk-KYC加强了在线内容的验证和认证，而链上信誉系统和经济激励措施（如 "真实性债券"）则为真相提供了一个市场。在承认深度伪造的积极用途的同时，加密技术还提出了一种将有益的深度伪造列入白名单的方法，从而在创新与诚信之间取得平衡。 3.2 苦涩的一课 “从70年的人工智能研究中可以收获的最大教训是，利用通用方法计算最终是最有效的，而且是以很大的优势取胜。” \– The Bitter Lesson苦涩的一课, Rich Sutton教授这句话有悖常理，但却是事实。人工智能界拒绝接受定制方法效果不佳的说法，但"苦涩的教训"仍然适用：使用最强的计算能力总能产生最好的结果。我们必须扩大规模：更多GPU、更多数据中心、更多训练数据。计算机国际象棋研究人员曾试图利用人类顶尖棋手的经验来构建国际象棋引擎，这就是研究人员弄错了的一个例子。最初的国际象棋程序都是照搬人类的开局策略（使用"开局书"）。研究人员希望国际象棋引擎能从强势局面开始，而无需从头开始计算最佳棋步。它们还包含许多"战术启发法"——人类棋手使用的战术，如叉子。简单地说：国际象棋程序是根据人类对如何成功下棋的见解而不是一般的计算方法构建的。图 17：叉子的一个实例。皇后用于同时攻击两个棋子。图 18：国际象棋开局顺序示例。 1997年，IBM的DeepBlue结合了巨大的计算能力和基于搜索的技术，击败了国际象棋世界冠军。尽管DeepBlue优于所有"人类设计"的国际象棋引擎，但国际象棋研究人员对其避而远之。他们认为，DeepBlue的成功只是昙花一现，因为它并没有采用国际象棋策略——在他们看来，这是一种粗暴的解决方案。他们错了：从长远来看，将大量计算应用于一般问题的解决方法往往会比定制方法产生更好的结果。这种高计算意识形态催生了成功的围棋引擎（AlphaGo）、改进的语音识别技术，以及更可靠的计算机视觉技术。高计算人工智能方法的最新成果是OpenAI的ChatGPT。与之前的尝试不同，OpenAI 并没有试图将人类对语言工作原理的理解编码到软件中。相反，他们的模型将来自互联网的大量数据与海量计算结合起来。与其他研究人员不同的是，他们没有干预，也没有在软件中嵌入任何偏见。从长远来看，性能最好的方法总是基于利用大量计算的通用方法。这是历史事实；事实上，我们可能有足够的证据证明这一点永远正确。从长远来看，将巨大的计算能力与大量数据相结合是最好的方法，其原因在于摩尔定律：随着时间的推移，计算成本将呈指数级下降。在短期内，我们可能无法确定计算带宽的大幅增长，这可能导致研究人员试图通过手动将人类知识和算法嵌入软件来改进他们的技术。这种方法可能会在一段时间内奏效，但从长远来看不会取得成功：将人类知识嵌入底层软件会使软件变得更加复杂，模型也无法根据额外的计算能力进行改进。这使得人工方法变得目光短浅，因此萨顿建议我们忽略人工技术，将重点放在将更多计算能力应用于通用计算技术上。《苦涩的一课》对我们应该如何构建去中心化的人工智能有着巨大的影响：构建大型网络：上述经验教训凸显了开发大型人工智能模型并汇集大量计算资源对其进行训练的紧迫性。这些都是进入人工智能新领域的关键步骤。Akash、GPUNet和 IoNet等公司旨在提供可扩展的基础设施。图 19：Akash价格与亚马逊AWS等其他供应商的比较硬件创新： ZKML 方法一直受到批评，因为它们的运行速度比非ZKML方法慢1000倍。这与神经网络面临的批评不谋而合。20世纪90年代，神经网络展现出了巨大的前景。Yann LeCun的CNN模型是一个小型神经网络，能够对手写数字图像进行分类（见下图），并取得了成功。到1998 年，美国有超过10%的银行使用这种技术读取支票。然而，这些CNN模型无法扩展，因此人们对这些神经网络的兴趣急剧下降，计算机视觉研究人员又开始利用人类知识来创建更好的系统。2012年，研究人员利用GPU（一种通常用于生成计算机图形（游戏、CGI 等的流行硬件）的计算效率，开发出一种新的 CNN。这让他们达到了令人难以置信的性能，超过了当时所有其他可用的方法。这个网络被称为 AlexNet，它引发了深度学习革命。图 20：90 年代的神经网络只能处理低分辨率的数字图像图 21：2012 年的神经网络（AlexNet）能够处理复杂图像，其性能优于所有其他方法。人工智能技术的升级是必然的，因为计算成本总是越来越低。用于ZK和FHE等技术的定制硬件将加速进展——Ingonyama等公司和学术界正在铺平道路。从长远来看，我们将通过应用更强的计算能力和提高效率来实现大规模的ZKML。唯一的问题是，我们将如何利用这些技术？图 22：ZK 证明器硬件进步的一个例子扩展数据：随着人工智能模型规模和复杂性的增长，有必要相应地扩展数据集。一般来说，数据集的规模应与模型规模成指数增长，以防止过度拟合并确保性能稳定。对于一个拥有数十亿参数的模型来说，这往往意味着要策划包含数十亿token或示例的数据集。例如，谷歌的BERT模型是在包含超过25亿个单词的整个英文维基百科和包含约8亿个单词的BooksCorpus上进行训练的。而Meta的 LLama则是在1.4万亿个词库的基础上进行训练的。这些数字强调了我们所需的数据集的规模——随着模型向万亿个参数发展，数据集必须进一步扩大。这种扩展可以确保模型能够捕捉到人类语言的细微差别和多样性，因此开发庞大、高质量的数据集与模型本身的架构创新同样重要。Giza、Bittensor、Bagel和FractionAI等公司正在满足这一领域的特殊需求（有关数据领域的挑战，如模型崩溃、对抗性攻击和质量保证方面的挑战，详见第 5 章）。开发通用方法：在去中心化人工智能领域，ZKPs和FHE等技术采用针对具体应用的方法是为了追求立竿见影的效率。为特定架构量身定制解决方案可提高性能，但可能会牺牲长期灵活性和可扩展性，从而限制更广泛的系统演进。相反，专注于通用方法提供了一个基础，尽管最初会有效率低下的问题，但具有可扩展性，能够适应各种应用和未来的发展。在摩尔定律等趋势的推动下，随着计算能力的增长和成本的降低，这些方法必将大放异彩。在短期效率和长期适应性之间做出选择至关重要。强调通用方法可以为去中心化人工智能的未来做好准备，使其成为一个稳健、灵活的系统，充分利用计算技术的进步，确保持久的成功和相关性。 3.2.1 结论在产品开发的早期阶段，选择不受规模限制的方法可能至关重要。这对公司和研究人员评估用例和想法都很重要。然而，惨痛的教训告诉我们，从长远来看，我们应该始终牢记优先选择通用的可扩展方法。这里有一个手动方法被自动、通用微分所取代的例子：在使用TensorFlow和PyTorch等自动微分（autodiff）库之前，梯度通常是通过手动或数值微分来计算的——这种方法效率低、容易出错，而且会产生问题，浪费研究人员的时间，而自动微分则不同。现在 Autodiff已成为不可或缺的工具，因为autodiff库加快了实验速度，简化了模型开发。因此，通用解决方案获胜了——但在autodiff成为成熟可用的解决方案之前，旧的手动方法是进行ML研究的必要条件。总之，里奇·萨顿的"苦涩的一课"告诉我们，如果我们能最大限度地提高人工智能的计算能力，而不是试图让人工智能去模仿人类所熟知的方法，那么人工智能的进步将会更快。我们必须扩展现有计算能力、扩展数据、创新硬件并开发通用方法——采用这种方法将对去中心化人工智能领域产生诸多影响。尽管"苦涩的一课"不适用于研究的最初阶段，但从长远来看，它可能永远都是正确的。 3.3 AI Agents（人工智能代理）将颠覆谷歌和亚马逊 3.3.1 谷歌的垄断问题在线内容创作者通常依赖谷歌来发布他们的内容。反过来，如果允许谷歌索引和展示他们的作品，他们就能获得源源不断的关注和广告收入。然而，这种关系是不平衡的；谷歌拥有垄断地位（超过80%的搜索引擎流量），其市场份额是内容创作者自身无法企及的。因此，内容创作者的收入严重依赖于谷歌和其他科技巨头。谷歌的一个决定就有可能导致个人业务的终结。谷歌推出的精选片段（Featured Snippets）功能——显示用户查询的答案，而无需点击进入原始网站——突出了这一问题，因为现在无需离开搜索引擎就能获得信息。这打乱了内容创建者赖以生存的规则。作为被谷歌索引其内容的交换条件，内容创建者希望自己的网站能获得推荐流量和眼球。取而代之的是，精选片段（Featured Snippets）功能允许谷歌总结内容，同时将创作者排除在流量之外。内容生产者的分散性使他们基本无力采取集体行动反对谷歌的决定；由于没有统一的声音，单个网站缺乏讨价还价的能力。图 23：Featured Snippets示例谷歌通过提供用户查询答案的来源列表进行了进一步试验。下面的示例包含《纽约时报》、维基百科、MLB.com等网站的来源。由于谷歌直接提供了答案，这些网站不会获得那么多流量。图 24：Featured Snippets中 “来自网络”功能示例 3.3.2 OpenAI 的垄断问题谷歌推出的“精选片段”功能代表了一种令人担忧的趋势——减少原创内容创作者的认可。ChatGPT将这一概念进行了逻辑上的延伸，充当了一个无所不知的信息代理，没有任何链接，也没有对原始材料的引用。像ChatGPT这样的语言模型可以通过总结从互联网上搜罗的内容来回答几乎任何问题，但它无法引导用户访问原始出版者。相反，该模型将从版权作品中获得的知识积累到一个完全由OpenAI 控制的单一界面中。这些模型的成功依赖于构成互联网的海量数据，而内容创作者对模型训练的重要投入却得不到任何回报。一些规模较大的出版商设法与OpenAI等公司达成协议，但对于规模较小的内容创作者来说，这样的做法是不可行的。还有一些出版商决定干脆阻止人工智能模型搜索他们的内容，但对于闭源模型来说，这一点无法得到保证。人工智能公司试图为自己的不赔偿行为辩解，称人工智能系统只是从内容中学习——就像人类从阅读中了解世界一样——但在产出内容时并没有侵犯内容创作者。不过，这种说法值得商榷，因为ChatGPT可以逐字逐句地复制《纽约时报》的整篇文章。Midjourney 和 DALL-E 也能生成受版权保护的内容。其影响显而易见——大科技公司继续巩固权力，而无关联的内容创作者的影响力却在减弱。这种不对称的关系引发了对谷歌的诉讼，而这种关系只会变得更加极端。老牌出版商，如纽约时报已经采取了法律行动，从数字艺术家到编码员等一系列内容创作者也采取了集体诉讼。一种建议的解决方案是"检索增强生成"（RAG），它允许语言模型为其答案提供来源。然而，这与”精选片段“存在同样的问题——它根本没有给用户任何访问原始网站的理由。更糟糕的是，科技巨头们可以虚伪地利用RAG作为法律掩护，但同时仍剥夺了创作者的流量和广告收入。图 25：RAG将链接作为来源，此结果由 Perplexity AI 生成 3.3.3 加密领域的潜在解决方案随着像ChatGPT这样的"信息代理"的出现，大科技公司似乎准备重蹈覆辙，垄断人工智能的生成，尽管它们依赖的是未经认可的创作者内容。但是，现在人工智能正在扰乱市场，我们有机会重新分配权力，建立一个更公平的系统来补偿创作者。本世纪初，政策制定者错失了建立公平模式的机会，导致了今天的分配系统——一个由谷歌垄断的系统。当前人工智能的崛起是一个十字路口，我们是要纠正过去的错误，还是要让历史重演，让 OpenAI 和其他科技巨头获得单方面的控制权？为了长期激励优质内容的生产，我们必须探索继续为创作者提供公平报酬的方法。正如克里斯-迪克森（Chris Dixon）所言，加密货币通过区块链提供了一种解决方案，即充当集体谈判机器，解决类似的大规模经济协调问题，尤其是在当前权力不对称的情况下。它们的治理可以由创作者和人工智能提供商共同管理。在人工智能方面，创造者可以利用区块链的能力来编写由软件强制执行的使用条款和规定相关限制。例如，通过设定模型训练等商业应用的条件。然后，智能合约将自动执行归属系统，将人工智能系统产生的部分收入分配给贡献者。（在没有只能合约的情况下）即使目前的人工智能公司想要补偿创作者，但是由于人数太多也不太可行。区块链的可组合性还将减少对任何单一模式的依赖，从而实现更自由的人工智能市场。这种竞争将为创作者带来更友好的利润分享。面对由公正协议执行的统一条款，人工智能公司要么接受创作者制定的集体协议，要么只能放弃；科技巨头再也不能对个人施加单方面的影响力。对ChatGPT等信息代理的集中控制也引发了对嵌入式广告等问题的担忧。虽然谷歌在搜索结果的顶部对广告进行了明确划分，但AI agents可以将付费推荐无缝整合到回复中。相比之下，基于加密领域的解决方案允许对AI agents进行审计。 3.3.4 人工智能代理（AI Agents）与亚马逊从像ChatGPT这样回答语言模型自然延伸出来的是可以代表用户采取行动的人工智能程序，即从信息代理到行动代理（简称"代理"）的转变。这些系统不仅能为你找到最好的蓝牙音箱，还能直接订购送货到家。依靠OpenAI等公司的闭源代理来完成这些任务，将赋予它们超越内容创作市场的巨大力量，有可能让它们主导 6.3 万亿美元的电子商务市场等行业。OpenAI不仅会成为下一个谷歌，也会成为下一个亚马逊。如果少数几家大型科技公司拥有功能最强大、应用最广泛的人工智能代理，那么它们将对消费者和各行各业产生巨大的影响力。这些代理将对我们越来越广泛的数字生活——购物、旅行和理财——起到中介作用。如果没有人工智能代理，我们就只能依赖 OpenAI或谷歌这样的公司。它们的闭源代理将成为网络世界的守门人，控制我们对关键服务和信息的访问，而且它们可以修改代理的行为，而无需承担任何责任。这种专有人工智能的权力集中与谷歌和Facebook等大型科技垄断企业的崛起有相似之处。但是，当人工智能代理可以跨领域无缝地采取行动时，其影响将呈指数级增长。这就是去中心化的区块链替代方案如此重要的原因——它们引入了竞争、用户授权和透明度，能够抵御人工智能代理被大型科技公司垄断的风险。总之，像ChatGPT这样的人工智能模型为我们提供了信息代理，可以代表我们阅读内容并回答问题。这不仅会颠覆我们消费信息的方式，也会颠覆谷歌的商业模式和创作者赖以生存的规则。在这种颠覆面前，我们有机会建立一个对创作者的工作和贡献更公平地产生回报的新互联网。能够采取行动人工智能代理（例如在线购买商品）的区块链技术将颠覆电子商务。区块链再次为建立公平的互联网模式提供了机会。我们能否从谷歌和亚马逊时代的错误中吸取教训？ 3.4 加密领域将加速人工智能的开源技术的发展 3.4.1 人工智能现在处于什么阶段？目前，人工智能已成为21世纪发达社会的主要工具。人工智能的应用范围包括艺术、教育、金融、政治、编程以及更多其他应用。只需有限的提示，它就能在几秒钟内生成逼真的视频和图像。程序员已经开始使用人工智能来开发高效实用的代码，将自己的劳动外包给人工智能。现实世界与科幻小说之间的界限正在随着人工智能在我们社会中的每一次应用而变得越来越模糊。因此，我们很可能会面临劳动力危机。如果我们能够将大量的智力劳动外包给人工智能，那么从经济角度来看，使用人工智能可能很快就会比使用人类劳动力更有优势。如果人类劳动力被人工智能取代，我们就需要适应劳动力市场的这种新状态。这种适应将导致我们当前经济系统的运作方式发生混乱。本节将讨论人工智能的发展方向，以及通过加密技术解决方案防止此类危机发生的方法。 3.4.2 我们为什么要关注开源人工智能？一般来说，开源软件是开放给任何人使用的软件，通常附有许可证，说明可以使用该软件、和不可以使用该软件做什么。开源人工智能是指人工智能软件开放给任何人使用，并通过许可证提供类似的限制。开源项目在通常采取自由参与产品开发的组织形式。它以社区为中心，社区欢迎代码贡献和错误修正，往往具有协作性质。本节将说明人工智能开源的重要性。人工智能技术的开源可以用来创造一个更具竞争力的人工智能市场。竞争是件好事，因为在开发产品的过程中，有各种各样的人拥有不同的才能和不同的技术水平。假设有一家公司才济济，但却犯了一个大错误，那么竞争性市场就会鼓励人们去弥补这个错误，从而限制错误造成的损害。开源人工智能降低了人们进入人工智能市场的门槛，任何人都可以使用人工智能软件并做出贡献。由于任何人都可以通过开源人工智能进入市场，这就意味着市场上有了更多的竞争者，使该行业的竞争比现在激烈得多。通过开源人工智能技术可用于保护行业免受恶意伤害。技术是一种强大的工具，但其本身是中性的。它可以用来造福人类，也可以用来危害人类，这取决于技术掌握在谁的手中。我们更希望有好的行为者来掌握这项技术，尤其是为了对抗那些利用技术来伤害人类的行为者。通过开源可以让更多的好人和人才进入人工智能行业。这样可以有效打击那些希望利用人工智能造成危害的人，减少使用人工智能的邪恶势力将使世界更加安全。此外，人工智能行业的准入门槛降低，人才和技能库得以释放，会促进行业的进一步发展。人工智能能为我们人类带来进步。我们已经概述了其目前的广泛应用，但其仍由巨大的发展潜力，这对我们人类的进步大有裨益。通过开源人工智能技术可以降低人才进入该行业的门槛，从而加速人工智能的发展。更多的人才意味着我们可以制造出更好的人工智能，在社会中得到更广泛的应用。开源人工智能为我们提供了一个工具，让我们能够获得开发这项技术的人才和能力的源泉。人工智能技术的开源为开发人员提供了自由空间，他们可以根据自己的需要指定和定制人工智能。人工智能的一个特点是可以为特定目的进行定制。定制的人工智能可以满足特定的需要和需求，从而大大提高产品的质量。由于目前人工智能行业的封闭性，开发者定制人工智能软件的能力往往受到限制。开源的人工智能技术将允许开发者自由定制，使他们的产品达到最佳效果。这种自由将带来更好的市场，也将带来更好的产品。总结来看，”技术-资本“是一个永久增长的机器。通过市场获得的资本推动技术发展，市场通过技术发展创造更多资本，从而形成良性循环。开源人工智能提供了一个竞争、低门槛、自由和协作的空间，这会促进创新和人工智能技术的传播，从而刺激经济增长和更多市场（需求）。这对行业的发展能力和造福人类都至关重要。 3.4.3 OpenAI与开源人工智能在人工智能行业，领先的公司是OpenAI。自2022年发布ChatGPT以来，OpenAI 已在利润和知识方面领跑人工智能行业。他们拥有Microsoft和大科技公司的支持，因此在人工智能市场根基很深。从目前来看，要让开源人工智能与OpenAI在同一水平线上竞争，似乎是一场艰苦的战斗。然而，我们有充分的理由认为，开源人工智能有望在市场上挑战并击败 OpenAI。将人工智能技术开源能够规避恐惧的政府对人工智能行业实施的监管。目前，世界各地的政府和监管机构都在争相监管和限制新兴的人工智能产业。这种监管的目标是OpenAI所使用的传统人工智能，即由单一组织集中管理和保存的人工智能。这种监管将限制人工智能行业的发展。然而，开源的人工智能项目具有可以没有管理者的优势，而且是去中心化的。这意味着政府很难对开源的人工智项目能进行监管。这就为其提供了一个优势，即未来不会像OpenAI那样受到法规的限制。此外，我们还看到，开源的人工智能技术和项目可以从OpenAI中获益，而OpenAI却无法从它们中获益。OpenAI的主要目标是实现自身利益的最大化，这意味着他们将大量模型和数据保密，以防止竞争对手利用这些模型和数据为自己谋利。开源人工智能可以使用许可证来阻止OpenAI从不太规范的开发中获益。OpenAI会发现自己在市场中孤立无援，因为他们只是一家公司，而使用开源的人工智能技术和项目的机构却很多。这将意味着，开源公司可以通过限制OpenAI的访问权限，从OpenAI丰富的数据和知识中获益。不过，可能需要新的许可证才能最终为OpenAI提供这种访问权。最后，与OpenAI相比，开源的技术很有可能吸引那些热衷于改善人工智能的意识形态人士。这是因为它的准入门槛很低。然而，有人可能会认为，这将导致难以协调和开发产品的情况。然而，这类项目并不需要很多人。Linux的Linus Torvalds 就是这样一个例子，一个人持续不断地为项目做出贡献，就能产生如此巨大的影响。OpenAI的准入门槛较高，因此很难吸引有热情的人加入。尽管现在看来，OpenAI已经牢牢控制了人工智能行业，但开源的人工智能项目可以依靠几条路线来挑战OpenAI的控制。其灵活性、可访问性以及以社区为中心而非以利润为中心的人工智能方法，意味着它拥有强大的工具，可以通过在不断发展和动态的市场中孤立它们来击败OpenAI。它们有潜力击败OpenAI。 3.4.4 人工智能技术开源的问题然而，开源的人工智能技术要想与大型科技公司和OpenAI抗衡，还必须克服一些障碍。这些障碍可分为三个类。首先，这个领域缺乏人才。其次，这些项目和技术缺乏实际工作所需的计算能力。第三，缺乏可供人工智能自我训练和发展的数据。本节将专门阐述这三个问题。任何组织要想正常运转，都需要人才来提供开发产品所需的创新理念和工作。开源的人工智能项目面临的一个主要问题是，在这些社区工作没有利润或金钱激励。大多数人工智能工程师在决定在以下领域工作时不得不做出选择，要么在大科技公司从事高薪工作，要么冒险创业。安全的选择，也就是大多数人的选择，是在大科技公司工作并在那里谋生。最优秀的人才都去了OpenAI，而不是在没有金钱激励的开源人工智能社区工作。因此，这个领域无法吸引最优秀的人才，也就无法开发出能够挑战大型科技公司的创新产品。另一个问题是，开源的人工智能项目缺乏必要的计算能力，无法达到OpenAI所能达到的规模。更大规模的人工智能需要更多的GPU来扩大运行规模。GPU价格昂贵，实际上只有 Nvidia一家公司生产。这些开源项目缺乏资金意味着很难为AI模型提供足够的计算能力，从而与OpenAI的ChatGPT竞争。即使是在软件工程方面拥有高质量标准的Linux，也受限于其程序的计算规模。它们缺乏随意访问超级计算机的能力，因此很难与拥有这种特权的OpenAI竞争。人工智能模型需要数据来训练。尽管Meta和OpenAI等大型科技公司标榜自己是"开放"或"开源"的，但它们用于训练人工智能的数据都是私有的，只对自己开放。它们只公布完成后的人工智能模型，如ChatGPT。这些数据来自Meta 和OpenAI的海量用户群，质量和数量都很高。开源的人工智能项目劣势在于无法获得大量的高质量数据，因此无法使用最好、最多的数据来训练人工智能模型，从而无法与Meta或OpenAI 竞争。因此无法开发出能与 OpenAI 或 Meta 的产品相抗衡的产品。这些开源的人工智能技术和项目需要的是克服这三大问题的方法，这三大问题阻碍了它们挑战大型科技公司对人工智能行业控制的潜力。我们认为，加密技术可以解决它们的这些问题。 3.4.5 加密领域 (crypto) 的人工智能开源解决方案我们相信，加密技术可以解决上一节概述的所有三个问题。本节将专门针对每个具体问题提出解决方案。首先，加密货币可以通过在人工智能领域的开源项目中创建收入/奖励系统来解决人才问题。加密货币可以通过为项目贡献提供内在激励来帮助这些项目运转。这方面的一个例子是AGI Guild，这是一个由意识形态开源开发者组成的团体，他们创造了一个许可证，可以奖励为开源项目做出贡献的开发者。许可证由AGI代币管理。超过100万美元规模的公司必须获得AGI代币才能使用许可证。然后代币将分配给开源人工智能项目的贡献者。这既是对开发者的金钱奖励，也赋予了代币本身的价值，从而鼓励更多的贡献。此外，还有投票系统供成员集体决定项目的发展方向，在开源人工智能领域鼓励任人唯贤和民主，同时获得从开源人工智能中赚钱的能力。由于现在有了金钱上的激励，未来和现在的人才将不需要把自己的道路视为要么安全地选择Meta，要么在风险投资上孤注一掷，而是看到了第三条道路，即你可以在开发人工智能的过程中赚钱，而不必受到大型科技公司的专有限制。人才将被开源人工智能项目所吸引，将其视为对抗大型科技公司的可行竞争对手。其次，加密技术可降低访问服务器门槛来解决计算问题。过去，云厂商可能会拒绝开发人员使用其服务器来开发产品。有了加密技术，现在变得无需许可，这意味着任何人都可以获得他们的项目所需的计算能力。这意味着，使用开源人工智能和加密技术的开发人员现在可以根据自己的需要自由使用尽可能多的计算资源。加密技术还为开发者和社区提供了与云厂商讨价还价的能力。在过去很短的时间内，云厂商可以提高使用价格，因为开源人工智能开发者需要他们的服务器来运行他们的程序。现在，有了加密技术，我们可以将这一系统去中心化，开始挑战云厂商的价格，为更多想要开发开源人工智能的人敞开大门。现在，社区有办法也有能力向AWS等云计算公司提出挑战，要求降低价格，从而提高产品质量和工作质量。最后，加密技术可以解决数据问题，帮助那些为开源人工智能项目生成数据的用户提供奖励。这方面的一个例子是Grass，它有一个浏览器插件，可以在用户浏览互联网时生成代币。这种奖励制度意味着，随着时间的推移，随着加密应用提供更多的数据，开源的人工智能项目就能够获得越来越多的数据。这是以去中心化的方式实现的，这意味着我们不会陷入监管机构或大型科技公司发现这一问题并采取禁止IP地址等措施加以阻止的问题。这种方式无法有效阻止，因为有很多人都在使用这种插件，封禁一个人对其他人获取这些数据几乎没有影响。这样一来，这些开源项目开发者就能获得和大公司一样好的数据。这无疑会提高人工智能模型的训练水平。即使是需要保密的数据，加密技术也能充分保护隐私，而且只要数据所属用户同意，加密技术也能对其进行获取，从而更好地使用人工智能模型。总之，我们发现加密技术能够在爬取数据时满足数据敏感性要求，同时通过向开源人工智能程序更好地提供训练人工智能模型所需的数据。我们所追求的理想是，开源人工智能系统打败基于闭源软件的私有系统。机器学习如何工作？在深入探讨人工智能（AI）与加密货币的交集之前，首先要单独介绍人工智能领域的一些概念。由于本报告是为加密货币领域的读者撰写的，读者并非都对人工智能和机器学习概念有深刻理解。而理解相关概念至关重要，这样读者才能评估人工智能和加密货币交叉领域的哪些想法具有实质意义，并准确评估项目的技术风险。本节重点介绍人工智能的概念；此外，本节也重点介绍了人工智能与加密货币之间的关系。通过本章的提示，我们可以了解人工智能概念与加密领域的关系。本节所涉主题概述：机器学习（machine learing, ML）是人工智能的一个分支，在这个分支中，无需明确编程，机器就能通过数据做出决策。 ML流程分为三个步骤：数据、训练和推理。训练模型的计算成本非常高，而推理则相对便宜。学习主要有三种类型：监督学习、无监督学习和强化学习。监督的学习是指从范例（由教师提供）中学习。教师可以向模型展示狗的图片，并告诉它这就是狗。然后，模型就能学会将狗与其他动物区分开来。然而，许多流行的模型，如LLMs（如GPT-4和LLaMa），都是通过无监督学习来训练的。在这种学习模式中，教师不会提供任何指导或示例。相反，模型通过学习来发现数据中的模式。强化学习（试错学习）主要用于连续决策任务，如机器人控制和游戏（如国际象棋或围棋）。 1.1 人工智能和机器学习 1956 年，一些当时最聪明的人聚集在一起参加了一个研讨会。他们的目标是提出智力的一般原则。他们指出： "学习的每一个方面或智能的任何其他特征都可以被如此精确地描述出来，以至于可以制造一台机器来模拟它。" 在人工智能发展的早期，研究人员充满了乐观主义。从某种意义上说，他们的目标是人工通用智能（AGI），雄心勃勃。我们现在知道，这些研究人员并没有设法创造出具有通用智能的人工智能代理。70 年代和 80 年代的人工智能研究人员也是如此。在那个时期，人工智能研究人员试图开发 "基于知识的系统"。基于知识的系统的关键理念是，我们可以为机器编写非常精确的规则。从本质上讲，我们从专家那里提取非常具体和精确的领域知识，并以规则的形式写下来供机器使用。然后，机器就可以利用这些规则进行推理并做出正确的决定。例如，我们可以尝试从马格努斯·卡尔森（Magnus Carlson）那里提炼出下棋的所有原则，然后构建一个人工智能来下棋。然而，要做到这一点非常困难，即使有可能，也需要大量的人工来创建这些规则。试想一下，如何将识别狗的规则写入机器？机器如何才能从拥有像素到知道狗是什么？人工智能的最新进展来自于一个被称为 "机器学习 "的分支。在这种模式下，我们不是为机器编写精确的规则，而是使用数据，让机器从中学习。使用机器学习的现代人工智能工具随处可见，例如 GPT-4、iPhone 上的 FaceID、游戏机器人、Gmail 垃圾邮件过滤器、医疗诊断模型、自动驾驶汽车......等等。 1.2 机器学习管道（pipeline）机器学习管道可分为三个主要步骤。有了数据，我们要训练模型，然后有了模型，我们就可以使用它。使用模型称为推理。因此，这三个步骤分别是数据、训练和推理。高度概括来说，数据步骤包括查找相关数据并对其进行预处理。例如，如果我们要建立一个对狗进行分类的模型，我们需要找到狗和其他动物的图片，这样模型才能知道什么是狗，什么不是狗。然后，我们需要对数据进行处理，并确保数据格式正确，以便模型能够正确学习。例如，我们可能要求图片大小一致。第二步是训练，我们利用数据来学习模型应该是什么样的。模型内部的方程是什么？神经网络的权重是多少？参数是什么？正在进行的计算是什么？如果模型不错，我们就可以测试它的性能，然后就可以使用它了。这就到了第三步。第三步称为推理，即我们只是使用神经网络。例如，给神经网络一个输入，然后问一个问题：可以通过推理产生输出吗？图 28：机器学习管道的三个主要步骤是数据、训练和推理 1.2.1 数据现在，让我们深入了解一下每个步骤。第一：数据。广义上讲，这意味着我们必须收集数据并对其进行预处理。让我们来看一个例子。如果我们想建立一个供皮肤科医生（专门治疗皮肤病的医生）使用的模型。我们首先要收集许多人脸的数据。然后，我们请专业皮肤科医生来评估是否存在皮肤病。现在可能会出现许多挑战。首先，如果我们拥有的所有数据都包括人脸，那么模型将很难识别身体其他部位的任何皮肤状况。其次，数据可能存在偏差。例如，大部分数据可能是一种肤色或色调的图片。第三，皮肤科医生可能会犯错，这意味着我们会得到错误的数据。第四，我们获得的数据可能会侵犯隐私。经济激励措施有助于收集高质量的数据，而隐私保护技术可以解决用户在上述例子等敏感环境中的顾虑。我们将在第2章中介绍更深层次的数据挑战。不过，这可以让你了解到，收集好的数据并对其进行预处理是相当具有挑战性的。图 29：两个流行数据集的示意图。MNIST包含手写数字，而ImageNet包含数百万张不同类别的注释图像在机器学习研究中，有许多著名的数据集。常用的有： MNIST数据集说明：包含70,000个灰度图像格式的手写数字（0-9）使用案例：主要用于计算机视觉中的手写数字识别技术。它是一个对初学者友好的数据集，通常用于教育领域。 ImageNet 说明：一个包含1,400多万张图片的大型数据库，标注有20,000多个类别的标签。使用案例：用于对象检测和图像分类算法的训练和基准测试。一年一度的ImageNet大规模视觉识别挑战赛（ILSVRC）一直是推动计算机视觉和深度学习技术发展的重要活动。 IMDb评论说明：包含来自 IMDb的50,000篇电影评论，分为两组：训练和测试。每组包含相同数量的正面和负面评论。使用案例：广泛应用于自然语言处理（NLP）中的情感分析任务。它有助于开发能理解文本中表达的情感（正面/负面）并对其进行分类的模型。获取大型、高质量的数据集对于训练良好的模型极为重要。然而，这可能具有挑战性，尤其是对于较小的组织或个人搜索者而言。由于数据非常宝贵，大型机构通常不会共享数据，因为数据提供了竞争优势。在透明度和开放性与盈利能力之间取得平衡的解决方案可以提高开放数据集的质量。 1.2.2 训练管道的第二步是训练模型。那么，训练模型究竟意味着什么呢？首先，我们来看一个例子。一个机器学习模型（训练完成后）通常只有两个文件。例如，LLaMa 2（一个大型语言模型，类似于 GPT-4）就是两个文件：参数，一个 140GB 的文件，其中包括数字。 run.c ，和一个简单的文件（约 500 行代码）。第一个文件包含 LLaMa 2 模型的所有参数，run.c 包含如何进行推理（使用模型）的说明。这些模型都是神经网络。图 30：神经网络的基本图示在像上面这样的神经网络中，每个节点都有一堆数字。这些数字被称为参数，并存储在文件（惊喜！）参数中。获取这些参数的过程称为训练。下面是一个高度概括的过程。想象一下训练一个识别数字（从0到9）的模型。我们首先收集数据（在这种情况下，我们可以使用MNIST数据集）。然后开始训练模型。我们取第一个数据点，即 "5"。然后，我们将图像（"5"）传递给网络。网络会对输入图像进行数学运算。网络将输出一个0到9之间的数字。该输出是当前网络对该图像的预测。现在有两种情况。网络要么是对的（它预测了 "5"），要么是错的（任何其他数字）。如果它预测的数字正确，我们就不用做什么。如果预测的数字不正确，我们将返回网络，对所有参数进行小幅修改。在做了这些小改动后，我们再试一次。从技术上讲，网络现在有了新的参数，因此预测结果也会不同。我们对所有数据点一直这样做，直到网络基本正确为止。这一过程本质上是顺序性的。我们首先通过整个网络传递一个数据点，看看预测结果如何，然后更新模型的权重。训练过程可以更加全面。首先，我们必须选择模型架构。我们应该选择哪种类型的神经网络？并不是所有的机器学习模型都是神经网络。其次，在确定哪种架构最适合我们的问题，或者至少是我们认为最适合的架构之后，我们需要确定训练流程。例如，我们将以何种顺序将数据传递给网络？第三，我们需要硬件设置。我们要使用什么样的硬件（CPU、GPU、TPU）？我们又该如何对其进行训练？最后，在训练模型的同时，我们要验证这个模型是否真的很好。我们希望在训练结束时测试这个模型是否能提供我们想要的输出结果。剧透（其实也不算剧透），训练模型的计算成本非常高。任何微小的低效都会带来巨大的成本。正如我们稍后将看到的，特别是对于像LLM这样的大型模型，低效的训练可能会让你付出数百万美元的代价。在第2部分中，我们将再次详细讨论训练模型所面临的挑战。 1.2.3 推理机器学习管道的第三步是推理，也就是使用模型。当我使用ChatGPT并得到回应时，模型正在执行推理。如果我用脸部解锁iPhone，脸部ID模型会识别我的脸并打开手机。该模型执行了推理。数据已经有了，模型已经训练好了，现在模型训练好了，我们就可以使用它，使用它就是推理。严格来说，推理与网络在训练阶段做出的预测是一回事。回想一下，一个数据点通过网络，然后进行预测。然后根据预测的质量更新模型参数。推理的工作原理与此相同。因此，与训练相比，推理的计算成本非常低。训练LLaMa可能要花费数千万美元，但推理一次只需几分之一。与训练相比，计算成本更低。训练 LLaMa可能要花费数千万美元，但进行一次推理只需几分之一。与训练相比，进行推理的成本很低，而且更容易并行化，这可能为小型闲置计算（如笔记本电脑和手机）提供了机会。推理过程有几个步骤。首先，在实际生产中使用之前，我们需要对其进行测试。我们对训练阶段未见的数据进行推理，以验证模型的质量。其次，当我们部署一个模型时，会有一些硬件和软件要求。例如，如果我的iPhone上有人脸识别模型，那么该模型就可以放在苹果公司的服务器上。然而，这样做非常不方便，因为现在每次我想解锁手机时，都必须访问互联网并向苹果服务器发送请求，然后在该模型上进行推理。然而，如果想在任意时刻使用这种技术，进行人脸识别的模型就必须存在于你的手机上，这意味着该模型必须与你iPhone上的硬件类型兼容。最后，在实践中，我们还必须维护这一模式。我们必须不断进行调整。我们训练和使用的模型并不总是完美的。硬件要求和软件要求也在不断变化。 1.2.4 机器学习管道是迭代式的到目前为止，我把这个管道设计成了依次进行的三个步骤。你获取数据，处理数据，清理数据，一切都很顺利，然后你训练模型，模型训练完成后，你进行推理。这就是机器学习在实践中的美好图景。实际上，机器学习需要进行大量的迭代。因此，它不是一个链条，而是如下图所示的几个循环。图 31：机器学习流水线可以形象地理解为由数据、训练和推理三个步骤组成的链条。不过，在实践中，这一过程的迭代性更强，如蓝色箭头所示。为了理解这一点，我们可以举几个例子。例如，我们可能会收集一个模型的数据，然后尝试对其进行训练。在训练的过程中，我们会发现我们需要的数据量应该更多。这意味着我们必须暂停训练，回到数据步骤并获取更多数据。我们可能需要重新处理数据，或者进行某种形式的数据扩增。数据扩增就像是给数据改头换面，从老一套中创造出新的面貌。想象一下，你有一本相册，你想让它变得更有趣。你把每张照片都复制了几份，但在每份副本中，你都做了一些小改动--也许你旋转了一张照片，放大了另一张照片，或者改变了另一张照片的光线。现在，你的相册有了更多的变化，但实际上你并没有拍摄任何新照片。例如，如果你正在训练一个模特识别狗，你可能会水平翻转每张照片，然后把它也提供给模特。或者，我们改变照片中狗的姿势，如下图所示。就模型而言，这增加了数据集，但我们并没有到现实世界中去收集更多数据。使用合成数据来训练机器学习模型可能会导致许多问题，因此能够证明数据的真实性在未来可能变得至关重要。图 32：数据增强示例。对原始数据点进行多点扩增，无需到世界各地收集更多独特的数据点迭代的第二个更明显的例子是，当我们实际训练了一个模型，然后将其用于实践，即进行推理时，我们可能会发现模型在实践中表现不佳或存在偏差。这意味着我们必须停止推理过程，返回并重新训练模型，以解决这些问题，如偏差和证明。第三个也是非常常见的步骤是，一旦我们在实践中使用模型（进行推理），我们最终会对数据步骤进行修改，因为推理本身会产生新的数据。例如，想象一下建立一个垃圾邮件过滤器。首先，我们要收集数据。本例中的数据是一组垃圾邮件和非垃圾邮件。当模型经过训练并用于实践时，我的收件箱中可能会收到一封垃圾邮件，这意味着模型犯了一个错误。它没有把它归类为垃圾邮件，但它就是垃圾邮件。因此，当 Gmail用户选择 "这封邮件属于垃圾邮件 "时，就会产生一个新的数据点。之后，所有这些新数据点都会进入数据步骤，然后我们可以通过多做一些训练来提高模型的性能。另一个例子是，想象一个人工智能在下棋。我们训练人工智能下棋所需的数据是大量棋局，以及谁赢谁输的结果。但当这个模型用于实际下棋时，就会为人工智能生成更多的数据。这意味着，我们可以从推理步骤回到数据，利用这些新的数据点再次改进我的模型。这种推理和数据相连的想法适用于很多场合。本节旨在让你对机器学习模型的构建过程有一个高层次的了解，这个过程是非常反复的。它不像 "哦，我们只需获取数据，一次尝试就能训练出一个模型，然后将其投入生产"。模型是不断更新的，因此不变的记录可能会给设计带来挑战。 1.3 机器学习的类型我们将介绍三种主要的机器学习模型。监督学习："老师，教我方法" 无监督学习："只需找到隐藏的模式“ 强化学习："试一试，看什么有效" 1.3.1 监督学习 "老师，教我方法" 想象一下，你正在教孩子区分猫和狗。你（对一切都了如指掌的老师）给他们看很多猫和狗的图片，每次都告诉他们哪个是哪个。最终，孩子们学会了自己辨别。这几乎就是机器学习中监督学习的工作原理。在监督学习中，我们有大量的数据（比如猫和狗的图片），而且我们已经知道答案（老师告诉他们哪个是狗，哪个是猫）。我们利用这些数据来训练一个模型。该模型会查看许多示例，并有效地学习模仿老师。在这个例子中，每张图片都是一个原始数据点。答案（狗或猫）被称为"标签"。因此，这是一个标签数据集。每个数据点都包含一张原始图片和一个标签。这种方法概念简单，功能强大。在医疗诊断、自动驾驶汽车和股票价格预测中，使用监督学习模型的应用很多。这种方法概念简单，功能强大。在医疗诊断、自动驾驶汽车和股票价格预测中，使用监督学习模型的应用很多。然而，可以想象，这种方法面临着许多挑战。例如，我们不仅需要获取大量数据，还需要标签。这可能非常昂贵。Scale.ai (opens new window) 等公司在这方面提供了有价值的服务。数据标注对稳健性提出了许多挑战。给数据贴标签的人可能会犯错，或者只是对标签有不同意见。从人类收集的所有标签中，有 20% 无法使用的情况并不少见。激励机制和其他博弈论动态可能有助于提高开放数据集的质量。 1.3.2 无监督学习（Unsupervised Learning, USL） "只需找到隐藏的模式" 想象一下，你有一个装满各种水果的大篮子，但你并不熟悉所有的水果。你开始根据它们的外观、大小、颜色、质地甚至气味将它们分类。你不太清楚每种水果的名称，但你注意到有些水果彼此相似。也就是说，你在数据中发现了一些规律。这种情况类似于机器学习中的无监督学习。在无监督学习中，我们会给模型一堆数据（比如各种水果的组合），但我们不会告诉模型每个数据是什么（我们不会给水果贴标签）。然后，模型会检查所有这些数据，并试图自己找出模式或分组。它可能会根据水果的颜色、形状、大小或任何其他它认为相关的特征进行分组。然而，模型找到的特征并不总是相关的。这就导致了许多问题，我们将在第 2 章中看到。例如，模型最终可能会将香蕉和大蕉归为一组，因为它们都是长条形且呈黄色，而苹果和西红柿可能会被归为另一组，因为它们都是圆形且可能是红色。这里的关键在于，模型是在没有任何先验知识或标签的情况下找出这些分组的--它是从数据本身学习的，就像你根据可观察到的特征将未知水果分到不同的组中一样。无监督学习是许多流行的机器学习模型的支柱，例如大型语言模型（LLM）。ChatGPT不需要人类通过提供标签来教它如何说每个句子。它只需分析语言数据中的模式，并学会预测下一个单词。许多其他强大的生成式人工智能模型都依赖于无监督学习。例如，GAN（生成对抗网络）可用于生成人脸（即使这个人并不存在）。参见 https://thispersondoesnotexist.com/(opens new window) 图 33：人工智能生成的图像来自 https://thispersondoesnotexist.com 图 34：第二张人工智能生成的图片来自 https://thispersondoesnotexis t.com 上面的图片是人工智能生成的。我们并没有教这个模型"什么是人脸"。它是在大量人脸的基础上训练出来的，通过巧妙的架构，我们可以利用这个模型生成看似真实的人脸。请注意，随着生成式人工智能的兴起和模型的改进，对内容进行验证变得越来越困难。加密解决方案可以让我们追踪内容的来源，并以可扩展的方式让我们安全地使用生成式人工智能。 1.3.3 强化学习 (Reinforcement Learning, RL) "试一试，看什么有效 "或 "从试验和错误中学习" 想象一下，您正在教一只狗做一个新的动作，比如捡球。每当狗狗做出接近你想要的动作时，比如跑向球或捡起球，你就给它点心吃。如果狗狗做了与此无关的事情，比如朝相反的方向跑，它就得不到食物。渐渐地，狗狗发现捡到球就能得到美味的食物，所以它就会一直这样做。这基本上就是机器学习领域中的强化学习（RL）。在RL中，你有一个计算机程序或代理（如狗），它通过尝试不同的事情（如狗尝试不同的动作）来学习决策。如果代理做出了好的行为（比如捡球），它就会得到奖励（食物）；如果做出了不好的行为，它就得不到奖励。随着时间的推移，代理会学会多做能获得奖励的好事，少做不能获得奖励的坏事。从形式上看，这就是最大化奖励函数。最酷的地方在于：代理会自己通过试错找出这一切。现在，如果我们想构建一个人工智能来下棋，那么人工智能最初可以随意尝试走棋。如果最终赢得了比赛，人工智能就会得到奖励。然后，该模型就会学会走更多的胜棋。这可以应用于许多问题，尤其是需要连续决策的问题。例如，RL方法可用于机器人与控制、国际象棋或围棋（如 AlphaGo）以及算法交易。 RL方法面临许多挑战。其一，代理可能需要很长时间才能"学会"有意义的策略。这对于学习下棋的人工智能来说是可以接受的。但是，当人工智能开始采取随机行动来观察哪些行动有效时，你会把你的个人资金投入到人工智能算法交易中吗？或者说，如果机器人一开始会采取随机行动，你会允许它住在你家吗？图35：这是一些强化学习代理在训练过程中的视频：一个[真正的机器人](https://www.youtube.com/watch?v=n2gE7n11h1Y)和一个[模拟机器人](https://www.youtube.com/watch?v=hx_bgoTF7bs) 以下是每种机器学习的应用实例简述：机器学习面临的挑战本章概述了机器学习领域的问题。我们将有选择性地对该领域的某些问题展开。这样做有两个原因：1）简明扼要，全面概述该领域的挑战并考虑到细微差别会导致报告非常冗长；2）在讨论与加密货币的交叉点时，我们将重点关注相关问题。不过，本节本身只是从人工智能的角度撰写的。也就是说，我们不会在本节讨论密码学方法。本节所涉主题概述：从偏见到可访问性，数据面临着巨大的挑战。此外，数据层面上存在恶意的攻击也会导致机器学习模型的误判。当模型（如GPT-X）在合成数据上进行训练时，会发生模型崩溃。这会对其造成不可逆转的损害。标注数据可能非常昂贵、缓慢且不可靠。根据不同的架构，训练机器学习模型会面临许多挑战。模型并行化带来了巨大的挑战，例如通信开销。贝叶斯模型可用于量化不确定性。例如：在进行推理时，模型会返回它的确定程度（如 80% 的确定性）。 LLM面临幻觉（hallucination）和训练困难等特殊挑战。 2.1 数据挑战数据是任何类型机器学习模型的关键。不过，数据的要求和规模因使用的方法而异。无论是监督学习还是无监督学习，都需要原始数据（无标签数据）。在无监督学习中，只有原始数据，不需要标注。这就缓解了许多与标注数据集相关的问题。然而，无监督学习所需的原始数据仍然会带来许多挑战。这包括数据偏差：当训练数据不能代表所要模拟的真实世界场景时，机器学习中就会出现偏差。这可能导致偏差或不公平的结果，例如面部识别系统在某些人口群体上表现不佳，因为他们在训练数据中的代表性不足。不均衡的数据集：通常，可用于训练的数据在不同类别之间的分布并不均衡。例如，在疾病诊断应用中，“无病”案例可能比"有病"案例多得多。这种不平衡会导致模型在少数民族/阶层上表现不佳。这个问题与偏见不同。数据的质量和数量：机器学习模型的性能在很大程度上取决于训练数据的质量和数量。数据不足或质量不佳（如低分辨率图像或嘈杂的音频录音）会严重影响模型的有效学习能力。数据的可获取性：获取大型、高质量的数据集可能是一项挑战，尤其是对于规模较小的机构或个人研究人员而言。大型科技公司在这方面往往具有优势，这可能导致机器学习模型开发方面的差距。这是一项重大挑战。不过，众包数据集也会带来一些问题，比如数据质量的保证。经济激励和博弈论设计可以帮助创建开放的高质量数据集。数据安全：保护数据免遭未经授权的访问并确保其在存储和使用过程中的完整性至关重要。安全漏洞不仅会损害隐私，还会导致数据被篡改，影响模型性能。隐私问题：由于机器学习需要大量数据，处理这些数据可能会引发隐私问题，尤其是当其中包含敏感或个人信息时。确保数据隐私意味着尊重用户同意、防止数据泄露以及遵守 GDPR 等隐私法规。这可能非常具有挑战性（见下文示例）。在机器学习模型中，删除特定用户的数据（遵守GDPR）是一项非常具有挑战性的工作。与数据库不同，我们不能随便删除一个条目。模型参数会根据提供的所有数据进行调整，因此在模型训练完成后删除特定用户的信息是非常困难的。图 34：数据隐私的一个特殊问题源于机器学习模型的性质。在普通数据库中，我可以有关于多人的条目。如果我的公司要求我删除这些信息，你只需从数据库中删除即可。然而，当我的模型经过训练后，它持有几乎整个训练数据的参数。不清楚哪个数字对应训练中的哪个数据库条目 2.1.1 模型崩溃在无监督学习中，我们要强调的一个特殊挑战是模型崩溃。在本文中，作者进行了一项有趣的实验。GPT-3.5 和 GPT-4 等模型是使用网络上的所有数据训练而成的。然而，这些模型目前正在被广泛使用，因此一年后互联网上的大量内容将由这些模型生成。这意味着，GPT-5 及以后的模型将使用 GPT-4 生成的数据进行训练。在合成数据上训练模型的效果如何？他们发现，在合成数据上训练语言模型会导致生成的模型出现不可逆转的缺陷。论文作者指出："我们证明，如果我们要保持从网络上搜刮的大规模数据进行训练所带来的好处，就必须认真对待这一问题。事实上，当从互联网抓取的数据中出现由 LLM 生成的内容时，收集到的有关人类与系统之间真正交互行为的数据的价值将越来越大"。这可能表明，围绕数据出处（追踪数据来源）的解决方案存在重大机遇。图 35：模型崩溃示意图。随着使用人工智能模型生成的互联网内容越来越多，下一代模型的训练集中很可能包含合成数据，如本文所示请注意，这种现象并非LLM所特有，它可能会影响各种机器学习模型和生成式人工智能系统（如变异自动编码器、高斯混合模型）。现在，让我们来看看监督学习。在监督学习中，我们需要一个贴有标签的数据集。这意味着原始数据本身（一张狗的图片）和一个标签（"狗"）。标签由模型设计者手动选择，可以通过人工标注和自动化工具相结合的方式获得。这在实践中带来了许多挑战。这包括主观性：决定数据的标签可能是主观的，从而导致模糊不清和潜在的伦理问题。一个人认为合适的标签，另一个人可能会有不同的看法。标签的差异：同一个人（更不用说不同的人）重复运行可能会提供不同的标签。这就提供了 "真实标签 "的噪声近似值，因此需要质量保证层。例如，人类可能会收到一个句子，并负责标注该句子的情绪（"快乐"、"悲伤"......等）。同一个人有时会给完全相同的句子贴上不同的标签。这就降低了数据集的质量，因为它在标签中引入了差异。在实践中，20% 的标签无法使用的情况并不少见。想象一下，创建一个数据集来预测区块链上新协议的质量。你很可能会得到一个范围很广的分数，这取决于你所选择的评分系统的次活动性，以及你所调查的人的意见差异。缺乏专家注释者：对于一个小众的医疗应用，人们可能很难获得大量有意义的标签数据。这是由于能够提供这些标签的人员（医学专家）十分稀缺。罕见事件：对于许多事件来说，由于事件本身非常罕见，因此很难获得大量的标注数据。例如，发现流星的计算机视觉模型。高成本：当试图收集大量高质量数据集时，成本可能高得惊人。由于上述问题，如果需要对数据集进行标注，成本尤其高昂。还有很多问题，比如应对对抗性攻击和标签的可转移性。为了让读者对数据集的规模有一些直观的了解，请看下图。像 ImageNet这样的数据集包含1400万个标签数据点。图 36：各种机器学习数据集的规模示意图。Common Crawl的近似值为10亿个网页，因此总字数远远超过这个数字。小型数据集（如 Iris）包含 150 幅图像。MNIST 大约有 70,000 张图像。请注意，这是一个对数比例 2.1.2 强化学习中的数据收集在强化学习中，数据收集是一项独特的挑战。与监督学习不同的是，监督学习的数据是预先标记好的静态数据，而强化学习则依赖于通过与环境互动而产生的数据，这通常需要复杂的模拟或真实世界的实验。这就带来了一些挑战：这一过程可能会耗费大量资源和时间，对于物理机器人或复杂环境而言尤其如此。如果机器人在真实世界中接受训练，那么它从试验和错误中学习可能会导致事故。或者，也可以考虑让训练机器人通过试验和错误来学习。奖励稀少且延迟：在收到有意义的反馈之前，代理可能需要探索大量的行动，从而难以学习有效的策略。确保所收集数据的多样性和代表性至关重要；否则，代理可能会过度适应狭隘的经验集，而不能通用化。在探索（尝试新行动）和利用（使用已知的成功行动）之间取得平衡使数据收集工作更加复杂，需要复杂的策略才能有效收集有用的数据。值得强调的一点是，数据收集与推理直接相关。在训练一个强化学习代理下棋时，我们可以利用自我对弈来收集数据。自我对弈就像是与自己下棋，以获得进步。代理与自己的副本对弈，形成一个持续学习的循环。这种方法非常适合收集数据，因为它会不断产生新的场景和挑战，帮助代理从广泛的经验中学习。这一过程可以在多台机器上并行执行。由于推理的计算成本很低（与训练相比），这一过程对硬件的要求也很低。通过自我游戏收集数据后，所有数据都将被用于训练模型和改进模型。闲置计算在分布式推理和数据收集中可以发挥强大作用，因为对硬件的要求比训练低得多。 2.1.3 对抗性数据攻击数据毒化攻击：在这种攻击中，通过添加扰动来破坏训练数据，从而欺骗分类器，导致不正确的输出。例如，有人可能会在非垃圾邮件中添加垃圾邮件元素。这将导致将来在垃圾邮件过滤器的训练中加入这些数据时，性能下降。这可以通过在非垃圾邮件上下文中增加 "free"、"win"、"offer "或 "token"等词的使用来解决。规避攻击：攻击者在部署过程中操纵数据，欺骗先前训练好的分类器。规避攻击在实际应用中最为普遍。针对生物识别验证系统的"欺骗攻击 "就是规避攻击的例子。对抗性攻击：这是对合法输入的修改，目的是愚弄模型，或者使用专门设计的"噪音"来引起错误分类。请看下面的例子，在熊猫图像中添加噪音后，模型将其分类为长臂猿（置信度为99.3%）。图 37：通过在熊猫图像中添加特殊类型的噪声，模型可预先判断出图像是长臂猿而不是熊猫。在进行对抗攻击时，我们向神经网络提供一幅输入图像（左图）。然后，我们使用梯度下降法构建噪声向量（中）。该噪声向量被添加到输入图像中，从而导致错误分类（右图）。(图片来源：本文图 1解释和利用对抗性实例》论文中的图 1）在创建开放数据集时，有必要建立一个强大的质量控制层，以避免恶意攻击。此外，数据出处（追溯图像来源）可能会有所帮助。 2.2 训练方面的挑战训练机器学习模型会面临许多挑战。本节绝不是为了说明这些挑战的严重性。相反，我们试图让读者了解挑战的类型和瓶颈所在。这将有助于建立直觉，从而能够评估将训练模型与密码原语相结合的项目构想。请看下面这个无监督学习问题的例子。在无监督学习中，没有 "老师 "提供标签或指导模型。相反，模型会发现问题中隐藏的模式。考虑一个猫狗数据集。每只猫狗都有两种颜色：黑色和白色。我们可以使用一个无监督学习模型，通过将它们聚类为两组来找到数据中的模式。该模型有两种有效的方法：将所有狗集中在一起，将所有猫集中在一起将所有白色动物集中在一起，将所有黑色动物集中在一起。请注意，从技术上讲，这两者都没有错。模型找到的模式很好。然而，要完全按照我们的要求来引导模型是非常具有挑战性的。图 38：训练好的对猫和狗进行分类的模型最终可能会根据颜色将动物聚类在一起。这是因为在实践中很难指导无监督学习模型。所有图像均由人工智能使用 Dalle-E 生成这个例子说明了无监督学习所面临的挑战。然而，在所有类型的学习中，能够评估模型在训练过程中的学习效果并进行潜在干预至关重要。这可以节省大量资金。在无权限系统中，模型的训练无需专家监督，因此可能会浪费大量资源。处理早期停止等问题的自动化工具还很不成熟。训练大型模型的挑战还有很多，这是一个非常简短的清单：训练大规模机器学习模型，尤其是深度学习模型，需要大量的计算能力。这通常意味着要使用高端 GPU 或 TPU，而它们可能既昂贵又耗能。与这些计算需求相关的成本不仅包括硬件，还包括连续运行这些机器（有时长达数周或数月）所需的电力和基础设施。强化学习因其训练的不稳定性而闻名，模型或训练过程中的微小变化都可能导致结果的显著差异。与Adam等监督学习中使用的更稳定的优化方法不同，强化学习中没有放之四海而皆准的解决方案。通常需要对训练过程进行定制，这不仅耗时，而且需要深厚的专业知识。强化学习中的探索-开发两难问题使训练变得更加复杂，因为找到正确的平衡点对于有效学习至关重要，但却很难实现。机器学习中的损失函数定义了模型的优化目标。选择错误的损失函数会导致模型学习到不恰当或次优的行为。在复杂任务中，例如涉及不平衡数据集或多类分类的任务，选择、有时甚至定制设计正确的损失函数变得更加重要。损失函数必须与应用的实际目标紧密结合，这就需要深入了解数据和预期结果。在强化学习中，设计能持续、准确反映预期目标的奖励函数是一项挑战，尤其是在奖励稀少或延迟的环境中。在国际象棋游戏中，奖励函数可以很简单：赢了得 1 分，输了得 0 分。但是，对于行走机器人来说，这个奖励函数可能会变得非常复杂，因为它将包含 "面向前方行走"、"不要随意摆动手臂 "等信息。奖励函数（和损失函数）包含了模型去符号化者认为重要的主观因素。可能有必要建立管理制度，以确保为广泛使用的模型选择适当的函数。在监督学习中，由于深度神经网络的 "黑箱 "性质，要了解是哪些特征驱动了复杂模型（如深度神经网络）的预测具有挑战性。这种复杂性使得调试模型、了解其决策过程和提高其准确性变得十分困难。这些模型的复杂性也对可预测性和可解释性提出了挑战，而这对在敏感或受监管领域部署模型至关重要。同样，训练模式和所涉及的挑战也是非常复杂的话题。我们希望上述内容能让您对所涉及的挑战有一个大致的了解。如果您想深入了解该领域当前面临的挑战，我们推荐您阅读《应用深度学习中的开放性问题》（Open Problems in Applied Deep Learning）和《MLOps 指南》（MLOps guide）。从概念上讲，机器学习模型的训练是按顺序进行的。但在很多情况下，并行训练模型至关重要。这可能只是因为模型太大，一个 GPU 难以容纳，并行训练可以加快训练速度。然而，并行训练模型会带来重大挑战，包括通信开销：将模型分割到不同的处理器需要这些单元之间不断进行通信。这可能会造成瓶颈，尤其是对于大型模型而言，因为各单元之间的数据传输可能会耗费大量时间。负载均衡：确保所有计算单元得到平等利用是一项挑战。不平衡会导致一些单元闲置，而另一些单元超负荷运行，从而降低整体效率。内存限制：每个处理器单元的内存都是有限的。在不超出这些限制的情况下，有效管理和优化多个单元的内存使用情况是非常复杂的，尤其是大型模型。实施的复杂性：设置模型并行涉及计算资源的复杂配置和管理。这种复杂性会增加开发时间和出错的可能性。优化困难：传统的优化算法可能无法直接适用于模型并行化环境，也无法提高效率，这就需要进行修改或开发新的优化方法。调试和监控：由于训练过程的复杂性和分布性增加，监控和调试分布在多个单元上的模型比监控和调试运行在单个单元上的模型更具挑战性。分散和并行训练方面的基本新方法可以极大地推动机器学习的进步。 2.3 推理中的挑战许多类型的机器学习系统面临的最重要挑战之一就是它们可能会"自信地出错"。ChatGPT可能会返回一个我们听起来很有把握的答案，但事实上这个答案是错误的。这是因为大多数模型经过训练后都会返回最有可能的答案。贝叶斯方法可用于量化不确定性。也就是说，模型可以返回一个有根据的答案，来衡量它有多确定。考虑使用蔬菜数据训练图像分类模型。该模型可以获取任何蔬菜的图像，并返回它是什么，例如 "黄瓜 "或 "红洋葱"。如果我们给这个模型输入一张猫的图像，会发生什么呢？普通模型会返回它的最佳猜测，也许是 "白色洋葱"。这显然是不正确的。但这是模型的最佳猜测。贝叶斯模型的输出则是 "白色洋葱 "和一个确定度，例如 3%。如果模型有 3% 的确定性，我们可能就不应该根据这个预测采取行动。图 39：常规模型预测（只返回最有可能的答案）和贝叶斯模型预测（返回预测结果的 s 分布）的示意图这种形式的不确定性定性和推理在关键应用中至关重要。例如，医疗干预或金融决策。然而，贝叶斯模型的实际训练成本非常高，而且面临许多可扩展性问题。推理过程中出现的更多挑战维护：随着时间的推移，尤其是数据和现实世界场景发生变化时，保持模型的更新和正常运行。 RL 中的探索-利用：在探索新策略和利用已知策略之间取得平衡，尤其是在推理直接影响数据收集的情况下。测试性能：确保模型在新的、未见过的数据上表现良好，而不仅仅是在训练过的数据上。分布偏移：处理输入数据分布随时间发生的变化，这种变化会降低模型性能。例如，推荐引擎需要考虑客户需求和行为的变化。某些模型生成缓慢：像扩散模型这样的模型在生成输出时可能需要大量时间，而且速度较慢。高斯过程和大型数据集：随着数据集的增长，使用高斯过程进行推理的速度会越来越慢。增加防护栏：在生产模型中实施制衡措施，防止出现不良结果或误用。在封闭源模型中增加哪些防护措施，这对于确保不出现偏差至关重要。 2.4 LLM 面临的挑战大型语言模型面临许多挑战。不过，由于这些问题受到了相当多的关注，我们在此仅作简要介绍。 LLM 不提供参考文献，但可以通过检索增强生成（RAG）等技术来缓解没有参考文献等问题。幻觉：产生无意义、虚假或无关的输出。训练运行需要很长时间，而且数据集重新平衡的边际值很难预测，这就导致了缓慢的反馈循环。很难将人类的基本评估标准扩展到模型所允许的吞吐量。量化在很大程度上是需要的，但其后果却鲜为人知。下游基础设施需要随着模型的变化而变化。在与企业合作时，这意味着长时间的发布延迟（生产总是远远落后于开发）。不过，我们想重点介绍论文《沉睡代理：训练通过安全训练持续存在的欺骗性 LLMs》一文中的一个例子。作者训练的模型会在提示年份为 2023 年时编写安全代码，但在提示年份为 2024 年时插入可被利用的代码。他们发现，这种后门行为可以持续存在，因此标准的安全训练技术无法将其清除。这种后门行为在最大的模型中最持久，在经过经训练产生思维链路以欺骗训练过程的的模型中也最持久，甚至就算思维链路已经消失也一直存在。图 40 后门示意图。如果是 2024 年，模型的训练表现为 "正常"，但如果是 2024 年，则策略表现不同。资料来源：本文图 1 模型训练过程的透明度至关重要，因为即使是开源模型，也可能被训练出只在特定情况下使用的后门。例如，想象一下，将一个有资金的钱包连接到一个人工智能代理，结果却发现了一个后门。然后，这个代理就会将所有资金转移到一个特定的地址，或者以不同的身份恶意行事。在本章中，我们讨论了机器学习领域的许多挑战。显而易见，研究的巨大进步解决了许多此类问题。例如，基础模型为训练特定模型提供了巨大优势，因为您只需根据使用情况对其进行微调即可。此外，数据标注不再是全手工过程，使用半监督学习等方法可以避免大量的人工标注。本章的总体目标是先让读者对人工智能领域的问题有一些直观的了解，然后再探讨人工智能与密码学的交叉问题。报告外读物 3.1.1 Gensyn 网站： https://www.gensyn.ai/(opens new window) 一句话简介：去中心化机器学习计算协议，实现人工智能开发民主化。描述：旨在通过将全球所有计算能力整合到一个全球超级集群中，彻底改变人工智能和加密货币领域。该网络专为机器学习计算协议设计，任何人都可以随时访问，从而推动机器学习的发展。通过利用区块链技术，Gensyn实现了人工智能训练过程的去中心化，允许点对点、低成本高效率地访问计算资源。这就消除了对云寡头和大型科技公司的依赖，为人工智能开发提供了一个更加民主和无许可的环境。Gensyn的协议使世界各地的设备（包括未充分利用的硬件）都能为去中心化计算网络做出贡献，为任何人、任何地方都能实现人工智能潜力的未来铺平了道路。简短描述什么是数据类别中的公司，最好使用第 2 章中的框架进行细分。 3.1.2 Axiom 网站： https://www.axiom.xyz/(opens new window) 一句话简介： Axiom利用零知识证明，实现对以太坊历史的无信任链上查询和计算，适用于数据丰富的动态的去中心化应用。描述：为人工智能和加密货币的交叉领域铺平了道路，它使开发人员能够在以太坊上创建智能合约，这些合约可以通过零知识（ZK）证明对区块链数据的整个历史进行访问和计算。这一点至关重要，因为它为动态DeFi应用、定制化的预言机和链上忠诚度计划开辟了新的可能性，允许协议根据历史链上活动进行调整，而无需依赖外部预言机或修改已部署的合约。此外，该协议还旨在将 ZK 技术用于人工智能应用，例如通过确保数据完整性和无信任计算，Axiom可以验证在线内容并检测深度伪造。这使得Axiom成为以太坊上未来安全、数据丰富应用的关键参与者，利用人工智能和加密货币的优势，创建一个更加透明、高效和用户驱动的生态系统。来源：金色财经

金色财经02-22 17:01

24小时热点