FX168财经网_全球视野外汇黄金加密货币NFT资讯网

恒生科技指数涨幅扩大至2%，恒生科技ETF华安(513580)上涨1.92%，成交额破1亿元

%，哔哩哔哩-W(09626)，微博-SW(09898)等个股跟涨。恒生科技ETF华安(513580)上涨1.92%，冲击3连阳。最新价报0.64元，盘中成交额已达1.06亿元，换手率6.49%。拉长时间看，截至2023年7月31日，恒生科技ETF华安近1周累计上涨13.87%。规模方面，恒生科技ETF华安最新规模达16.04亿元创近1月新高。数据显示，杠杆资金持续布局中。恒生科技ETF华安最新融资买入额达402.25万元，最新融资余额达1.15亿元。从估值层面来看，恒生科技ETF华安跟踪的恒生科技指数最新市盈率（PE-TTM）仅29.79倍，处于近3年6.91%的分位，即估值低于近3年93.09%以上的时间，处于历史低位。恒生科技ETF华安紧密跟踪恒生科技指数，恒生科技指数代表经筛选后最大30家与科技主题高度相关的香港上市公司。数据显示，恒生科技指数(HSTECH)前十大权重股分别为理想汽车-W(02015)、美团-W(03690)、阿里巴巴-SW(09988)、京东集团-SW(09618)、快手-W(01024)、小米集团-W(01810)、腾讯控股(00700)、网易-S(09999)、百度集团-SW(09888)、小鹏汽车-W(09868)，前十大权重股合计占比70.88%。开源证券认为，展望下半年港股市场投资机遇，当前恒生科技指数重回历史低位，接近2021年历史低点，重点关注二三季度低位布局机会，伴随中国经济增长动力加速、美债利率下行有望驱动港股科技板块估值上行。风险提示：界面有连云呈现的所有信息仅作为参考，不构成投资建议，一切投资操作信息不能作为投资依据。投资有风险，入市需谨慎!

有连云2023-08-01

港股开盘：恒生指数涨0.66％，恒生科技指数涨1.1％，快手涨超5%

7.81点。大型科技股中，阿里巴巴-SW涨2.26％，腾讯控股涨0.45％，京东集团-SW涨0.13％，小米集团-W涨1.3％，网易-S涨1.71％，美团-W涨1.85％，快手-W涨5.65％，哔哩哔哩-W涨2.87％。重点关注快手涨超5%，预计上半年净利润不低于5.6亿元，较上一年净亏损94.3亿元，扭亏为盈。主要由于用户规模的增长及变现策略，收入强劲增长，运营效率持续改善。绿城管理控股涨0.29%，上半年归母净利约4.74亿元同比增长31.3%。太平洋航运跌5.14%，上半年取得营收11.48亿美元，同比减少33%；归属股东净利润8530万美元，同比减少82%。信义能源跌2.09%，上半年收入12.89亿港元，同比增加2.45%；归属股东5.67亿港元，同比减少9.02%。信义光能跌2.98%，上半年收入121.42亿港元，同比增加25.2%；归属股东净利润13.92亿港元，同比减少26.9%。期内太阳能玻璃销量增加，收入增长30.8%至105.79亿港元。信义玻璃涨0.47%，上半年收入126.21亿港元，同比减少7.5%；归属股东净利润21.48亿港元，同比减少35%，主要由于汇率贬值及浮法玻璃售价下跌，贡献收入同比减少13.1%。海外市场美股方面，道指涨0.28%，纳指涨0.21%，标普500指数涨0.15%。大型科技股互有涨跌，Amazon涨1.11%，Google、苹果、特斯拉小幅上涨，Meta跌超2%，微软跌0.72%，英伟达跌0.04%。热门中概股普涨，纳斯达克中国金龙指数涨0.67%。蔚来涨超3%，京东、阿里巴巴涨超1%，拼多多、百度、网易、理想汽车小幅上涨，小鹏汽车跌超10%。

金融界2023-08-01

基金早班车|仅一个星期，公募基金冠军换人了！展望8月券商研报最关注的三大投资方向

44.32点。大型科技股中，阿里巴巴-SW涨1.67%，腾讯控股涨1.14%，京东集团-SW涨4.17%，小米集团-W涨0.82%，网易-S涨0.59%，美团-W涨2.74%，快手-W涨2.67%，哔哩哔哩-W涨4%。南向资金净卖出59.61亿港元，腾讯控股遭净卖出10.13亿港元，快手逆势获净买入5.73亿港元。 3.美国三大股指小幅收涨，道指涨0.28%报35559.53点，标普500指数涨0.15%报4588.96点，纳指涨0.21%报14346.02点。迪士尼涨3.19%，雪佛龙涨3.02%，领涨道指。万得美国TAMAMA科技指数跌0.09%，脸书跌2.11%，特斯拉涨0.37%。中概股普遍上涨，老虎证券涨10.45%，新蛋涨8.09%。7月份，道指涨3.35%，标普500指数涨3.11%，纳指涨4.05%；标普500指数和纳指均录得月线五连涨。 4.中基协发布数据显示，6月证券期货经营机构共备案私募资管产品945只，设立规模460.90亿元。截至6月底，证券期货经营机构私募资管业务规模合计13.21万亿元（不含社保基金、企业年金），环比下降1.83%。 5.基金公司开始就季报信息披露质量展开自查。对于已发布季报更正公告的公司，需要写相关情况说明报告，对于尚未发布更正公告的公司，需就季报信息披露质量展开自查。 6.上周公募基金又有多只产品修改业绩比较基准，业内人士认为此举旨在优化基准设置。据悉，很多FOF基金业绩比较基准修改都在去除宽基指数的对标，真正地把基金指数纳入比较框架。 7.Wind数据显示，截至7月31日，今年以来有101家基金公司发布相关公告，合计182位基金经理离任，7月以来公募市场合计35名基金经理离任，其中还有部分离任基金经理管理的产品尚处于封闭期。二、新基金发行 8月1日（周二），“固收+”优选——华宝安元债券型基金（A类代码018570，C类代码018571）正式发售。该基金由五星固收投资名将、华宝基金混合资产部总经理李栋梁亲自担纲。据海通证券数据统计，截至2023年6月30日，华宝基金固定收益类资产最近5年业绩排名行业第2位（2/103），华宝基金同时获得天相投顾“基金管理公司综合评级（3年期）”5A最高评级，体现出公司优异的固收投资实力，其此次发行的债基新品的未来表现值得期待。三、宏观产业上海市将加强前沿技术研究布局，聚焦国际区块链技术前沿发展趋势，推动智能计算能力提升。面向下一代互联网计算系统，突破异构融合计算芯片和开源开放区块链分布式操作系统等软硬件前沿领域，提升区块链大规模组网运算能力。新加坡金管局将加强对单一家族办公室（SFOs）洗钱风险防范措施，提议统一所有特殊金融机构豁免标准。特斯拉旗下Model3、Model Y多款车型将于8月4日在中国香港再次降价，部分车型降价幅度高达11.9%。美国具有99年历史的卡车运输巨头Yellow宣布倒闭，公司将立即停止运营，从而导致约3万名员工失业。

金融界2023-08-01

加拿大几个“从业者”到华人超市零元购！不曾想被“软柿子”捏爆了….

加拿大网络热传的视频显示，在多伦多一家Shoppers Drug Mart，两名男子偷走了价值至少数百加元的香水等商品。图自推特，2023年6月视频显示，两名戴着医用口罩和棒球帽的男子从商店的货架上将数十瓶昂贵的香水取下，塞入黑色的大袋子中。图自推特，2023年6月然后两人旁若无人地领着袋子走出店外。目前尚不清楚视频拍摄于哪一天，在哪一家Shoppers Drug Mart分店。事发后，有网友调侃这是“加州疯狂购物”。还有网友表示：“多伦多正在成为旧金山”。也有网友讲述了自己的邻居的经历，她说：“我的邻居每隔几天就会从 shoppers drug mart 偷东西来资助他的毒瘾。永远不会被捕。他告诉我，购物者可以拿走装满被盗物品的包，但他们（店员）不能碰他或逮捕他，所以他不害怕”。更有网友称：“这很普遍，不仅仅是多伦多。商家也指示工作人员永远不要干预”。甚至加拿大运动服饰品牌Lululemon因坚持解雇试图阻止抢劫的两名员工而在网络上受到了批评。图自推特，2023年5月网络上流传的视频显示，三名蒙面窃贼在Lululemon店内公然进行偷窃。视频中，三名戴着面具和帽子的男子在店内从货架上抓取大量衣物。背景中的声音表明有人在喊叫让他们离开。店内员工们并没有试图亲自阻止嫌疑人，而是对他们喊叫，并跟随窃贼走出店外，目睹并拍摄他们跑向车辆的镜头。据当地媒体获得的一份声明，这家总部位于温哥华的知名运动服饰公司解雇了员工Jennifer Ferguson和Rachel Rogers，原因是她们违反公司政策。据Lululemon公司的政策规定，员工不应冒着危险去直接面对窃贼。如果说零元购造成的损失由谁负担，其实就是所有加拿大纳税人，因为无论是商家把损失计入成本还是保险公司赔付，最终零元购造成的损失都将由郑哥社会分摊。图自推特，2023年6月事实上，民众对警方无力应对零元购从业者已经非常不满，比如在华人超市被群众拿下的”黑哥们“估计几个小时后就能重获自由，然后换一家超市继续糟蹋其他商家。刚刚在特鲁多内阁改组中上任的司法部长兼总检察长Arif Virani表示，任期内将致力修改C-48，让受到暴力犯罪指控的人更难获保释。但据加拿大媒体报道，修改C-48法案无论在自由党内部还是自由党外部都有很多阻力。所以，新任总检察长的愿景很可能沦为一句空话。图自CTV，2023年7月28日他就职后就表示，将致力修改C-48，让受到暴力犯罪指控的人更难获保释。但修改C-48法案是在自由党内外都受到不同程度的阻碍。这位新任总检察长的愿景很可能落空事实上，在加拿大除了介于偷和抢之间的“零元购”之外，还有一种新兴的“零元购”，比如7月22日遭到加拿大多家媒体集中报道的华人大妈在超市“逛吃逛吃”新闻。据网友介绍，画面中的大妈疑似华人，在超市里专挑贵的水果免费吃，旁观的店员已经无动于衷，因为既不能动手制止，言语提醒无效，而报警又是白费力气。所以干脆让大妈尽情“逛吃逛吃”了。图自小红书，2023年7月22日而美国的一起案例也说明无论加拿大还是美国，执法机构已经无力阻止“零元购”，只能靠大家自发互助解决这些从业者了。 5月2日，美国南加州Mira Loma一家TJ Maxx商店，两名女“零元购”抢了好几包商品大摇大摆地出门，不料遇到一名英雄顾客，一拳将其中一名女“零元购”撂倒，受到网友的高度称赞。而女子在被拦截之后，转身一拳打在男子头上，男子也没惯着她，摁着她的脖子将她甩到安检门上。紧接着将该女子摁在地上。而该女子则哀求道：让我走吧。最终，男子松开手，该女子赶紧爬起来跑了，没有带走任何东西。在美国，“零元购”最猖獗的是旧金山，连锁药房Walgreens说每天至少损失1000美元以上，一下子关了5家门店。但这一次，保安不敢做的事，顾客帮忙做了。在推特上，许多网友都对这名男子见义勇为高度赞扬。网友Spec.More：不是所有的英雄都穿着斗篷。网友bardo：我们需要更多像他这样的人。网友dz：英雄在行动网友Martin Fellbaum：我真的希望他不会面临任何指控……我们的法律现在太落后了。所以呢，我们华人不要去“零元购”，挑樱桃吃的那种也不要干。同时，我们还要学会团结，让“零元购”从业者认识到，干这种事不要去华人超市和商店。 0

加拿大乐活网2023-08-01

Arkham万字投研报告：业务、赛道及估值

金色财经2023-08-01

全览60个永续合约协议：订单簿仍占优势预言机依赖加剧

moen，OpenBook，Opyn（Squeeth），Perennial，Perpetual Protocol，Perpy，Pika，Polynomial，Predy，RabbitX，RageTrade，Sentiment，Serum，STFX，Syndr，Synfutures Protocol，Synthetix，Tigris Trade，Tribe 3 ，Unidex，Variabl，Vega，Vela，Vertex，Vyper 和 Zeta Markets。在本文中，我们将首先简要回顾永续期货，然后对上述协议进行广泛分类。在此分类的基础上，我们将深入探讨这些协议之间的区别，探讨它们在提供流动性和合约定价方法上所做的权衡。永续合约概念回顾在本节中，您可以找到有关永续合约的简要介绍。期货合约是一种法律协议，约定在未来的特定时间以预定价格买入或卖出特定商品、资产或证券。与期权不同，期货合约没有选择权，协议是具有约束力的。永续合约是期货合约的一种，没有到期日，因此得名。永续合约的概念最早由 Robert Shiller 于 1992 年提出，BitMEX 于 2016 年首次实施了永续合约。永续合约是一种 Delta-1 产品，这意味着在标的资产每变动 1 美元时，合约价格也会变动 1 美元。例如，假设以太坊的交易价格为 2000 美元。您开设了一个名义价值为 1 个以太坊的永续多头头寸。经过一段时间，如果以太坊达到 2200 美元，利润将为 1 个以太坊 * （2200 美元 - 2000 美元）= 200 美元，减去交易费用和资金费率。这使得交易者能够在不担心时间范围的情况下对资产价格的波动进行投机。交易者可以保持他们的多头或空头头寸开放，时间长短由他们自己决定。对于交易者来说，需要注意的是他们需要支付费用，并且在使用杠杆的情况下，需要密切关注头寸的健康状况，以避免被强制平仓的风险。在大多数永续合约协议中，清算是至关重要的组成部分，因为坏账的积累可能会使协议和/或流动性提供者（LP）破产。资金费率或借款利率（具体术语取决于协议）被实施为促进市场效率、提供套利机会以及为承担不太受欢迎头寸的参与者提供补偿，以平衡持仓量（OI）。永续合约协议的分类可以根据两个主要变量进行非常广泛的分类。协议是否需要将流动性锁定在其中？可以将其视为：是否有流动性池，或者完全是点对点（P2P）的？协议是否直接影响市场，从而导致或影响标的资产或合约的价格发现？还是协议使用预言机来获取资产的公平价格？基于此，我们可以提出这个基本的（可能过于简单的）分类：永续协议的分类矩阵基于两个关键标准： 1）外部价格发现与内部（预言机 s 与预言机 less）以及 2）无流动性锁定与流动性池（P2P 与 P2P ool）我们将在文章的协议细分部分中使用这种按流动性提供和定价机制分类的方式，以深入探讨协议提供永续合约的不同方式。订单簿在这个部分，我们可以找到以下协议： Alex、Apollo、Blue Fin（前 Firefly Exchange）、DDX、Digitex、dYdX、Hubble、Hyperliquid、IDEX、Injective、Kujira、Lendroid、Mango、Market Protocol、RabbitX、Variabl、Vega 和 Zeta。基于 AMM AMM 杠杆现货：bZx、DDEX、Dolomite、Futureswap、MCDEX 杠杆账户：Gearbox、Sentiment Power Perpetuals：Deri、Numoen、Opyn（Squeeth）、Polynomial 和 Predy v2。永续期权：Predy v3。 VAMM Drift、Increment、InfinityPools、NFTperp、Perpetual Protocol、Rage Trade 和 Tribe 3 。虽然 Predy 和 InfinityPools 都使用 AMM 的集中流动性构建“永续期权”或永续合约，但请注意它们以不同的方式实施，因此它们属于不同的类别。在我们之前的期权系列中，我们介绍了一些基于相同概念构建的协议，但更专注于提供类似期权的体验，如 Gamma Swap、Panoptic 或 Smilee。基于预言机的在这个部分，我们可以找到以下协议：合成流动性 Avantis、Gains Network、Deri、Synthetix（Kwenta、Polynomial 等）、Tigris Trade 和 Vela。一篮子资产 Angle、Apollo V2、Cap、Deri、Derivio、GMX 及其分叉、Good Entry、Levana、Level、Lexer、Mux、Pika 和 Synfutures Protocol。其他这些协议不一定符合上述类别，或者更适合包含在一个独立的类别中。因此，它们在这里列出以供完整性考虑，但本文的其余部分将重点关注上述类别。聚合器在这个部分，我们可以找到以下协议： UniDEX 和 MUX。类似于现货聚合器，如 1inch、Matcha 或 DeFillamaSwap。这些协议比较永续合约交易场所的费用和价格，以在最有利的场所进行交易。社交交易<>跟单在这个部分，我们可以找到以下协议： Perpy 和 SFTX。它们允许用户在其他平台上进行复制交易。例如，一个交易者在 GMX 上进行交易，其他用户会复制相同的交易。基础设施允许其他协议在其上构建的协议。 0x、Serum、OpenBook 允许协议推出订单簿平台。 Vyper、Derivio、Perennial 和 Convergence RFQ 有一些更具特定案例的解决方案。一般来说，它们可以被看作是其他协议可以在其上构建自己市场的基础层。简要介绍 RFQ。RFQ 代表报价请求，通常交易商请求报价，做市商则对特定的工具/资产/数量等作出回应。到期资产 Contango 提供到期资产。这既不是永久性的——因为显然它们会到期——也不是远期合约。Contango 没有订单簿或流动性池。当一个头寸被开立时，Contango 在固定利率市场上借款，在现货市场上进行掉期交易，然后再在固定利率市场上借出。交易对基于固定利率货币市场上可用的资产，如收益或名义。在到期时，合约可以通过现金结算或实物交割来解决。永续协议市场分析市场概述：需要注意的是，我们的研究存在存活偏差。尽管如此，我们还是专注于包括上述协议，尽管它们的成功程度各不相同。在我们深入探讨不同类型的永续协议之前，有两个与链上衍生品相关的重要考虑因素，即监管不确定性和 DeFi 之前的历史背景。链上衍生品面临监管不确定性。它们面临着影响市场的监管挑战。以下是两个重要案例： Digitex， 2017 年 12 月。该平台在被商品期货交易委员会（CFTC）起诉非法经营商品期货交易平台时遭遇了监管审查。 bZx 或 bZeroX（Fulcrum Trade）， 2019 年 6 月。bZx 的历史比 Digitex 更加复杂。它遭遇了 4 次重大损失（链接）。该协议由 Ooki DAO 管理。CFTC 指控了创始人和 Ooki DAO 非法提供场外数字资产交易。在 2020 年 DeFi Summer 到来之前，链上并没有发生太多事情，之前一些工作的项目也没有看到曙光。 VariabL， 2017 年第四季度。博客上的最后更新是在 2018 年第二季度。VariabL 是由 ConsenSys 在以太坊上构建的衍生品交易平台。 Market Protocol. 在 2019 年 12 月的推特上进行了最后更新。订单簿订单簿的目标是充分实现链上点对点交易。然而，主要问题是大多数流行的区块链不适合具备完全链上订单簿。因此，采用了不同的解决方案。 1）将系统的部分内容放在链下。主要是匹配引擎，因为它是订单簿中资源密集型（计算成本高昂）的组件。 2）完全链上。转移到 Alt 层，例如 Solana，底层区块链的安全性较低，但吞吐量较高。订单簿中的更新可以每个区块或每半秒发生一次。 3）建立自己 L1。有两种方法可以实现这一点：一种是通过在 OP 堆栈或 Cosmos 上构建应用链，另一种是从头开始构建独立的 L1。每种方法都有优缺点。例如，将应用程序的部分放在链下会引入信任假设。在底层链上以较低的安全性换取更快的吞吐量和较少的去中心化。应用链可以提供协议来捕获 MEV，但代价是需要更多的许可设置并增加摩擦层。自动做市商（AMM）与订单簿不同，订单在 P2P 中结算，AMMs 需要将流动性锁定在流动性池中。AMMs 和 vAMMs 之间的关键区别在于，AMMs 需要真实的流动性，而 vAMMs 的流动性直接来自位于 vAMM 之外的保险库，因此不一定需要 LP 的存在。现货 AMM 在这种情况下，尽管 AMM 不是永续期货，但它们被包括在内，因为它们允许交易者通过借入资金利用杠杆对标的资产进行 Delta= 1 的敞口。然而，这种类型的协议也有一些优势。像 Uniswap 这样的 AMM 提供了灵活性，可以交易各种资产，只要有流动市场可用。这使交易者能够以杠杆方式访问可能在其他永续期货协议上不符合条件的资产。此外，使用已经包含在现货 AMMs 中的流动性确保了连续的流动性以匹配买卖订单，从而有助于资产的价格发现。然而，也存在一些权衡。为了让交易者获得杠杆，需要激励借款人以具有吸引力的收益率和/或奖励进行存款。此外，虽然我们提到通过使用现货市场，潜在上可以交易所有资产，但也需要在一定程度上具备许可制度，以避免用户在蜜罐、抢劫等方面损失借款人的资金。由于 LP 不是交易者的直接交易对手，他们避免了破产风险。然而，这是以成为交易者的借款人和承担信用风险为代价的。关于 Power 永续期货，它们是由 Paradigm 于 2021 年引入的。Opyn（SQUEETH）是第一个实施这种协议的团队。简而言之，它们具有 n^x 的回报，例如 ETH²。 VAMM vAMMs 提供了一种解耦的市场结构，有助于独立的价格发现与基础现货价格。这可能导致期货价格与资产现货价格之间存在差异，从而产生套利机会。另一方面，永续合约的真实价格是多少？ vAMMs 面临的另一个挑战是流动性。缺乏深度流动性可能会在开仓/平仓时引发意外或不希望的价格波动。 vAMM 模型依赖于清算头寸和保持平衡的持仓量，以使标记价格接近现货价格。然而，这会产生固有的不平衡和偏差，随着时间的推移，特别是在市场崩溃或极端市场波动期间。基于预言机的协议从广义上讲，基于预言机的协议可以定义为具有充当交易对手的流动性池的协议。与 AMMs 不同，协议本身没有价格发现，而是使用预言机从其他场所定价基础资产。我们可以找到两种基于预言机的永续期货的原型。合成流动性。单一资产用作所有交易市场的基础。通过使用预言机，LP 可以成为所有这些市场的交易对手。一篮子资产。使用一篮子资产作为交易对手。也就是说，在假设的 BTC/USDC 中，BTC 作为多头的抵押品，USDC 作为空头的抵押品。可以添加更多资产，但这是一般的基本原理。合成资产。它们的优势在于，由于单一资产是交易对手方，对于可以添加哪些市场没有实际限制。只要有足够可靠的预言机。这使得协议在添加市场方面更加灵活。然而，这对流动性提供者来说更加风险，因为他们承担了无法在链上对冲的某些资产的风险。例如，作为黄金或美元/日元的交易对手。好的一面是，假设资产篮子在池中保持 50% 的美元平衡，就不会出现意外的暂时损失，这与 Uniswap V2 的暂时损失情况相似。使用一篮子资产的协议为流动性提供者提供了更为严格的设置，这对风险管理有利（波动性资产支持多头，稳定性资产支持空头，因此即使价格波动剧烈，系统仍然有抵押物）。这是以交易者的代价为代价的，他们没有那么多可以交易的市场。例如，在 GMX v1 中，您只能交易五种资产。然而，一个非常合理的反驳或问题是，大多数交易者是否真的想要访问比特币和以太坊之外的市场。可以在这里找到按资产分解的交易量数据。快速浏览数据可以看出，对于 Gains Network， 50 ～ 70% 的交易量是在比特币和以太坊上产生的，而对于 Kwenta，大约是 40% 到 80% 。协议细分在上一节的市场概述中，我们转向探索协议可以分解为的不同部分。本文将重点介绍流动性提供和定价。流动性提供从协议的角度来看，我们可以将其广泛分为两组： P2P 交易。因此，平台上不需要锁定流动性（TVL= 0）。流动性池。通过 AMM、vAMM 或预言机进行交易。本节涵盖的主题包括：去中心化协议中的流动性机制。交易者的交易对手是谁？ - 流动性提供者的角色和激励措施 - 在不同资产和市场之间平衡流动性。订单簿简单来说，做市商和市场接受者相互交易。协议可能会激励做市商/接受者的流动性。对于协议来说，复杂的任务是如何及时匹配做市商和市场接受者的订单。例如，根据德意志交易所集团（Deutsche Börse Group） 2023 年 5 月的一份报告，参与者在不到 2770 纳秒的时间内做出反应。现在可以通过像以太坊这样的通用链来处理吗？答案是不。这迫使协议要么移至链外，要么移至 dApp，迫使验证者也运行订单簿。由此可见，流动性提供者是与其他参与者进行互动的主动代理。除了做市商可能不会为 HarryPotterObamaSonic 10 Inu 等 Meme 币提供做市外，没有真正的障碍阻止订单簿列出这些币种。现货 AMMs 在这里，用于结算交易的流动性来自 Uniswap 等 AMMs。尽管如此，协议本身需要激励借款人前来，因为他们是为交易者提供杠杆的人。Sentiment 和 Gearbox 虽然允许用户做更多的事情，但它们也属于这个类别。流动性提供者是相对被动的角色，他们“只是”提供杠杆。 Power Perpetuals Power Perpetuals，如 SQUEETH，由两个参与者组成。其中一方看涨 ETH²，另一方看跌 ETH²。由于每个协议都遵循不同的设计，无法对其进行概括。例如：在 Opyn 中，空头方使用 ETH 作为抵押品铸造 Power Perpetual。多头交易者只能在开放市场上购买 SQUEETH，例如在 Uniswap 等 AMM 中。因此，为了获利，他们也需要能够出售。在 Numoen 中，多头方铸造代币，而流动性提供者提供 LP 代币作为抵押品，他们将 LP 代币借给交易者。 Deri 使用单一流动性池作为所有衍生品（包括 Power Perpetuals）的交易对手。因此，虽然在这里包括了 Deri，但其流动性模型本质上与基于预言机的协议相同。 Polynomial 尚未发布其模型，但团队表示将以与竞争对手不同的方式使用流动性池。 vAMMs 在提供流动性方面，vAMMs 采用了各种不同的方法。 Perpetual Protocol 及其遵循其模型的协议（如 NftPerp）。理论上，在这里实际上不需要流动性提供者，因为 vAMM 铸造虚拟代币时不需要交易对手。如果没有交易对手会发生什么？这就是为什么在 Perp v1 中，团队在一段时间内是主要的流动性提供者之一，因为他们进行做市以促进交易。后来引入了流动性提供者，虽然仍然希望将多头与空头匹配，但通过引入流动性提供者，确保了持续的流动性。因此，在这种模型中，流动性提供者既可以是被动的（提供流动性，交易者自行解决），也可以是更积极的（套利价格并收取资金费用）。 Increment 采用了与 Perpetual Protocol 类似的模型，但不是使用 Uniswap v3 模型，而是通过利用 Curve 的 V2 数学来集中流动性。协议中的每个流动性池可能会根据池中资产的波动性使用不同的参数化。 Rage Trade 引入了“全链循环流动性”的概念。什么是全链循环流动性？全链循环流动性是一个将流动性分为 80-20 份的国库，其中 80% 的流动性被重新部署以在 Curve 上提供流动性，而另外 20% 的流动性则在 Rage Trade 上提供集中流动性（由 Uni v3 提供支持）。vAMM 的虚拟流动性由 80-20 国库支持。 InfinityPools 通过构建在 Uniswap V3 集中流动性概念之上来实现其流动性。通过重新平衡类似于 Uniswap 的流动性头寸，它可以实现非常大的杠杆而无需清算风险。例如，流动性提供者在 ETH/USDC 池中存入价值 1000 美元的资产，价格范围为 900-1000 。然后，交易者可以借用该流动性提供者的头寸，并以 1 ETH（1 ETH = 1000 美元）赎回所有流动性。 Drift V1. Drift 使用了一个名为动态 VAMM（DAMM）的 VAMM，其中流动性来源于 Drift 上的流动性提供者。该 AMM 实施了一组参数来微调市场深度，例如价格乘数、费用池或分段。Drift V1 AMM 现在是 Drift V2 的一部分。混合模式：AMM + 订单簿订单簿可能面临的一个问题是：如果没有市场做市商出现来发布买卖单，怎么办？因此，一些协议引入了订单簿和 AMM 之间的混合模型，以确保持续的流动性。 Drift v2 使用了三种不同的流动性机制。首先，由市场做市商提供的即时荷兰拍卖（JIT dutch-auction）。这个过程大约持续 5 秒。其次，有一个限价订单簿，它仅执行限价订单，并由管理员机器人网络运行。第三，如果在前两个步骤中没有市场做市商参与，将使用一个恒定乘积的 AMM——Drift V1 AMM，以确保交易者有持续的流动性。 Vertex 使用了一个价格/时间优先的算法，因此订单将根据最佳价格执行，无论是 AMM 还是市场做市商提供价格。AMM 在订单簿上以离散的价格水平报价，以近似 xy=k。 Syndr 将一个链下订单簿与部署在 Arbitrum 上的流动性池相结合。AMM 将整合散户提供的流动性，而订单簿则旨在由市场做市商提供报价。基于预言机，合成资产流动性提供相对简单。一个作为所有交易的交易对手方的保险库。虽然主要的流动性提供者是被动提供流动性的，但我们也可以识别出有意获取资金费率的主动参与者。通过这样做，他们平衡了平台的开放利益，从而促使更多的交易发生。保险库的流动性可以通过以下方式提供：以美元计价的稳定币，如 Avantis、Gains Network、Deri on zkSync 和 Tigris Trade，其中——根据协议的不同——DAI、USDC 或 USDT 的资金支持所有交易。协议的另一个区别在于它们是否实施了像 Avantis 这样的分层机制。波动性资产。例如，Kwenta 和其他协议是建立在 Synthetix 之上的，其中 SNX 的质押者是交易的对手方。基于预言机，一篮子资产主要思想与上面相同，但基础不是单一资产，而是一篮子或多篮子资产。与前面的部分类似，协议也可以具有分层机制——Level——或者没有——GMX、Pika 和 MUX。虽然 Angle 在这里，但由于 Euler 黑客事件，该功能已经被关闭。简要概述一下，Angle 是 agEUR（欧元稳定币）的发行者。用于铸造 agEUR 的抵押资产被用作交易者的交易对手方。因此，某人提供 1 个 ETH 可以获得 1000 个 agEUR，可以做多 ETH 并做空欧元，从而使协议保持中立。这也使 Angle 能够在外汇市场上拥有永续合约，例如 agEUR/USDT 交易对。在这里特别提到的是 Lexer Markets，他们既使用了资产篮子，又使用了合成流动性。价格发现我们可以根据价格发现是在协议内部还是在协议外部进行，并随后通过预言机广播来对协议进行大致分类。本节涵盖的主题有：价格发现方法 - 价格滑点 - 结算。订单簿由于订单簿促进了买方的竞价和卖方的要价之间的 P2P 交易，它为价格发现和交易执行创造了一个市场。在这种情况下，协议允许交易者以任何价格执行交易，无需使用预言机。滑点存在的原因是订单可能过大，无法以特定价格成交，也可以理解为在该价格水平上没有足够的流动性，因此订单将价格推向不利于执行的价格。订单簿交易的结算过程涉及两个参与者，即做市商和接单者。做市商在订单簿上放置限价订单，而接单者是接受并执行订单簿上现有订单的交易者。当接单者的市价订单与做市商的限价订单匹配时，就会发生交易。资金费率的存在是为了平衡多头和空头仓位，同时使衍生品合约的价格保持接近基础资产的价格。现货 AMM 价格发现发生在平台之外。由于这些协议集成到现货 AMM 或 DEX 聚合器中，交易发生在 Uniswap、Curve 等平台上。因此，价格发现受限于集成的交易场所数量以及这些场所内的流动性。对于现货 AMM 来说，预言机非常重要，主要是为了确保为买方和卖方提供最佳价格执行。预言机还用于跟踪其仓位的健康状况；有关此内容的详细信息将在风险部分进行详述。结算是针对在执行交易的 AMM 上存在的流动性进行的（或与之进行）。然而，重要的是要注意实际上需要进行两笔交易：当仓位开启时，在保证金上购买/出售资产，当仓位关闭时，再在市场上出售/购买资产。由于没有衍生品价格，因此没有资金费用。然而，为了进行保证金交易，用户必须向出借人支付借款利率。 vAMM 非常广义地说，我们可以将所有的 vAMM 都归为同一类别，不包括 InfinityPools。vAMM 将在其虚拟流动性储备中面临滑点问题。交易是针对用于铸造虚拟流动性的资产进行结算的。 Perp Protocol、Rage Trade、Drift 等基于 Uniswap V3 的类似协议。指数价格通过预言机进行跟踪；例如，Rage Trade 使用 Chainlink。每个特定的永续合约都通过开放市场独立发现标记价格。每个 vAMM 可能在如何在虚拟（市场）价格和指数价格之间收敛方面实施不同的变化。例如，Drift 会更新报价资产储备或 k 因子（xy=k）。 Infinity Pools 基于 Uniswap V3 的概念构建，通过重新平衡其 vAMM 中的流动性仓位，可以实现非常大的杠杆，而无需担心清算风险。一个流动性提供者在 ETH/USDC 池中存入价值 1000 美元的资产，价格范围在 900-1000 之间。交易者借入并赎回了所有的流动性，得到了 1 个 ETH（1 ETH = 1000 美元），并以 100 美元作为抵押品。这会根据 ETH 的价格产生以下三种情况。如果 1 个 ETH > 1000 美元 → 交易者获利。利润是 ETH 现货价格与 1000 美元之间的差额。如果 1000 美元 > 1 个 ETH > 900 美元 → 交易者的账户将是抵押品 + 1 个 ETH。在任何时刻，这将等于或大于 1000 美元。最坏的情况是 ETH 价值 901 美元 + 抵押品 99 美元。如果 1 个 ETH < 900 美元。交易者的全部资本将转换为 ETH。对于流动性提供者来说，没有“风险”，因为如果是在 Uniswap 上，他们的全部流动性提供将是 ETH。在这个特定的例子中，交易者在其 1 个 ETH 仓位上将有 1.11 个 ETH 作为抵押品。混合：AMM + 订单簿 Drift V2 有一个非常清晰的定价方法。交易首先通过拍卖定价，然后通过订单簿定价，最后通过 AMM 定价。 Vertex 将使用订单簿或 AMM 为用户提供报价。目前，市场做市商大部分情况下给出更紧密的报价，但如果 AMM 规模显著扩大，AMM 也可能给出更紧密的市场报价。在 Syndr 上，AMM 部分的工作方式类似于 GMX/GLP 池，但会包括买入/卖出价差。基于预言机，综合资产和一篮子资产。这些协议使用预言机（因此得名）来确定合约交易的价格。反过来，预言机通过不同的方法确定资产的价格，例如仅使用 Uniswap 价格的 TWAP（效果不佳）或汇总最流动的 CEX（主要是 Binance）上的价格。为了进一步说明这一点： Gains Network 价格通过一组机器人中继，这些机器人是半许可的，因为机器人需要持有 NFT 才能这样做。机器人在执行限价、止损限价、止盈、止损和清算订单时使用 Chainlink 资产价格。 GMX. GMX v1 使用自定义价格源和像 Binance 和 Chainlink 这样的 CEX 的组合。如果快速价格早于 5 分钟，则仅考虑 Chainlink 价格。对于 GMX v2，将实施一个新的低延迟 Chainlink 预言机。预言机维护者由 GMX 团队运行。在价格滑点方面，由于交易是针对基于预言机的池进行的，所以实际上没有价格滑点。这可能导致一些特殊情况，即交易者可以在没有任何价格影响的情况下做多或做空低流动性资产。然而，一些协议对此问题引入了一些解决方法，例如引入合成滑点费用或要求最小价格偏差以盈利平仓。结算是针对池的流动性提供者提供的资产进行的。理想情况下，多头和空头应该平衡，以便池没有真正的 Delta 敞口，流动性提供者只从费用中获利。然而，并非总是如此，池中的流动性是交易者的对手方。在市场波动较大的情况下，这种方式效果很好，因为交易者长期亏损，但在单向市场（例如 terra luna 崩盘）中，情况就变得不稳定了。资金费用是存在的，但不是为了平衡价格，而是为了平衡持仓量。这是协议实施的一种典型的风险缓解方法。 Power Perpetuals 再次强调，由于每个 Power Perpetuals 的实现方式不同，很难对其设计进行概括。此外，一些 Power Perpetuals 可以归类为其他类别，比如 Deri；或者尚未公开其模型，比如 Polynomial。然而，我们认为值得强调这些案例的特定方面；例如，在 Squeeth 中：指数价格：Squeeth 的指数价格是 ETH²。标记价格：标记价格是 Squeeth 的当前交易价格。 Power Perpetuals 依赖套利者来保持指数和标记价格接近。但不仅仅是价格。波动性：市场可能高估/低估波动性。资金费率将过高/过低。价格：指数与标记价格之间的差异。在 AMM 上买入时会发生滑点，这可能有些问题，因为流动性通常不是非常高。与 AMM 类似，为了获利，交易者需要在池中同时买入和卖出，这与上述观点相结合，有时可能会导致交易者无法获得最佳的用户体验。结论在本文中，我们对永续合约市场进行了广泛的概述，包括流动性提供和这些合约的定价。在本报告中，我们研究了 60 多个不同的协议。仅仅通过过去 4 年部署的永续合约协议的数量，就可以清楚地看出，永续合约市场已经取得了实质性的产品市场适应性，而在某种程度上可能导致市场饱和。一个简单的例子可以说明这一点，比特币的持仓量从 2020 年的约 30 万个 BTC（价值约 30 亿美元）增加到 2023 年的约 45 万个 BTC（价值约 130 亿美元）。订单簿很可能是最适合交易的类型，这就是为什么 dYdX 目前是永续合约去中心化交易所（perp-DEXs）中交易量最大的。订单簿之所以是大多数做市商习惯使用的原因可能是，它们给予了做市商（流动性提供者）灵活性，并对交易者购买和出售的价格有更精细的控制。然而，当今区块链的技术限制导致协议使用其他方法进行流动性引导。 AMM 和 vAMM 在 DeFi 周期早期非常流行。它们中的大多数最终都采用了 Uniswap v3（集中流动性）的路线。AMM 确保参与者在流动性存在的情况下持续获得流动性，但可能以吸收有毒订单流为代价。InfinityPools 和 Predy 使用了新的 AMM 方法，其中 Uniswap LP 被用作流动性来源。在订单簿和 AMM 之间，有两个协议——Drift 和 Vertex——采用了混合方法来提供流动性和定价。通过结合这两种模式，它们旨在兼顾两者的优点，使用户在使用 AMM 作为备份以确保持续流动性的同时，对其交易具有精细控制。另一方面，基于预言机的协议需要依赖第三方基础设施——预言机——进行操作。用户能够在不担心特定交易场所的流动性深度和提供流动性的便利性的情况下进行交易（只需向池中添加流动性），这也促成了这些协议的成功。未来，我们计划更深入地研究永续协议所采用的风险管理策略、其费用结构以及它们在更广泛的 DeFi 乐高生态系统中的集成。通过研究这些方面，我们的目标是全面了解永续期货交易所不断发展的格局。来源：金色财经

金色财经2023-08-01

火箭军高层换马！金融时报：习近平再次发起军队反腐运动，军队对党不够绝对忠诚？

，据金融时报。颐园居, CC BY-SA 4.0 sa/4.0>, via Wikimedia Commons 中国周一在一份简短的国家媒体公告中，公布了火箭军新的司令员王厚斌、火箭军政治委员徐西盛。据官方新华社周一报道，王厚斌在习近平主席出席的仪式上晋升上将，称王厚斌为中国人民解放军火箭军司令员，中国此前并未公布这一事实。解放军装备发展部列出了其正在调查的八个问题，包括 "泄露项目和军队单位信息 "以及帮助某些公司获得投标。本月在北京举行的两次高层会议上，习近平告诉军队领导人，他们必须 "着力解决各级党组织在落实党对军队绝对领导方面，存在的突出问题"。习近平担任主席的中国最高军事领导机关，中央军委本月要求建立 "军队廉政风险预警机制"，并宣布调查近六年来装备采购中的腐败问题。中国人民解放军火箭军负责监管中国的核武库和常规导弹库，多名高级军官已经从公众视野中消失，这通常是调查的信号。中国前外交部长秦刚在上周被其前任王毅接替之前，有一个月没有公开露面。在上月底习近平晋升解放军高级将领的官方报道中，解放军火箭军司令员李玉超的名字没有出现，而他本应出席这一活动。一位收到火箭军自己的将领夏季晋升仪式报告的人士说，李也缺席了那次活动，解放军专家称这种情况 "非常反常"。加拿大追踪中国精英政治的咨询公司Cercius称，约有10名现任和前任火箭军官员的身份不明，其中包括李和他的副手刘光滨。美国空军大学中国航空航天研究所研究主任、解放军火箭军问题权威专家罗德·李说："包括现任和前任指挥官在内的一些人（如果不是全部），因违纪或腐败被卷铺盖走人的可能性非常大。" 据《南华早报》周五报道，包括李玉超和他的副手刘在内的几名现任和前任解放军火箭军军官已成为调查对象，调查尚未正式宣布，《金融时报》也无法独立证实火箭军的调查对象。但Cercius指出，去年年底拘留和逮捕与火箭军有关系的低级官员，表明调查范围更广。在对低级官员进行调查的几个月后，更高级别的干部因涉嫌腐败而被捕的情况很常见。 6月初，中国共产党中央纪委宣布，自去年10月党的二十大以来，已有超过39名高级军事和政治干部被捕，但该并未公布所有面临起诉者的姓名。习近平的领导下，中共反腐运动达到了铲除政治对手和惩治地方腐败的双重目的。自2012年以来，近500万名下级官员和数千名高级 "老虎"，以及科技、金融和能源行业的高管，甚至中国自己的反腐监督机构都被卷入其中。目前尚不清楚习近平重新关注军队是出于某个具体案件，还是出于对政治忠诚的更大担忧。火箭军是中国人民解放军最具战略意义的军种之一，负责中国迅速扩张的陆基核威慑力量，还是潜在攻击台湾，及阻止美军进入西太平洋并自由行动至关重要的导弹系统。另据两名了解相关情报的外国高级政府官员称，火箭军领导人因泄露军事情报而受到调查。其中一名官员说："导火索是我们中国以外的人，现在已经对火箭军的结构有了相当详细的了解。这事关泄密"。据美国国防大学中国军事事务研究中心主任菲利普·桑德斯称，军队是习近平上台后的首批目标之一，他对军队进行了大刀阔斧的改革，以便对一支他认为已经开始腐化并脱离共产党控制的部队行使权力。2014年，两名前中央军委副书记徐才厚和郭伯雄因腐败问题面临起诉。桑德斯说："十年过去了，有了新一代领导人，反腐的恐惧感已经消退了一些。有必要定期重新强调反腐，并在政治上重新强调对党忠诚的主题"。 8月1日是中国人民解放军建军节，在这一天之前，官方媒体发表了一系列文章，告诫干部要 "加强军队管理"。亚洲协会政策研究所中国分析中心高级研究员、前美国国防部长办公室中国国家主任莱尔·莫里斯说："他们再次谈论这些问题，是在说对党的绝对忠诚尚未实现。习近平以前所未有的方式巩固了对解放军的控制。但这并不意味着它已经完成。" 过去十年来，习近平将审计署和纪委等军事监察机构直接移至中纪委管辖，以防止与其他部门勾结，重组了军队中的党政机关，并制定了一系列旨在限制指挥官腐败空间的法规。但最重要的是，他将对军队的控制权集中在自己手中，提升了中央军委主席的权力，并将这些变化写入了共产党党章。一些专家说，最新的调查表明这些改革失败了。 "显然，火箭军领导人的选拔存在漏洞。由于这些人是习近平亲自挑选的，他的领导能力受到了损害，"前台湾国防部长、资深解放军分析人士杨念祖（Andrew Yang）说。"他现在必须化解军队中的负面影响"。

加美财经2023-08-01

“爆雷”声不断！关店潮涌现，价值暴跌超70% 美国购物中心陷入“死亡螺旋”

得有多快。房地产研究公司Green Street美国零售和工业研究主管Vince Tibone说，较老的低端购物中心的价值至少比2016年底购物中心估值达到峰值时低50%，在某些情况下甚至低70%以上。穆迪分析公司(Moody's Analytics)的数据显示，如今，未来12个月将有超过140亿美元由这些资产提供担保的贷款到期，陷入困境的购物中心正在拖欠债务。随着贷款利率大幅上升，为这些债务再融资将变得更具挑战性且成本更高。穆迪商业房地产经济分析主管Kevin Fagan说，在所有通过商业抵押贷款支持证券融资的购物中心中，约有五分之一资不抵债，这意味着这些房地产的价值低于它们所支持的贷款。在某些情况下，它们的价值要低得多。Crystal Mall的前业主西蒙地产集团(Simon Property Group)在疫情期间停止支付8100万美元的未偿CMBS债务，并于去年交还了自1999年以来一直拥有的这处房产的钥匙。据穆迪称，这笔贷款被纳入著名投资者卡尔·伊坎(Carl icahn)做空的CMBX 6指数，预计将以7000万美元的亏损清算，约占未偿余额的87%。类似的故事正在全国各地上演。根据数据提供商Trepp的数据，在印第安纳州，Muncie Mall时还被认为可以获得3100万美元的贷款，但在3月份的评估后，它的价值仅为600万美元。这座有52年历史的购物中心九年前的估价为7300万美元，直到2018年才几乎满员。据Trepp称，今年早些时候，新泽西州中部占地110万平方英尺的购物中心伍德布里奇中心(Woodbridge Center)的估价为8600万美元，比2014年疫情前的上一次估价下降了76%。该商场的两笔CMBS贷款已被取消赎回权，未偿余额总计近2.5亿美元。 Trepp的高级董事总经理Manus Clancy说:“我们看到，有几十家购物中心在亏损的情况下被清算，或者价值被削减。” 并不是所有的商场都处在灾难的边缘。较新的、地理位置优越的物业拥有强大的租户名单，为投资者带来了健康的客流量和回报。但Tibone表示，自2016年以来，即使是这些高质量的购物中心的价值也下降了约50%，使购物中心成为同期表现最差的商业房地产行业之一。从2018年开始，百货商店大量关闭，加速了购物中心的衰落。根据Green Street的数据，梅西百货(Macy's)、Bon-Ton、JCPenney和西尔斯(Sears)等大型百货商店在2018年至2020年底期间关闭了约875家店，而2016年和2017年总共关闭了175家店。（图源：Green Street） Tibone说:“这确实加速了这个行业的死亡螺旋。”“你开始失去百货商店，这导致中心的销售和客流量下降。然后更多的租户离开。它开启了这个可怕的循环。” Crystal Mall的死亡螺旋始于2018年，当时主要租户西尔斯宣布破产并宣布关闭计划。三年后，梅西百货关闭了这家店。根据Trepp的数据，2018年至2022年期间，该购物中心的总收入下降了39%，而支出仅下降了10%。最近的一个下午，40岁的Melissa Rodriguez站在购物中心的美食广场外说，“以前所有的商店都开门营业，一切都很美好。” 现在，许多商店都关门了。她最喜欢的商店之一Bed Bath & Beyond在今年早些时候宣布破产后即将关闭。她说，在疫情爆发之前，她经常每周去两次购物中心，但现在一个月只来一次。 “和以前不一样了，”她说。与Bed Bath & Beyond共用一个固定空间的圣诞树商店(Christmas Tree Shops)也在破产后关闭。一旦这些零售商撤离，JCPenney将成为水晶购物中心唯一的主力租户。沃特福德的第一任市政委员Brule说，他希望看到这处房产被重新开发成一个多功能地段。他设想为附近Mystic的游客建一家酒店，为当地消防员、教师以及当地潜艇制造商通用动力电船公司(General Dynamics Electric Boat)的员工提供住房。也许可以修建一座冰球场或保龄球馆，让其成为镇上的青少年聚集的地方。 Brule说:“这就是这一资产的可能用途。” 然而，Crystal Mall的这些梦想不太可能在它的新主人、总部位于纽约的投资公司Namdar Realty Group的领导下实现。Brule说，一位公司高管在介绍电话中告诉Brule，公司不会进行重新开发。 Namdar首席执行官Igal Namdar表示，该公司计划实施“积极的租赁战略，以吸引全国和当地的租户”入驻Crystal Mall。

夏洛特2023-08-01

蔚来汽车股价迎两年多来最长连续上涨

tf)上涨了4%，标准普尔500指数(S&P 500)上涨了10%。据道琼斯通讯社(Dow Jones Newswires)报道，中国国家发展和改革委员会上周末敦促地方政府放宽购车限制，推出刺激新车购买的措施。发改委还要求地方官员在农村推广电动汽车的使用，并升级电动汽车充电基础设施。大约一周前，中国中央政治局对中国经济做出了乐观评估，并承诺进一步支持，但承认经济增长面临阻力。但在蔚来汽车股价上涨的同时，一些中国电动汽车制造商的股价却在回落。小鹏汽车股价早盘重挫13.6%。大众汽车表示，作为一项合作协议的一部分，将向大众汽车投资7亿美元。根据该协议，两家公司将共同为中国市场开发大众品牌的电动汽车。此后股价在前三个交易日飙升52.2%。理想汽车股价周五上涨9.6%，收于自2020年11月24日创纪录的43.96美元收盘以来的最高水平。以及特斯拉公司(Tesla Inc.)的股票。特斯拉第二季度在中国的营收占其总营收的23%，该公司股价微幅上涨0.2%。

金融界2023-08-01

SignalPlus：浅谈深度神经网络

空隙进行传导。这一小空隙，叫做突触 (synapse)，其作用在于传递不同神经元之间的神经冲动，下图突触将神经元 A 和 B 连在一起。试想很多突触连接很多神经元，不就形成了一个神经网络了吗？没错，类比到人工神经网络 (artificial neural network, ANN)，也是由无数的人工神经元组成一起的，比如下左图的浅度神经网络 (shadow neural network) 和下右图的深度神经网络 (deep neural network)。浅度神经网络适用于结构化数据 (structured data)，比如像下图中 excel 里存储的二维数据。深度神经网络适用于等非结构化数据 (unstructured data)，如下图所示的图像、文本、语音类数据。生成式 AI 模型主要是生成非结构化数据，因此了解深度神经网络是必要的。从本篇开始，我们会模型与代码齐飞，因为 Talk is cheap. Show me the code. -- Linus Torvalds 代码都用 TensorFlow 和 Keras 来实现。 1.人工神经网络 1.1 神经网络初见假设下面的神经网络已经被训练好，接着用来预测图片中是否含有笑脸。单元 A 接收图像里的像素信息。单元 B 结合了输入像素，当原始图像中有低级特征 (low-level feature) 比如边缘 (edge) 时，发出最强信号。单元 C 结合了低级特征，当原始图像中有高级特征 (high-level feature) 比如牙齿 (teech) 时，发出最强信号。单元 D 结合了高级特征，当原始图像中的人微笑时，发出最强信号。当给这个神经网络“投喂”足够多的数据，即图像，它会“找到”一组权重 (weights) 使得最终预测结果尽可能准确。找权重这个过程其实就是训练神经网络。对神经网络有个初步认识之后，接下来的任务就是用 Keras 来实现它。 1.2 Keras 训练流程在 Keras 中实现神经网络需要了解三大要点：模型 (models) 层 (layers)，输入 (input) 和输出 (output) 优化器 (optimizer) 和损失函数 (loss) 用上面的关键词来总结 Keras 训练神经网络的流程：将多个层链接在一起组成模型，将输入数据映射为预测值。然后损失函数将这些预测值输出，并与目标进行比较，得到损失值 (用于衡量网络预测值与预期结果的匹配程度)，优化器利用这个损失值来更新网络的权重。到此终于可以展示点代码了，即便是引入工具库。首先从 tensorflow.keras 库中用于搭建神经网络的模块。整个神经网络就是一个模型，大框架的代码都来自 models 模块；模型是由多个层组成，而不同的层的代码都来自 layers 模块；模型的第一层是输入层，负责接入输入，模型的最后一层是输出层，负责提供输出，一头一尾都在 models 模块；模型骨架好了，要使它中看又中用就需要 optimizers 模块来训练它了。 1.3 极简神经网络学过机器学习的同学遇到的第一个模型一定是线性回归，还是单变量的线性回归。给定一组 x 和 y 的数据： x = [-1, 0, 1, 2, 3, 4 ] y = [-3, -1, 1, 3, 5, 7 ] 找出 x 和 y 之间的关系，当 xnew = 10 时，问 ynew 是多少？如下图所示，将 x 和 y 以散点的形式画出来，不难发现下图的红线就是 x 和 y 之间的关系。现在想用 Keras 杀鸡用牛刀的构建一个神经网络来求出这条红线。 1.3.1 创建模型用一层含一个神经元的神经网络即可，代码如下：首先用 models.Sequential() 创建一个空神经网络，然后不断添加层，这里我们添加了 layers.Dense()，叫做稠密层。函数里面的参数 input_shape=[ 1 ] 表示输入数据的维度为 1 ，units= 1 表示输出只有 1 个神经元。可视化如下： 1.3.2 检查模型检查一下模型信息，奇怪的是参数个数 (下图 Param #) 居然是 2 个而不是 1 个。因为从上图来看 y = wx，只应该有 w 一个参数啊。原因是在计算每层参数个数时，每个神经元默认会连接到一个值为 1 的偏置单元 (bias unit)，因此其实上图更准确的样子如下：这样就对了，此时 y = wx+b，有 w 和 b 两个参数了。严格来说，其实 Dense() 函数里还是一个参数叫 activation，它字面意思是激活函数，本质上做的事情是将 wx+b 以非线性的模式转换再赋予给 y。如果定义激活函数为 g，那么 y = g(wx+b)。在 Keras 如果不给 activation 指定值，那么就不需要做任何非线性转换。加上激活函数这个概念，我们给出一个完整的图：我们的目标就是求出上图中的参数，权重 w 和偏置 b。 1.3.3 编译模型模型框架搭好后，接着就是优化问题了，在下面 complie() 函数设定参数，即指定优化方法为随机梯度下降，设定参数，即制定损失函数用均方误差函数。 1.3.4 训练模型训练模型用 fit() 函数，把数据 x 和 y 传进去。值得注意的是参数 epochs= 500 ，epoch 中文是期，即整个训练集被算法遍历的次数，这里就是遍历 500 次模型训练结束。打印出首尾 5 期的信息，不难发现一开始 loss 很大 13.4237 ，到最后 loss 非常小只有 3.8166 e-05 ，说明在训练集里的预测值和真实值几乎一致。模型训练之后可以用 get_weights() 函数来检查参数。返回结果第一个是权重 w，第二个偏置 b，因此该神经网络模型就是 y = 1.9973876 x - 0.99190086 ≈ 2 x - 1 。 1.3.5 评估模型评估模型用 predict() 函数，将新数据 x_new 传进去，得到结果 8.995028 ，非常接近 2*x_new - 1 = 9 。从下图可看出，神经网络从 6 个数据 (深青点) 中“学到”了模型 (红线)，而该模型可用在新数据 (蓝点) 上。总结一下神经网络全流程：创建模型：用 Sequential()，当然还有其他更好的方法，下节讲。检查模型：用 summary() 编译模型：用 compile() 训练模型：用 fit() 评估模型：用 predict() 虽然本例构建了一个极简神经网络，但是五大步骤一个不少，构建复杂的神经网络也需要这五步，区别在于第 1 步创建模型时要拼接很多层，第 5 步要选择更先进的优化器，但万变不离其宗。下两节就来看看两个稍微复杂的神经网络，分别是前反馈神经网络 (feedforward neural network, FNN) 和卷积神经网络 (convoluational neural network, CNN)。 2. 前馈神经网络(FNN) 上节的极简神经网络太无聊了，但是主要是用来明晰 Keras 里神经网络的概念而步骤，下面来看看神经网络做一些有趣的事情，预测图像类别。首先看看使用的数据集 CIFAR-10 (https://www.cs.toronto.edu/~kriz/cifar.html)。该数据集共有 60, 000 张彩色图像，这些图像是 32* 32 ，分为 10 个类，每类 6000 张图。其中 50, 000 张图像用于训练，另外 10, 000 用于测试。下图就是列举了 10 个类，每一类随机展示的 10 张图片：用模块 datasets 里的 load_data() 函数来下载数据并对图像的像素做归一化，原来像素在 0 到 255 之间，现在归一到 0 到 1 之间。对于类别，用模块 utils 里的函数 to_categorical() 函数对类别进行独热编码 (one-hot encoding)。思路就是把整数用只含一个 1 的向量表示，比如类别 5 经过独热编码后变成 [ 0, 0, 0, 0, 1, 0, 0, 0, 0, 0 ]，该向量有 10 个元素，和类别个数一致，向量只有第 5 个元素是 1 (独热?)，其他都是 0 (好冷?)。训练集的前十张图片展示如下： 2.1 创建模型 2.1.1 序列式上节已经见识过序列式 (sequential) 建模了，首先用 models.Sequential() 创建一个空神经网络，然后不断添加层。本例中有一个打平层 layers.Flatten() 和三个稠密层 layers.Dense()。上面代码给出下图所示的模型：有了感官认识，再来研究代码。为什么需要打平层？因为图像有宽，高，色道三个维度，而打平到一维的过程如下图所示。原始图像 ( 32, 32, 3) 输入打平层 (在参数 input_shape 指定图像维度大小)，打平之后变成了一个 32* 32* 3 = 3072 的向量，可以想成现在输入有 3072 个神经元。之后三个稠密层的神经元个数 (参数 units) 分别为 200, 150 和 10 ，前两个 200 和 150 是随便给的或者当成超参数调试出来，但最后一个 10 是和类别的个数一致。用到的激活函数 (参数 activation) 分别是 relu, relu 和 softmax，前两个 relu 几乎是标配，但最后一个 softmax 和任务相关，如果是多分类问题就用 softmax。常用的激活函数 (activation function) 如下图所示： ReLU 将负输入 (x < 0) 转换成 0 ，正输入 (x > 0) 保持不变。LeakyReLU 和 ReLU 非常相似，唯一区别就是对于负输入 (x < 0)，转换的结果也是一个和输入相关的负数 (ax)。 Sigmoid 将实数转换成 0-1 之间的数，而这个数可当成概率，因此 Sigmoid 函数用于二分类问题，它的延伸版 Softmax 函数用于多分类问题。 2.1.2 函数式在实操中，我们更习惯用函数式 (functional) 建模。序列式构建的模型都可以用函数式来完成，反之不行，如果在两者选一，建议只用函数式来构建模型。代码如下：函数式建模只用记住一句话：把层当做函数用。有了这句在心，代码秒看懂。第 1 行，用 Input() 接收图像数据。第 2 行，把 Flatten() 当成函数 f，化简不就是 x = f(input) 第 3 行，把 Dense(units= 200, activation='relu') 当成函数 g，化简不就是 x = g(x) 第 4 行，把 Dense(units= 150, activation='relu') 当成函数 h，化简不就是 x = h(x) 第 5 行，把 Dense(units= 10, activation='softmax') 当成函数 q，化简不就是 output = q(x) 这样一层层函数接着函数把 input 传递到 output，output = q(h(g(f(input))))，最后再用 models.Model 将它俩建立关系。 2.2 检查模型当模型创建之后和使用之前，最好是检查一下神经网络每层的数据形状是否正确，用 summary() 函数就能帮你打印出此类信息。该模型自动被命名 “model”，接着一张表分别描述每层的名称类型 (layer (type))、输出形状 (Output Shape) 和参数个数 (Param #)。我们一层层来看 InputLayer 层被命名成 input_ 1 ，输出形状为 [None, 32, 32, 3 ]，后面三个元素对应着图像宽、高和色道，第一个 None 其实代表的样本数，更严谨的讲是一批 (batch) 里面的样本数。为了代码简洁，这个样本数在建模时通常不需要显性写出来。 Flatten 层被命名成 flatten， 3072 就是 32* 32* 3 打平之后的个数，参数个数为 0 ，因为打平只是重塑数组，不需要任何参数来完成重塑动作。第一个 Dense 层被命名为 dense，输出形状是 200 ，参数 614, 600 = ( 3072 + 1) * 200 ，不要忘了有偏置单元。第二个 Dense 层被命名为 dense_ 1 ，输出形状是 150 ，参数 30, 150 = ( 200 + 1) * 150 ，同样考虑偏置单元。第三个 Dense 层被命名为 dense_ 2 ，输出形状是 10 ，参数 1, 510 = ( 150 + 1) * 10 ，同样考虑偏置单元。最下面还列出总参数量 (Total params) 646, 260 ，可训练参数量 (Trainable params) 646, 260 ，不可训练参数量 (Non-trainable params) 0 。为什么还有参数不需要训练呢？你想想迁移学习，把借过来的网络锁住开始的 n 层，只训练最后 1- 2 层，那前面 n 层的参数可不就不参与训练吗？ 2.3 编译模型当构建模型完毕，接着需要编译模型，需要设定三点：根据要解决的任务来选择损失函数选取理想的优化器选取想监控的指标编译模型用 complie() 函数，代码如下：在 complie() 函数中：对于参数 loss，本例是十分类问题，因此用的损失函数是 categorical_crossentropy，此外：二分类问题：损失函数是 binary_crossentropy 回归问题：损失函数是 mean_squared_error 对于参数 optimizer，大多数情况下，使用 adam 和 rmsprop 优化器及其默认的学习率是稳妥的。在设定该参数时，也可以通过用名称和实例化对象来调用。名称：'sgd' 对象：optimizers.Adam(learning_rate= 0.0005) 对于参数 metrics，也可以通过用名称和实例化对象来调用，在本例中的指标是精度，那么可写成名称：['accuracy'] 对象：[metrics.categorical_accuracy] 注意，指标不会影响模型的训练过程，只是让我们监控模型训练时的表现，损失函数才会影响模型的训练过程。 2.4 训练模型训练模型不是把所有数据一起丢进去，而是按批量丢进去。在介绍训练模型前，需要明晰几个概念：批量大小 (batch size) 指一个批量里的样本个数。下例中总共有 24 个数据，如果每个批里有 6 个数据，那么总局可分成 4 批。期（epoch）指整个训练集被算法遍历一次。当设 epoch 为 20 时，那么要以不同的方式遍历整个训练集 20 次。一次 epoch 要经历 4 次迭代才能遍历整个数据集，即样本总数 / 批量大小 = 24 / 6 次迭代。20 次 epoch 运行过程如下图所示。训练模型用 fit() 函数，代码如下：上图给出训练步骤，不难看出训练集被分成 1563 个堆，每堆含 32 张图 (batch size)。10 个 epoch 之后，损失函数 (categorical cross-entropy) 从 1.8472 降到 1.3696 ，同时准确率 (accuracy) 从 33.41% 提升到 51.39% 。模型在训练集上可以到达 51.39% 的准确率，那么它在没见过的数据集上的表现会如何呢？ 2.5 评估模型用 evaluate() 函数直接看准确率。模型在测试集上的准确率为 49.52% ，比随机预测一个类别的准确率 10% 高多了 (因为有十类)。由于我们用这样一个非常简单的前馈神经网络来预测图片类别，49.52% 的准确率已经算是不错的结果了。用 predict() 函数比对预测和真实类别。测试集里用 10, 000 张图，类别是 10 个，因此 preds 是一个 [ 10000, 10 ] 的数组，每一行都是模型对相应图片预测的 10 个类别的概率，当然所有概率加起来等于 1 。看看测试集里第一张图片的预测结果： y_test 也是一个 [ 10000, 10 ] 的数组，每一行都是相应图片真实的类别，因此 10 个元素有 9 个零和 1 个一。看看测试集里第一张图片的真实类别：不难看出，预测结果 preds[ 0,:] 中类别四的概率最高 0.38579068 ，而真实类别 test[ 0.:] 就是类别四 (第 4 个元素是一)。用 np.argmax 分别从预测结果 preds[ 0,:] 和真实类别 test[ 0.:] 中找到最大值对应的索引，并从 CLASSES 中映射出类别描述。测试集第一张是猫，而模型预测的也是猫，做对了！再试试第四张。测试集第四张是船，但模型预测的是飞机，做错了！可视化：上面的对比方法太麻烦，我们可以随机抽取测试集里的 10 张，打印出每张图片，在图片下还贴上模型预测类别和其真实类别。从上面 10 张小图可看出，模型预测正确了 5 张，正确率 50% ，和之前统计出来的 49.52% 吻合。虽然这只是一个用于预测的判别模型，但当我们创建生成模型时，本节介绍的内容 (比如层、激活函数和优化器等) 仍然适用。下一步来看看如何用卷积神经网络来改进模型。 3. 卷积神经网络（CNN）前馈神经网络 (FNN) 在图像分类问题上表现差的根本原因是它没有考虑到图像的空间结构，比如图像中的相邻像素都很接近，而 FNN 一开始直接将像素打平，破坏图像特有的空间结构。我们需要更适合图像的神经网络，比如卷积神经网络 (CNN)。 3.1 基本概念假设在黑夜你面前出现一张巨幅图片，黑暗中你看不出来是辆车，你只能用手电筒一点一点扫过，把每次扫过看到的东西投影到下一层，以此类推。比如第一层你看到一些横线竖线斜线，第二层组合成一些圆形方形，第三层组合成轮子车门车身，第四层组合成一辆车。这样就能用个手电筒在黑夜里辨别出照片里有辆车了。上例其实就是一个卷积神经网络识别图像的过程了，首先明晰几个定义：滤波器 (filter)：在输入数据的宽度和高度上滑动，与输入数据进行卷积，就像上例中的手电筒。卷积 (convolution)：在这里的定义就是把所有“滤波器的像素”乘以“滤波器扫过图片的像素”再加总。步长 (stride)：遍历图像时滤波器的步长，默认值为 1 ，既滤波器每次移动一个像素。填充 (padding)：有时候会将输入数据用 0 在边缘进行填充，可以控制输出数据的尺寸 (最常用的是保持输出数据的尺寸与输入数据一致)。卷积 (Convolution) 卷积神经网络的最大特点当然是卷积操作了。回顾上面的定义，将“滤波器的像素”乘以“滤波器扫过图片的像素”再加总，看下面两个例子，假设滤波器的大小是 3* 3 。第一张图片和滤波器的卷积为 0.6* 1 + 0.4* 1 + 0.6* 1 + 0.1* 0 + (-0.2)* 0 + (-0.3)* 0 + (-0.5)*(-1) + (-0.4)*(-1) + (-0.3)*(-1) = 2.8 。第二张图片和滤波器的卷积为 (-0.7)* 1 + 0.6* 1 + 0.2* 1 + 0.1* 0 + 0.5* 0 + (-0.3)* 0 + (-0.3)*(-1) + (-0.4)*(-1) + 0.5*(-1) = -0.1 。当卷积值越正，说明滤波器和图片越相符；当卷积值越负，说明滤波器和图片越不符。上例中第一张图片和滤波器的卷积值为 2.8 ，两者相符；第二张图片和滤波器的卷积值为 -0.1 ，两者不符。滤波器 (Filter) 滤波器的作用就是滤波，即过滤掉一些信息，等价于提取保留下的信息。下面代码创建两个 3* 3 大小的滤波器，filter 1 能提取图像中的水平线，filter 2 能提取图像中的竖直线。注意这里 1 代表黑， 0 代表灰，-1 代表白色。下面看一个如何用这两个滤波器来提取信息的，原始图片如下：不难发现，filter 1 的确从图像中提取到水平的边缘信息，比如杯子口的上下沿。不难发现，filter 2 的确从图像中提取到竖直边缘的信息，比如杯子口的左右沿。有了滤波器的加入，我们可以创建卷积层 (convoluational layer) 了。卷积层本质上就是一组滤波器，下例中个数是 2 个，而滤波器中的元素值称为权重 (weights)，是通过训练 CNN 学到的。在 Keras 中用 layers.Con v 2 D() 来创建卷积层。这里黑白相片是 64* 64* 1 (色道只有 1 个)，而滤波器有两个 (参数 filters 设置为 2)，滤波器大小是 3* 3 (参数 kernel_size 设置为 ( 3, 3))。还有两个参数 strides 和 padding 是什么东西？步长 (Stride) 步长是滤波器遍历图像时移动的像素个数，默认值为 1 ，既滤波器每次移动一个像素。当步长为 2 时，不难想象输出图像大小只有输入图像大小的一半。填充 (Padding) 顾名思义，填充就是在图像四周添加元素。当 padding = "same" 时，配着 strides = 1 ，可以保证输出图像和输入图像的大小一样。下图输入图像大小是 5* 5 (蓝色图片)，填充之后图像大小变成 7* 7 (带白色的图片)，滤波器大小是 3* 3 (灰色)，输出图像大小还保持 5* 5 (绿色图片)。弄清楚组成卷积层的元素之后，我们可以像上节拼接稠密层一样来拼接卷积层。 3.2 拼接卷积层先看一段代码：上段代码对应着下图的样子。上面每个卷积层输出的大小让人眼花缭乱，如果用 nI 代表输入图像的大小，f 代表滤波器的大小，s 代表步长，p 代表填充层数，nO 代表输入图像的大小，那么有以下关系：用这个公式来验证第一个和第二个卷积层的输出的宽度和高度：最重要的东西来了，卷积层的输出色道等于滤波器个数 (即代码里面的参数 filters)。一个直观理解是每个滤波器并行在“扫描”图片做卷积，那么最终产出一定有一个维度大小是滤波器的个数。检查一下模型。该模型自动被命名 “model”，接着一张表分别描述每层的名称类型 (layer (type))、输出形状 (Output Shape) 和参数个数 (Param #)。我们一层层来看 InputLayer 层被命名成 input_ 1 ，输出形状为 [None, 32, 32, 3 ]，后面三个元素对应着图像宽、高和色道，第一个 None 其实代表的样本数，更严谨的讲是一批 (batch) 里面的样本数。为了代码简洁，这个样本数在建模时通常不需要显性写出来。第一个 Con v 2 D 层被命名为 con v 2 d，输出形状是 [None, 16, 16, 10 ]，参数 490 = ( 4* 4* 3 + 1) * 10 ，首先不要忘了有偏置单元，其次 4* 4 是滤波器的大小， 3 是输入的色道个数，因此我们需要 4* 4* 3 个权重来描述每个滤波器，一共有 10 个。第二个 Con v 2 D 层被命名为 con v 2 d_ 1 ，输出形状是 [None, 8, 8, 20 ]，参数 1, 820 = ( 3* 3* 10 + 1) * 20 ，首先同样考虑偏置单元，其次 3* 3 是滤波器的大小， 10 是输入的色道个数，因此我们需要 3* 3* 10 个权重来描述这个滤波器，一共有 20 个。 Flatten 层被命名成 flatten， 1, 280 就是 8* 8* 20 打平之后的个数，参数个数为 0 ，因为打平只是重塑数组，不需要任何参数来完成重塑动作。最后一个 Dense 层被命名为 dense，输出形状是 10 ，参数 12, 810 = ( 1280 + 1) * 10 ，同样考虑偏置单元。最下面还列出总参数量 (Total params) 15, 120 ，可训练参数量 (Trainable params) 15, 120 ，不可训练参数量 (Non-trainable params) 0 。到此一个 CNN 已经基本建成，我们再添加两个技巧使得 CNN 效果更好：批量归一 (batch normalization) 和随机失活 (dropout)。 3.3 批量归一在训练 CNN 时，模型成功关键时要确保权重保持在一定的范围内，要不然会出现梯度爆炸 (exploding gradient) 的情况。批量归一可以解决此问题，它在每层都会按批 (mini-batch) 计算数据的均值 (mean) 和标准差 (standard deviation)，然后在每个数据上减去均值除以标准差。为了“还原”数据，我们需要“学习”两个参数，放缩参数 γ 和平移参数 β。批量归一的算法如下： Keras 中用 BatchNormalization() 来实现批量归一层。批量归一层一般放在稠密层或卷积层之后。函数中参数 momentum 用于计算移动均值和移动标准差，这个是为了在预测的时候使用。因为预测通常在一个数据上，这时无法计算均值和标准差，那么只能利用在训练时计算的移动均值和移动标准差。 3.4 随机失活随机失活的灵感来自考试。通常考试前，学生会做往年的卷子来学习知识点。有的学生死记硬背来解题，这样到了实际考试中就会表现不好，因为他们没有真正理解知识点。好的学生会通过卷子来理解通用的知识点，这样出现新题也能正确解答。同理，为了让神经网络不要“死记硬背”，我们可以随机让某些神经元失活，即使得它们的输出为 0 ，如下图所示。在预测过程中，神经元不失活，因此用完整的神经网络做预测。 Keras 中用 Dropout() 来实现失活层。失活层一般放在稠密层之后。函数中参数 rate 用于设定失活神经元的比率，比如本例中 25% 的神经元失活了。 3.5 完整模型现在我们可以在之前的 CNN 加上批量归一层和失活层来完善模型了。再看上面的代码是不是很好理解了，该 CNN 中有四个卷积层，每个后面接一个批量归一层和一个 LeakyReLu 层。注意 Keras 里时万物皆可作为层，甚至像激活函数也可以用层的形式实现。接着用一个打平层将数据打平，接一个稠密层，个批量归一层，一个 LeakyReLu 层，一个失活层和一个稠密层，最后用 softmax 以概率的形式输出。检查一下这个完善后的 CNN 模型。我们发现激活层都不包含参数，因为就是一个转换；打平层和失活层也不包含参数，这个也很好理解；对于卷积层和稠密层的参数量，之前已经解释过算法；对于批量归一层，对于每个 channel 需要学习放缩参数 γ 和平移参数 β，以及移动均值和移动标准差，这样包含参数就等于 channel 个数* 4 。 CNN 里面有 5 个批量归一层，每层里面移动均值和移动标准差只用计算而不需要训练，因此非训练参数为 32* 2 + 32* 2 + 64* 2 + 64* 2 + 128* 2 = 640 个。 3.6 训练评估万事俱备，只欠训练。这一次我们增加了参数 validation_data，用于监控模型在训练时是否出现过拟合，而过拟合发生在训练误差 (loss) 一直在减小，但是验证误差 (val_loss) 却在增加。从下图看还没出现这样的问题。对比现在的卷积神经网络 (CNN) 和之前的前馈神经网络 (FNN)，现有模型在训练集的准确率从之前 51.39% 提升到 76.99% ，在训练集的准确率也从之前 49.52% 提升到 71.70% ，模型性能大大提高。神奇的是，CNN 的参数 ( 592, 554) 其实比 FNN 的参数 ( 646, 260) 少很多，但模型性能却提高了不少，而这种提升只需更改模型架构以包括卷积层、批量归一层和失活层即可实现。虽然 CNN 比 FNN 的参数少，但是层数确多很多，这就是为什么深度神经网络的优势，因为网络的中间层捕获了我们最感兴趣的高级特征 (high-level features)。从上面 10 张小图可看出，模型预测正确了 6 张，正确率 60% ，虽然之前统计出来的 71.70% 低，但这个是从 10000 张测试集中采样出来的 10 张，因此看到模型正确预判了 6, 7, 8 张都是正常的。总结本篇介绍了开始构建深度生成模型所需的核心深度学习概念。使用 Keras 构建前馈神经网络 (FNN)，并训练模型来预测 CIFAR-10 数据集中给定图像的类别。然后，我们通过引入卷积层、批量归一层和失活层来改进此架构，以创建卷积神经网络 (CNN)。深度神经网络在设计上是完全灵活的，尽量有最佳实践，但我们可随意尝试不同的层以及其出现的顺序，用 Keras 实现就像拼乐高积木一样丝滑，你的神经网络的设计仅受你自己的想象力的限制。下篇我们将使用这些模块来设计一个可以生成图像的网络。生成式 AI 的好戏刚刚开始！来源：金色财经

金色财经2023-07-31

24小时热点