FX168财经网_全球视野外汇黄金加密货币NFT资讯网

对冲基金回报率是标普两倍，持有最多的是这些公司

atforms、Alphabet 和 Nvidia 上季度也深受对冲基金的喜爱。在利润增长两倍并宣布首次分红后，Meta 今年已上涨 30%，而 2023 年则大涨 194%。除科技股外，石油和天然气公司Pioneer Natural Resources、信用卡公司 Visa 和叫车巨头Uber也榜上有名。

金融界02-23 01:00

1989年来未曾见过的历史高点！日本股市“强牛”背后有哪些危与机

打破了此前的纪录。这一飞跃是由英伟达(Nvidia)井喷销售预测后，科技股和芯片设备生产商的上涨所推动。这次史诗般的卷土重来，比华尔街从引发大萧条的崩盘中恢复过来的时间还要长，并标志着日本股市的重生。同时表明，市场押注日本终于摆脱了通货紧缩，并走上了可持续增长的道路。此前日本股市上涨如此之快，以至于只有一条路可走：下跌。里昂证券日本公司策略师Nicholas Smith表示：“1989年很可能是人类历史上最大的泡沫。” 如今，尽管一些人仍担心此次反弹可能是虚假的曙光，但大多数分析师和投资者都认为股市的基础更加坚实。加之对股东更加友好的企业文化已经形成，日本的稳定收益似乎对因中国等市场动荡而损失惨重的资金有吸引力。反弹的关键催化剂之一是通胀迹象，以及日本央行预计在今年晚些时候退出负利率，正在鼓励企业将大量现金用于扩大和改善业务。不仅如此，著名投资者沃伦·巴菲特(Warren Buffett)增持了日本最大公司的持股，这一背书进一步增加了日本股票的吸引力。（来源：彭博社）自2024年初以来，日经225指数已飙升逾16%，超过大多数其他主要市场。 #2024投资策略# 然而，市场仍有理由对反弹持谨慎态度，如果情绪发生转变，资金可能会迅速回流中国，并担心日经指数已成为动力股，尽管海外投资者大多已将这些抛在一边。占更广泛的Topix Prime股票指数交易量的近70%，而国内买家大多持观望态度。继一月份扩大特别免税账户后，机构投资者削减了投资组合，日本个人投资者纷纷涌向美国和其他海外市场。与此同时，全球买家吸收了抛售，其持股比例从1989年的不到5%上升至30%。（来源：彭博社）摩根士丹利首席亚洲策略师Jonathan Garner表示：“全球投资者花了很长时间才接受日本已经发生了变化。” Garner认为，现在，在企业盈利持续增长和盈利能力改善之后，海外越来越多的人认为“日本正处于长期牛市”。摩根士丹利是最早预测市场复苏的主要券商之一。过去三十多年巨变的另一个迹象是，1989年，日本公司在全球市值前50家公司中占据了32家。如今，只有丰田汽车公司这一日本公司跻身全球50强之列。早在20世纪80年代末，由于资产价格膨胀，日本银行才是市场上真正的重量级人物。现在市场更加平衡和多元化，主要公司包括索尼集团、休闲服装连锁运营商迅销公司（优衣库的母公司），以及在庞大的半导体供应链中占据关键地位的公司，例如东京电子，受益于中国订单的激增。即使在今年的反弹之后，许多日本股票仍处于低迷水平，37%的日经指数成员股价低于账面价值。从理论上讲，这意味着投资者可以通过出售公司的所有资产而不是保持公司持续经营来赚更多的钱。这相当于对管理层投了不信任票，但它也表明，如果业务运营得当，还有上行潜力。标准普尔500指数中只有3%的股票交易价格低于账面价值；至于欧洲斯托克600指数，只有五分之一属于这一类别。而日本现在的低估值与1989年形成鲜明对比，当时资产价格处于另一个极端。所有这些意味着，一些基金经理现在看到日经225指数有可能大幅上升。 Comgest Asset Management 投资组合经理 Richard Kaye 表示：“我认为很容易达到42,000点左右。回到之前的历史记录将“对日本投资者产生巨大的心理影响”。

marsh 2评论02-22 19:36

全场起立欢呼！这一股市似乎比1989辉煌时代更耀眼英伟达的AI派对远未结束分析师示警存在“AI泡沫”

国市场的替代品。另一方面，尽管英伟达(Nvidia)发布超乎市场预期的出色财报后，进一步刺激人工智能(AI)达到“引爆点”，但分析师警告称，#科技#行业存在泡沫。日经225指数开盘上升至39,156.97点，高于1989年最后一个交易日触及的盘中历史最高点38,957.44点，相比当日收于38,915.87点，周四(22日)收高2.19%，至39,098.68点。（来源：路透社）对于一个主要市场来说，它花了34年才重新站稳脚跟，相比华尔街弥补1929年崩盘和大萧条损失所需的时间还要长十年。东京Au Kabucom证券公司的高级市场分析师 Tsutomu Yamada表示：“对于我们交易者来说，这标志着一个新时代的到来，” “感觉股市在告诉我们，我们终于摆脱了通货紧缩，一个新世界已经打开。” 午后交易开盘后，日经225指数便突破1989年高点，野村证券东京交易大厅的约20名交易员立即站了起来。一些人鼓掌，另一些人则发出无声的欢呼声，并发出一声“bravo”。继2023年飙升28% 后，日本股市今年上升了近17%。当时它是表现最好的亚洲主要交易所。与美国股市相比，以科技股为主的纳斯达克指数去年飙升了43%，2024年迄今上升了6%。日本股市强势反弹克服了日本经济衰退、欧洲和中东战争、全球通胀冲击和全球利率上升的影响。贸易敞口有助于使其免受国内需求恶化的影响，而疲软的货币则提高了出口商的收入。这一里程碑也最终为数十年来，令全球投资者望而却步的低迷表现划下界限。 Comgest驻日本投资组合经理Richard Kaye表示：“日经指数回归对日本人的心理影响怎么强调都不为过，因为这一代人从未见过这种水平。” 他说：“市场的吸引力可能会吸引意想不到的大量国内流动性。” 日本的公司治理变化正在推动股票回购和解除交叉持股，而外国人现在正在通过沃伦·巴菲特(Warren Buffett) 2020年的大规模投资等方式刺激股市上涨，使有吸引力的估值成为人们关注的焦点。值得注意的是，强劲的财报季和日元贬值，以及日本央行将在一段时间内坚持超宽松货币政策的预期，都在2024年初给市场带来了压力。美国银行二月份的亚洲基金经理调查显示“对日本的乐观情绪并未受到影响”。近三分之一的参与者预计未来12个月，日本股市将获得两位数的回报。美国银行分析师表示，“到目前为止，这是该地区最受欢迎的市场”，基金经理倾向于半导体和银行股。警惕“AI泡沫” 近日，市值1.7万亿美元的AI芯片巨头英伟达在发布出色的财报后，其市值飙升超过1000亿美元，出乎市场预期，盘后一度大涨10%。英伟达已成为全球市值最高的公司之一，并于周三(21日)收于674.72美元，今年以来累计上升36%。乘着AI浪潮的英伟达，面临着一个令人羡慕的困境，即对其AI芯片的需求猛增。首席执行官黄仁勋在谈到这一激增时向分析师保证，英伟达致力于公平、高效的芯片分配。（来源：路透社）然而，BCA Research的Dhaval Joshi警告科技行业存在AI泡沫，并将这种情况比作互联网泡沫破灭。尽管英伟达在AI和数据中心芯片需求激增的推动下取得了成功，但Joshi警告称，严重依赖少数巨头的科技行业的爆炸性增长可能无法持续，且可能导致市场大幅调整。

IreneLim02-22 18:52

FXTM富拓： 8个指数创历史，标普涨势难阻，目标5500点不是梦

有望续创新。昨晚英伟达 (MT5: NVIDIA)公布的财报超越了市场预期，新的下季度营收目标也比市场原本预期的更高，英伟达盘后更大涨10%，有望再创历史新高，而同业如ARM、AMD等同板块股价都受到提振，预计有得提振标普500再进一步往上。目前瑞银给出的目标价为5400点、高盛为5100点。 *图片来源: 富拓FXTM MT4平台标普500 日线图 (US500, D1) 了解更多信息，请访问：FXTM 免责声明：本书面/视频材料为个人观点和想法，不应被理解为包含任何类型的投资建议和/或任何交易的邀请。它并不意味着有义务购买投资服务，也不保证或预测未来的业绩。FXTM富拓及其网络联盟商、代理机构、董事、管理人士或职员不保证任何信息或数据的准确性、有效性、时效性或完整性，对基于以上信息进行投资造成的损失不承担任何责任。风险警示：差价合约(CFD)是复杂的交易品种，由于杠杆原因，存在快速亏损的高风险。应该仔细考虑您是否理解了CFD的原理以及您是否能够承担亏损的高风险。编者按: FXTM富拓品牌：ForexTime Limited 受CySEC 监管(执照号：185/12)，获得南非FSCA许可， FSP编号46614。Forextime UK Limited获得FCA授权和监管 (执照号：777911)。Exinity Limited受毛里求斯金融服务委员会监管，执照号C113012295。本文作者: FXTM富拓首席中文市场分析师杨傲正 2024-02-22

FXTM 富拓02-22 17:16

AI x Crypto 报告：案例研究、发展瓶颈、技术挑战

运行规模。GPU价格昂贵，实际上只有 Nvidia一家公司生产。这些开源项目缺乏资金意味着很难为AI模型提供足够的计算能力，从而与OpenAI的ChatGPT竞争。即使是在软件工程方面拥有高质量标准的Linux，也受限于其程序的计算规模。它们缺乏随意访问超级计算机的能力，因此很难与拥有这种特权的OpenAI竞争。人工智能模型需要数据来训练。尽管Meta和OpenAI等大型科技公司标榜自己是"开放"或"开源"的，但它们用于训练人工智能的数据都是私有的，只对自己开放。它们只公布完成后的人工智能模型，如ChatGPT。这些数据来自Meta 和OpenAI的海量用户群，质量和数量都很高。开源的人工智能项目劣势在于无法获得大量的高质量数据，因此无法使用最好、最多的数据来训练人工智能模型，从而无法与Meta或OpenAI 竞争。因此无法开发出能与 OpenAI 或 Meta 的产品相抗衡的产品。这些开源的人工智能技术和项目需要的是克服这三大问题的方法，这三大问题阻碍了它们挑战大型科技公司对人工智能行业控制的潜力。我们认为，加密技术可以解决它们的这些问题。 3.4.5 加密领域 (crypto) 的人工智能开源解决方案我们相信，加密技术可以解决上一节概述的所有三个问题。本节将专门针对每个具体问题提出解决方案。首先，加密货币可以通过在人工智能领域的开源项目中创建收入/奖励系统来解决人才问题。加密货币可以通过为项目贡献提供内在激励来帮助这些项目运转。这方面的一个例子是AGI Guild，这是一个由意识形态开源开发者组成的团体，他们创造了一个许可证，可以奖励为开源项目做出贡献的开发者。许可证由AGI代币管理。超过100万美元规模的公司必须获得AGI代币才能使用许可证。然后代币将分配给开源人工智能项目的贡献者。这既是对开发者的金钱奖励，也赋予了代币本身的价值，从而鼓励更多的贡献。此外，还有投票系统供成员集体决定项目的发展方向，在开源人工智能领域鼓励任人唯贤和民主，同时获得从开源人工智能中赚钱的能力。由于现在有了金钱上的激励，未来和现在的人才将不需要把自己的道路视为要么安全地选择Meta，要么在风险投资上孤注一掷，而是看到了第三条道路，即你可以在开发人工智能的过程中赚钱，而不必受到大型科技公司的专有限制。人才将被开源人工智能项目所吸引，将其视为对抗大型科技公司的可行竞争对手。其次，加密技术可降低访问服务器门槛来解决计算问题。过去，云厂商可能会拒绝开发人员使用其服务器来开发产品。有了加密技术，现在变得无需许可，这意味着任何人都可以获得他们的项目所需的计算能力。这意味着，使用开源人工智能和加密技术的开发人员现在可以根据自己的需要自由使用尽可能多的计算资源。加密技术还为开发者和社区提供了与云厂商讨价还价的能力。在过去很短的时间内，云厂商可以提高使用价格，因为开源人工智能开发者需要他们的服务器来运行他们的程序。现在，有了加密技术，我们可以将这一系统去中心化，开始挑战云厂商的价格，为更多想要开发开源人工智能的人敞开大门。现在，社区有办法也有能力向AWS等云计算公司提出挑战，要求降低价格，从而提高产品质量和工作质量。最后，加密技术可以解决数据问题，帮助那些为开源人工智能项目生成数据的用户提供奖励。这方面的一个例子是Grass，它有一个浏览器插件，可以在用户浏览互联网时生成代币。这种奖励制度意味着，随着时间的推移，随着加密应用提供更多的数据，开源的人工智能项目就能够获得越来越多的数据。这是以去中心化的方式实现的，这意味着我们不会陷入监管机构或大型科技公司发现这一问题并采取禁止IP地址等措施加以阻止的问题。这种方式无法有效阻止，因为有很多人都在使用这种插件，封禁一个人对其他人获取这些数据几乎没有影响。这样一来，这些开源项目开发者就能获得和大公司一样好的数据。这无疑会提高人工智能模型的训练水平。即使是需要保密的数据，加密技术也能充分保护隐私，而且只要数据所属用户同意，加密技术也能对其进行获取，从而更好地使用人工智能模型。总之，我们发现加密技术能够在爬取数据时满足数据敏感性要求，同时通过向开源人工智能程序更好地提供训练人工智能模型所需的数据。我们所追求的理想是，开源人工智能系统打败基于闭源软件的私有系统。机器学习如何工作？在深入探讨人工智能（AI）与加密货币的交集之前，首先要单独介绍人工智能领域的一些概念。由于本报告是为加密货币领域的读者撰写的，读者并非都对人工智能和机器学习概念有深刻理解。而理解相关概念至关重要，这样读者才能评估人工智能和加密货币交叉领域的哪些想法具有实质意义，并准确评估项目的技术风险。本节重点介绍人工智能的概念；此外，本节也重点介绍了人工智能与加密货币之间的关系。通过本章的提示，我们可以了解人工智能概念与加密领域的关系。本节所涉主题概述：机器学习（machine learing, ML）是人工智能的一个分支，在这个分支中，无需明确编程，机器就能通过数据做出决策。 ML流程分为三个步骤：数据、训练和推理。训练模型的计算成本非常高，而推理则相对便宜。学习主要有三种类型：监督学习、无监督学习和强化学习。监督的学习是指从范例（由教师提供）中学习。教师可以向模型展示狗的图片，并告诉它这就是狗。然后，模型就能学会将狗与其他动物区分开来。然而，许多流行的模型，如LLMs（如GPT-4和LLaMa），都是通过无监督学习来训练的。在这种学习模式中，教师不会提供任何指导或示例。相反，模型通过学习来发现数据中的模式。强化学习（试错学习）主要用于连续决策任务，如机器人控制和游戏（如国际象棋或围棋）。 1.1 人工智能和机器学习 1956 年，一些当时最聪明的人聚集在一起参加了一个研讨会。他们的目标是提出智力的一般原则。他们指出： "学习的每一个方面或智能的任何其他特征都可以被如此精确地描述出来，以至于可以制造一台机器来模拟它。" 在人工智能发展的早期，研究人员充满了乐观主义。从某种意义上说，他们的目标是人工通用智能（AGI），雄心勃勃。我们现在知道，这些研究人员并没有设法创造出具有通用智能的人工智能代理。70 年代和 80 年代的人工智能研究人员也是如此。在那个时期，人工智能研究人员试图开发 "基于知识的系统"。基于知识的系统的关键理念是，我们可以为机器编写非常精确的规则。从本质上讲，我们从专家那里提取非常具体和精确的领域知识，并以规则的形式写下来供机器使用。然后，机器就可以利用这些规则进行推理并做出正确的决定。例如，我们可以尝试从马格努斯·卡尔森（Magnus Carlson）那里提炼出下棋的所有原则，然后构建一个人工智能来下棋。然而，要做到这一点非常困难，即使有可能，也需要大量的人工来创建这些规则。试想一下，如何将识别狗的规则写入机器？机器如何才能从拥有像素到知道狗是什么？人工智能的最新进展来自于一个被称为 "机器学习 "的分支。在这种模式下，我们不是为机器编写精确的规则，而是使用数据，让机器从中学习。使用机器学习的现代人工智能工具随处可见，例如 GPT-4、iPhone 上的 FaceID、游戏机器人、Gmail 垃圾邮件过滤器、医疗诊断模型、自动驾驶汽车......等等。 1.2 机器学习管道（pipeline）机器学习管道可分为三个主要步骤。有了数据，我们要训练模型，然后有了模型，我们就可以使用它。使用模型称为推理。因此，这三个步骤分别是数据、训练和推理。高度概括来说，数据步骤包括查找相关数据并对其进行预处理。例如，如果我们要建立一个对狗进行分类的模型，我们需要找到狗和其他动物的图片，这样模型才能知道什么是狗，什么不是狗。然后，我们需要对数据进行处理，并确保数据格式正确，以便模型能够正确学习。例如，我们可能要求图片大小一致。第二步是训练，我们利用数据来学习模型应该是什么样的。模型内部的方程是什么？神经网络的权重是多少？参数是什么？正在进行的计算是什么？如果模型不错，我们就可以测试它的性能，然后就可以使用它了。这就到了第三步。第三步称为推理，即我们只是使用神经网络。例如，给神经网络一个输入，然后问一个问题：可以通过推理产生输出吗？图 28：机器学习管道的三个主要步骤是数据、训练和推理 1.2.1 数据现在，让我们深入了解一下每个步骤。第一：数据。广义上讲，这意味着我们必须收集数据并对其进行预处理。让我们来看一个例子。如果我们想建立一个供皮肤科医生（专门治疗皮肤病的医生）使用的模型。我们首先要收集许多人脸的数据。然后，我们请专业皮肤科医生来评估是否存在皮肤病。现在可能会出现许多挑战。首先，如果我们拥有的所有数据都包括人脸，那么模型将很难识别身体其他部位的任何皮肤状况。其次，数据可能存在偏差。例如，大部分数据可能是一种肤色或色调的图片。第三，皮肤科医生可能会犯错，这意味着我们会得到错误的数据。第四，我们获得的数据可能会侵犯隐私。经济激励措施有助于收集高质量的数据，而隐私保护技术可以解决用户在上述例子等敏感环境中的顾虑。我们将在第2章中介绍更深层次的数据挑战。不过，这可以让你了解到，收集好的数据并对其进行预处理是相当具有挑战性的。图 29：两个流行数据集的示意图。MNIST包含手写数字，而ImageNet包含数百万张不同类别的注释图像在机器学习研究中，有许多著名的数据集。常用的有： MNIST数据集说明：包含70,000个灰度图像格式的手写数字（0-9）使用案例：主要用于计算机视觉中的手写数字识别技术。它是一个对初学者友好的数据集，通常用于教育领域。 ImageNet 说明：一个包含1,400多万张图片的大型数据库，标注有20,000多个类别的标签。使用案例：用于对象检测和图像分类算法的训练和基准测试。一年一度的ImageNet大规模视觉识别挑战赛（ILSVRC）一直是推动计算机视觉和深度学习技术发展的重要活动。 IMDb评论说明：包含来自 IMDb的50,000篇电影评论，分为两组：训练和测试。每组包含相同数量的正面和负面评论。使用案例：广泛应用于自然语言处理（NLP）中的情感分析任务。它有助于开发能理解文本中表达的情感（正面/负面）并对其进行分类的模型。获取大型、高质量的数据集对于训练良好的模型极为重要。然而，这可能具有挑战性，尤其是对于较小的组织或个人搜索者而言。由于数据非常宝贵，大型机构通常不会共享数据，因为数据提供了竞争优势。在透明度和开放性与盈利能力之间取得平衡的解决方案可以提高开放数据集的质量。 1.2.2 训练管道的第二步是训练模型。那么，训练模型究竟意味着什么呢？首先，我们来看一个例子。一个机器学习模型（训练完成后）通常只有两个文件。例如，LLaMa 2（一个大型语言模型，类似于 GPT-4）就是两个文件：参数，一个 140GB 的文件，其中包括数字。 run.c ，和一个简单的文件（约 500 行代码）。第一个文件包含 LLaMa 2 模型的所有参数，run.c 包含如何进行推理（使用模型）的说明。这些模型都是神经网络。图 30：神经网络的基本图示在像上面这样的神经网络中，每个节点都有一堆数字。这些数字被称为参数，并存储在文件（惊喜！）参数中。获取这些参数的过程称为训练。下面是一个高度概括的过程。想象一下训练一个识别数字（从0到9）的模型。我们首先收集数据（在这种情况下，我们可以使用MNIST数据集）。然后开始训练模型。我们取第一个数据点，即 "5"。然后，我们将图像（"5"）传递给网络。网络会对输入图像进行数学运算。网络将输出一个0到9之间的数字。该输出是当前网络对该图像的预测。现在有两种情况。网络要么是对的（它预测了 "5"），要么是错的（任何其他数字）。如果它预测的数字正确，我们就不用做什么。如果预测的数字不正确，我们将返回网络，对所有参数进行小幅修改。在做了这些小改动后，我们再试一次。从技术上讲，网络现在有了新的参数，因此预测结果也会不同。我们对所有数据点一直这样做，直到网络基本正确为止。这一过程本质上是顺序性的。我们首先通过整个网络传递一个数据点，看看预测结果如何，然后更新模型的权重。训练过程可以更加全面。首先，我们必须选择模型架构。我们应该选择哪种类型的神经网络？并不是所有的机器学习模型都是神经网络。其次，在确定哪种架构最适合我们的问题，或者至少是我们认为最适合的架构之后，我们需要确定训练流程。例如，我们将以何种顺序将数据传递给网络？第三，我们需要硬件设置。我们要使用什么样的硬件（CPU、GPU、TPU）？我们又该如何对其进行训练？最后，在训练模型的同时，我们要验证这个模型是否真的很好。我们希望在训练结束时测试这个模型是否能提供我们想要的输出结果。剧透（其实也不算剧透），训练模型的计算成本非常高。任何微小的低效都会带来巨大的成本。正如我们稍后将看到的，特别是对于像LLM这样的大型模型，低效的训练可能会让你付出数百万美元的代价。在第2部分中，我们将再次详细讨论训练模型所面临的挑战。 1.2.3 推理机器学习管道的第三步是推理，也就是使用模型。当我使用ChatGPT并得到回应时，模型正在执行推理。如果我用脸部解锁iPhone，脸部ID模型会识别我的脸并打开手机。该模型执行了推理。数据已经有了，模型已经训练好了，现在模型训练好了，我们就可以使用它，使用它就是推理。严格来说，推理与网络在训练阶段做出的预测是一回事。回想一下，一个数据点通过网络，然后进行预测。然后根据预测的质量更新模型参数。推理的工作原理与此相同。因此，与训练相比，推理的计算成本非常低。训练LLaMa可能要花费数千万美元，但推理一次只需几分之一。与训练相比，计算成本更低。训练 LLaMa可能要花费数千万美元，但进行一次推理只需几分之一。与训练相比，进行推理的成本很低，而且更容易并行化，这可能为小型闲置计算（如笔记本电脑和手机）提供了机会。推理过程有几个步骤。首先，在实际生产中使用之前，我们需要对其进行测试。我们对训练阶段未见的数据进行推理，以验证模型的质量。其次，当我们部署一个模型时，会有一些硬件和软件要求。例如，如果我的iPhone上有人脸识别模型，那么该模型就可以放在苹果公司的服务器上。然而，这样做非常不方便，因为现在每次我想解锁手机时，都必须访问互联网并向苹果服务器发送请求，然后在该模型上进行推理。然而，如果想在任意时刻使用这种技术，进行人脸识别的模型就必须存在于你的手机上，这意味着该模型必须与你iPhone上的硬件类型兼容。最后，在实践中，我们还必须维护这一模式。我们必须不断进行调整。我们训练和使用的模型并不总是完美的。硬件要求和软件要求也在不断变化。 1.2.4 机器学习管道是迭代式的到目前为止，我把这个管道设计成了依次进行的三个步骤。你获取数据，处理数据，清理数据，一切都很顺利，然后你训练模型，模型训练完成后，你进行推理。这就是机器学习在实践中的美好图景。实际上，机器学习需要进行大量的迭代。因此，它不是一个链条，而是如下图所示的几个循环。图 31：机器学习流水线可以形象地理解为由数据、训练和推理三个步骤组成的链条。不过，在实践中，这一过程的迭代性更强，如蓝色箭头所示。为了理解这一点，我们可以举几个例子。例如，我们可能会收集一个模型的数据，然后尝试对其进行训练。在训练的过程中，我们会发现我们需要的数据量应该更多。这意味着我们必须暂停训练，回到数据步骤并获取更多数据。我们可能需要重新处理数据，或者进行某种形式的数据扩增。数据扩增就像是给数据改头换面，从老一套中创造出新的面貌。想象一下，你有一本相册，你想让它变得更有趣。你把每张照片都复制了几份，但在每份副本中，你都做了一些小改动--也许你旋转了一张照片，放大了另一张照片，或者改变了另一张照片的光线。现在，你的相册有了更多的变化，但实际上你并没有拍摄任何新照片。例如，如果你正在训练一个模特识别狗，你可能会水平翻转每张照片，然后把它也提供给模特。或者，我们改变照片中狗的姿势，如下图所示。就模型而言，这增加了数据集，但我们并没有到现实世界中去收集更多数据。使用合成数据来训练机器学习模型可能会导致许多问题，因此能够证明数据的真实性在未来可能变得至关重要。图 32：数据增强示例。对原始数据点进行多点扩增，无需到世界各地收集更多独特的数据点迭代的第二个更明显的例子是，当我们实际训练了一个模型，然后将其用于实践，即进行推理时，我们可能会发现模型在实践中表现不佳或存在偏差。这意味着我们必须停止推理过程，返回并重新训练模型，以解决这些问题，如偏差和证明。第三个也是非常常见的步骤是，一旦我们在实践中使用模型（进行推理），我们最终会对数据步骤进行修改，因为推理本身会产生新的数据。例如，想象一下建立一个垃圾邮件过滤器。首先，我们要收集数据。本例中的数据是一组垃圾邮件和非垃圾邮件。当模型经过训练并用于实践时，我的收件箱中可能会收到一封垃圾邮件，这意味着模型犯了一个错误。它没有把它归类为垃圾邮件，但它就是垃圾邮件。因此，当 Gmail用户选择 "这封邮件属于垃圾邮件 "时，就会产生一个新的数据点。之后，所有这些新数据点都会进入数据步骤，然后我们可以通过多做一些训练来提高模型的性能。另一个例子是，想象一个人工智能在下棋。我们训练人工智能下棋所需的数据是大量棋局，以及谁赢谁输的结果。但当这个模型用于实际下棋时，就会为人工智能生成更多的数据。这意味着，我们可以从推理步骤回到数据，利用这些新的数据点再次改进我的模型。这种推理和数据相连的想法适用于很多场合。本节旨在让你对机器学习模型的构建过程有一个高层次的了解，这个过程是非常反复的。它不像 "哦，我们只需获取数据，一次尝试就能训练出一个模型，然后将其投入生产"。模型是不断更新的，因此不变的记录可能会给设计带来挑战。 1.3 机器学习的类型我们将介绍三种主要的机器学习模型。监督学习："老师，教我方法" 无监督学习："只需找到隐藏的模式“ 强化学习："试一试，看什么有效" 1.3.1 监督学习 "老师，教我方法" 想象一下，你正在教孩子区分猫和狗。你（对一切都了如指掌的老师）给他们看很多猫和狗的图片，每次都告诉他们哪个是哪个。最终，孩子们学会了自己辨别。这几乎就是机器学习中监督学习的工作原理。在监督学习中，我们有大量的数据（比如猫和狗的图片），而且我们已经知道答案（老师告诉他们哪个是狗，哪个是猫）。我们利用这些数据来训练一个模型。该模型会查看许多示例，并有效地学习模仿老师。在这个例子中，每张图片都是一个原始数据点。答案（狗或猫）被称为"标签"。因此，这是一个标签数据集。每个数据点都包含一张原始图片和一个标签。这种方法概念简单，功能强大。在医疗诊断、自动驾驶汽车和股票价格预测中，使用监督学习模型的应用很多。这种方法概念简单，功能强大。在医疗诊断、自动驾驶汽车和股票价格预测中，使用监督学习模型的应用很多。然而，可以想象，这种方法面临着许多挑战。例如，我们不仅需要获取大量数据，还需要标签。这可能非常昂贵。Scale.ai (opens new window) 等公司在这方面提供了有价值的服务。数据标注对稳健性提出了许多挑战。给数据贴标签的人可能会犯错，或者只是对标签有不同意见。从人类收集的所有标签中，有 20% 无法使用的情况并不少见。激励机制和其他博弈论动态可能有助于提高开放数据集的质量。 1.3.2 无监督学习（Unsupervised Learning, USL） "只需找到隐藏的模式" 想象一下，你有一个装满各种水果的大篮子，但你并不熟悉所有的水果。你开始根据它们的外观、大小、颜色、质地甚至气味将它们分类。你不太清楚每种水果的名称，但你注意到有些水果彼此相似。也就是说，你在数据中发现了一些规律。这种情况类似于机器学习中的无监督学习。在无监督学习中，我们会给模型一堆数据（比如各种水果的组合），但我们不会告诉模型每个数据是什么（我们不会给水果贴标签）。然后，模型会检查所有这些数据，并试图自己找出模式或分组。它可能会根据水果的颜色、形状、大小或任何其他它认为相关的特征进行分组。然而，模型找到的特征并不总是相关的。这就导致了许多问题，我们将在第 2 章中看到。例如，模型最终可能会将香蕉和大蕉归为一组，因为它们都是长条形且呈黄色，而苹果和西红柿可能会被归为另一组，因为它们都是圆形且可能是红色。这里的关键在于，模型是在没有任何先验知识或标签的情况下找出这些分组的--它是从数据本身学习的，就像你根据可观察到的特征将未知水果分到不同的组中一样。无监督学习是许多流行的机器学习模型的支柱，例如大型语言模型（LLM）。ChatGPT不需要人类通过提供标签来教它如何说每个句子。它只需分析语言数据中的模式，并学会预测下一个单词。许多其他强大的生成式人工智能模型都依赖于无监督学习。例如，GAN（生成对抗网络）可用于生成人脸（即使这个人并不存在）。参见 https://thispersondoesnotexist.com/(opens new window) 图 33：人工智能生成的图像来自 https://thispersondoesnotexist.com 图 34：第二张人工智能生成的图片来自 https://thispersondoesnotexis t.com 上面的图片是人工智能生成的。我们并没有教这个模型"什么是人脸"。它是在大量人脸的基础上训练出来的，通过巧妙的架构，我们可以利用这个模型生成看似真实的人脸。请注意，随着生成式人工智能的兴起和模型的改进，对内容进行验证变得越来越困难。加密解决方案可以让我们追踪内容的来源，并以可扩展的方式让我们安全地使用生成式人工智能。 1.3.3 强化学习 (Reinforcement Learning, RL) "试一试，看什么有效 "或 "从试验和错误中学习" 想象一下，您正在教一只狗做一个新的动作，比如捡球。每当狗狗做出接近你想要的动作时，比如跑向球或捡起球，你就给它点心吃。如果狗狗做了与此无关的事情，比如朝相反的方向跑，它就得不到食物。渐渐地，狗狗发现捡到球就能得到美味的食物，所以它就会一直这样做。这基本上就是机器学习领域中的强化学习（RL）。在RL中，你有一个计算机程序或代理（如狗），它通过尝试不同的事情（如狗尝试不同的动作）来学习决策。如果代理做出了好的行为（比如捡球），它就会得到奖励（食物）；如果做出了不好的行为，它就得不到奖励。随着时间的推移，代理会学会多做能获得奖励的好事，少做不能获得奖励的坏事。从形式上看，这就是最大化奖励函数。最酷的地方在于：代理会自己通过试错找出这一切。现在，如果我们想构建一个人工智能来下棋，那么人工智能最初可以随意尝试走棋。如果最终赢得了比赛，人工智能就会得到奖励。然后，该模型就会学会走更多的胜棋。这可以应用于许多问题，尤其是需要连续决策的问题。例如，RL方法可用于机器人与控制、国际象棋或围棋（如 AlphaGo）以及算法交易。 RL方法面临许多挑战。其一，代理可能需要很长时间才能"学会"有意义的策略。这对于学习下棋的人工智能来说是可以接受的。但是，当人工智能开始采取随机行动来观察哪些行动有效时，你会把你的个人资金投入到人工智能算法交易中吗？或者说，如果机器人一开始会采取随机行动，你会允许它住在你家吗？图35：这是一些强化学习代理在训练过程中的视频：一个[真正的机器人](https://www.youtube.com/watch?v=n2gE7n11h1Y)和一个[模拟机器人](https://www.youtube.com/watch?v=hx_bgoTF7bs) 以下是每种机器学习的应用实例简述：机器学习面临的挑战本章概述了机器学习领域的问题。我们将有选择性地对该领域的某些问题展开。这样做有两个原因：1）简明扼要，全面概述该领域的挑战并考虑到细微差别会导致报告非常冗长；2）在讨论与加密货币的交叉点时，我们将重点关注相关问题。不过，本节本身只是从人工智能的角度撰写的。也就是说，我们不会在本节讨论密码学方法。本节所涉主题概述：从偏见到可访问性，数据面临着巨大的挑战。此外，数据层面上存在恶意的攻击也会导致机器学习模型的误判。当模型（如GPT-X）在合成数据上进行训练时，会发生模型崩溃。这会对其造成不可逆转的损害。标注数据可能非常昂贵、缓慢且不可靠。根据不同的架构，训练机器学习模型会面临许多挑战。模型并行化带来了巨大的挑战，例如通信开销。贝叶斯模型可用于量化不确定性。例如：在进行推理时，模型会返回它的确定程度（如 80% 的确定性）。 LLM面临幻觉（hallucination）和训练困难等特殊挑战。 2.1 数据挑战数据是任何类型机器学习模型的关键。不过，数据的要求和规模因使用的方法而异。无论是监督学习还是无监督学习，都需要原始数据（无标签数据）。在无监督学习中，只有原始数据，不需要标注。这就缓解了许多与标注数据集相关的问题。然而，无监督学习所需的原始数据仍然会带来许多挑战。这包括数据偏差：当训练数据不能代表所要模拟的真实世界场景时，机器学习中就会出现偏差。这可能导致偏差或不公平的结果，例如面部识别系统在某些人口群体上表现不佳，因为他们在训练数据中的代表性不足。不均衡的数据集：通常，可用于训练的数据在不同类别之间的分布并不均衡。例如，在疾病诊断应用中，“无病”案例可能比"有病"案例多得多。这种不平衡会导致模型在少数民族/阶层上表现不佳。这个问题与偏见不同。数据的质量和数量：机器学习模型的性能在很大程度上取决于训练数据的质量和数量。数据不足或质量不佳（如低分辨率图像或嘈杂的音频录音）会严重影响模型的有效学习能力。数据的可获取性：获取大型、高质量的数据集可能是一项挑战，尤其是对于规模较小的机构或个人研究人员而言。大型科技公司在这方面往往具有优势，这可能导致机器学习模型开发方面的差距。这是一项重大挑战。不过，众包数据集也会带来一些问题，比如数据质量的保证。经济激励和博弈论设计可以帮助创建开放的高质量数据集。数据安全：保护数据免遭未经授权的访问并确保其在存储和使用过程中的完整性至关重要。安全漏洞不仅会损害隐私，还会导致数据被篡改，影响模型性能。隐私问题：由于机器学习需要大量数据，处理这些数据可能会引发隐私问题，尤其是当其中包含敏感或个人信息时。确保数据隐私意味着尊重用户同意、防止数据泄露以及遵守 GDPR 等隐私法规。这可能非常具有挑战性（见下文示例）。在机器学习模型中，删除特定用户的数据（遵守GDPR）是一项非常具有挑战性的工作。与数据库不同，我们不能随便删除一个条目。模型参数会根据提供的所有数据进行调整，因此在模型训练完成后删除特定用户的信息是非常困难的。图 34：数据隐私的一个特殊问题源于机器学习模型的性质。在普通数据库中，我可以有关于多人的条目。如果我的公司要求我删除这些信息，你只需从数据库中删除即可。然而，当我的模型经过训练后，它持有几乎整个训练数据的参数。不清楚哪个数字对应训练中的哪个数据库条目 2.1.1 模型崩溃在无监督学习中，我们要强调的一个特殊挑战是模型崩溃。在本文中，作者进行了一项有趣的实验。GPT-3.5 和 GPT-4 等模型是使用网络上的所有数据训练而成的。然而，这些模型目前正在被广泛使用，因此一年后互联网上的大量内容将由这些模型生成。这意味着，GPT-5 及以后的模型将使用 GPT-4 生成的数据进行训练。在合成数据上训练模型的效果如何？他们发现，在合成数据上训练语言模型会导致生成的模型出现不可逆转的缺陷。论文作者指出："我们证明，如果我们要保持从网络上搜刮的大规模数据进行训练所带来的好处，就必须认真对待这一问题。事实上，当从互联网抓取的数据中出现由 LLM 生成的内容时，收集到的有关人类与系统之间真正交互行为的数据的价值将越来越大"。这可能表明，围绕数据出处（追踪数据来源）的解决方案存在重大机遇。图 35：模型崩溃示意图。随着使用人工智能模型生成的互联网内容越来越多，下一代模型的训练集中很可能包含合成数据，如本文所示请注意，这种现象并非LLM所特有，它可能会影响各种机器学习模型和生成式人工智能系统（如变异自动编码器、高斯混合模型）。现在，让我们来看看监督学习。在监督学习中，我们需要一个贴有标签的数据集。这意味着原始数据本身（一张狗的图片）和一个标签（"狗"）。标签由模型设计者手动选择，可以通过人工标注和自动化工具相结合的方式获得。这在实践中带来了许多挑战。这包括主观性：决定数据的标签可能是主观的，从而导致模糊不清和潜在的伦理问题。一个人认为合适的标签，另一个人可能会有不同的看法。标签的差异：同一个人（更不用说不同的人）重复运行可能会提供不同的标签。这就提供了 "真实标签 "的噪声近似值，因此需要质量保证层。例如，人类可能会收到一个句子，并负责标注该句子的情绪（"快乐"、"悲伤"......等）。同一个人有时会给完全相同的句子贴上不同的标签。这就降低了数据集的质量，因为它在标签中引入了差异。在实践中，20% 的标签无法使用的情况并不少见。想象一下，创建一个数据集来预测区块链上新协议的质量。你很可能会得到一个范围很广的分数，这取决于你所选择的评分系统的次活动性，以及你所调查的人的意见差异。缺乏专家注释者：对于一个小众的医疗应用，人们可能很难获得大量有意义的标签数据。这是由于能够提供这些标签的人员（医学专家）十分稀缺。罕见事件：对于许多事件来说，由于事件本身非常罕见，因此很难获得大量的标注数据。例如，发现流星的计算机视觉模型。高成本：当试图收集大量高质量数据集时，成本可能高得惊人。由于上述问题，如果需要对数据集进行标注，成本尤其高昂。还有很多问题，比如应对对抗性攻击和标签的可转移性。为了让读者对数据集的规模有一些直观的了解，请看下图。像 ImageNet这样的数据集包含1400万个标签数据点。图 36：各种机器学习数据集的规模示意图。Common Crawl的近似值为10亿个网页，因此总字数远远超过这个数字。小型数据集（如 Iris）包含 150 幅图像。MNIST 大约有 70,000 张图像。请注意，这是一个对数比例 2.1.2 强化学习中的数据收集在强化学习中，数据收集是一项独特的挑战。与监督学习不同的是，监督学习的数据是预先标记好的静态数据，而强化学习则依赖于通过与环境互动而产生的数据，这通常需要复杂的模拟或真实世界的实验。这就带来了一些挑战：这一过程可能会耗费大量资源和时间，对于物理机器人或复杂环境而言尤其如此。如果机器人在真实世界中接受训练，那么它从试验和错误中学习可能会导致事故。或者，也可以考虑让训练机器人通过试验和错误来学习。奖励稀少且延迟：在收到有意义的反馈之前，代理可能需要探索大量的行动，从而难以学习有效的策略。确保所收集数据的多样性和代表性至关重要；否则，代理可能会过度适应狭隘的经验集，而不能通用化。在探索（尝试新行动）和利用（使用已知的成功行动）之间取得平衡使数据收集工作更加复杂，需要复杂的策略才能有效收集有用的数据。值得强调的一点是，数据收集与推理直接相关。在训练一个强化学习代理下棋时，我们可以利用自我对弈来收集数据。自我对弈就像是与自己下棋，以获得进步。代理与自己的副本对弈，形成一个持续学习的循环。这种方法非常适合收集数据，因为它会不断产生新的场景和挑战，帮助代理从广泛的经验中学习。这一过程可以在多台机器上并行执行。由于推理的计算成本很低（与训练相比），这一过程对硬件的要求也很低。通过自我游戏收集数据后，所有数据都将被用于训练模型和改进模型。闲置计算在分布式推理和数据收集中可以发挥强大作用，因为对硬件的要求比训练低得多。 2.1.3 对抗性数据攻击数据毒化攻击：在这种攻击中，通过添加扰动来破坏训练数据，从而欺骗分类器，导致不正确的输出。例如，有人可能会在非垃圾邮件中添加垃圾邮件元素。这将导致将来在垃圾邮件过滤器的训练中加入这些数据时，性能下降。这可以通过在非垃圾邮件上下文中增加 "free"、"win"、"offer "或 "token"等词的使用来解决。规避攻击：攻击者在部署过程中操纵数据，欺骗先前训练好的分类器。规避攻击在实际应用中最为普遍。针对生物识别验证系统的"欺骗攻击 "就是规避攻击的例子。对抗性攻击：这是对合法输入的修改，目的是愚弄模型，或者使用专门设计的"噪音"来引起错误分类。请看下面的例子，在熊猫图像中添加噪音后，模型将其分类为长臂猿（置信度为99.3%）。图 37：通过在熊猫图像中添加特殊类型的噪声，模型可预先判断出图像是长臂猿而不是熊猫。在进行对抗攻击时，我们向神经网络提供一幅输入图像（左图）。然后，我们使用梯度下降法构建噪声向量（中）。该噪声向量被添加到输入图像中，从而导致错误分类（右图）。(图片来源：本文图 1解释和利用对抗性实例》论文中的图 1）在创建开放数据集时，有必要建立一个强大的质量控制层，以避免恶意攻击。此外，数据出处（追溯图像来源）可能会有所帮助。 2.2 训练方面的挑战训练机器学习模型会面临许多挑战。本节绝不是为了说明这些挑战的严重性。相反，我们试图让读者了解挑战的类型和瓶颈所在。这将有助于建立直觉，从而能够评估将训练模型与密码原语相结合的项目构想。请看下面这个无监督学习问题的例子。在无监督学习中，没有 "老师 "提供标签或指导模型。相反，模型会发现问题中隐藏的模式。考虑一个猫狗数据集。每只猫狗都有两种颜色：黑色和白色。我们可以使用一个无监督学习模型，通过将它们聚类为两组来找到数据中的模式。该模型有两种有效的方法：将所有狗集中在一起，将所有猫集中在一起将所有白色动物集中在一起，将所有黑色动物集中在一起。请注意，从技术上讲，这两者都没有错。模型找到的模式很好。然而，要完全按照我们的要求来引导模型是非常具有挑战性的。图 38：训练好的对猫和狗进行分类的模型最终可能会根据颜色将动物聚类在一起。这是因为在实践中很难指导无监督学习模型。所有图像均由人工智能使用 Dalle-E 生成这个例子说明了无监督学习所面临的挑战。然而，在所有类型的学习中，能够评估模型在训练过程中的学习效果并进行潜在干预至关重要。这可以节省大量资金。在无权限系统中，模型的训练无需专家监督，因此可能会浪费大量资源。处理早期停止等问题的自动化工具还很不成熟。训练大型模型的挑战还有很多，这是一个非常简短的清单：训练大规模机器学习模型，尤其是深度学习模型，需要大量的计算能力。这通常意味着要使用高端 GPU 或 TPU，而它们可能既昂贵又耗能。与这些计算需求相关的成本不仅包括硬件，还包括连续运行这些机器（有时长达数周或数月）所需的电力和基础设施。强化学习因其训练的不稳定性而闻名，模型或训练过程中的微小变化都可能导致结果的显著差异。与Adam等监督学习中使用的更稳定的优化方法不同，强化学习中没有放之四海而皆准的解决方案。通常需要对训练过程进行定制，这不仅耗时，而且需要深厚的专业知识。强化学习中的探索-开发两难问题使训练变得更加复杂，因为找到正确的平衡点对于有效学习至关重要，但却很难实现。机器学习中的损失函数定义了模型的优化目标。选择错误的损失函数会导致模型学习到不恰当或次优的行为。在复杂任务中，例如涉及不平衡数据集或多类分类的任务，选择、有时甚至定制设计正确的损失函数变得更加重要。损失函数必须与应用的实际目标紧密结合，这就需要深入了解数据和预期结果。在强化学习中，设计能持续、准确反映预期目标的奖励函数是一项挑战，尤其是在奖励稀少或延迟的环境中。在国际象棋游戏中，奖励函数可以很简单：赢了得 1 分，输了得 0 分。但是，对于行走机器人来说，这个奖励函数可能会变得非常复杂，因为它将包含 "面向前方行走"、"不要随意摆动手臂 "等信息。奖励函数（和损失函数）包含了模型去符号化者认为重要的主观因素。可能有必要建立管理制度，以确保为广泛使用的模型选择适当的函数。在监督学习中，由于深度神经网络的 "黑箱 "性质，要了解是哪些特征驱动了复杂模型（如深度神经网络）的预测具有挑战性。这种复杂性使得调试模型、了解其决策过程和提高其准确性变得十分困难。这些模型的复杂性也对可预测性和可解释性提出了挑战，而这对在敏感或受监管领域部署模型至关重要。同样，训练模式和所涉及的挑战也是非常复杂的话题。我们希望上述内容能让您对所涉及的挑战有一个大致的了解。如果您想深入了解该领域当前面临的挑战，我们推荐您阅读《应用深度学习中的开放性问题》（Open Problems in Applied Deep Learning）和《MLOps 指南》（MLOps guide）。从概念上讲，机器学习模型的训练是按顺序进行的。但在很多情况下，并行训练模型至关重要。这可能只是因为模型太大，一个 GPU 难以容纳，并行训练可以加快训练速度。然而，并行训练模型会带来重大挑战，包括通信开销：将模型分割到不同的处理器需要这些单元之间不断进行通信。这可能会造成瓶颈，尤其是对于大型模型而言，因为各单元之间的数据传输可能会耗费大量时间。负载均衡：确保所有计算单元得到平等利用是一项挑战。不平衡会导致一些单元闲置，而另一些单元超负荷运行，从而降低整体效率。内存限制：每个处理器单元的内存都是有限的。在不超出这些限制的情况下，有效管理和优化多个单元的内存使用情况是非常复杂的，尤其是大型模型。实施的复杂性：设置模型并行涉及计算资源的复杂配置和管理。这种复杂性会增加开发时间和出错的可能性。优化困难：传统的优化算法可能无法直接适用于模型并行化环境，也无法提高效率，这就需要进行修改或开发新的优化方法。调试和监控：由于训练过程的复杂性和分布性增加，监控和调试分布在多个单元上的模型比监控和调试运行在单个单元上的模型更具挑战性。分散和并行训练方面的基本新方法可以极大地推动机器学习的进步。 2.3 推理中的挑战许多类型的机器学习系统面临的最重要挑战之一就是它们可能会"自信地出错"。ChatGPT可能会返回一个我们听起来很有把握的答案，但事实上这个答案是错误的。这是因为大多数模型经过训练后都会返回最有可能的答案。贝叶斯方法可用于量化不确定性。也就是说，模型可以返回一个有根据的答案，来衡量它有多确定。考虑使用蔬菜数据训练图像分类模型。该模型可以获取任何蔬菜的图像，并返回它是什么，例如 "黄瓜 "或 "红洋葱"。如果我们给这个模型输入一张猫的图像，会发生什么呢？普通模型会返回它的最佳猜测，也许是 "白色洋葱"。这显然是不正确的。但这是模型的最佳猜测。贝叶斯模型的输出则是 "白色洋葱 "和一个确定度，例如 3%。如果模型有 3% 的确定性，我们可能就不应该根据这个预测采取行动。图 39：常规模型预测（只返回最有可能的答案）和贝叶斯模型预测（返回预测结果的 s 分布）的示意图这种形式的不确定性定性和推理在关键应用中至关重要。例如，医疗干预或金融决策。然而，贝叶斯模型的实际训练成本非常高，而且面临许多可扩展性问题。推理过程中出现的更多挑战维护：随着时间的推移，尤其是数据和现实世界场景发生变化时，保持模型的更新和正常运行。 RL 中的探索-利用：在探索新策略和利用已知策略之间取得平衡，尤其是在推理直接影响数据收集的情况下。测试性能：确保模型在新的、未见过的数据上表现良好，而不仅仅是在训练过的数据上。分布偏移：处理输入数据分布随时间发生的变化，这种变化会降低模型性能。例如，推荐引擎需要考虑客户需求和行为的变化。某些模型生成缓慢：像扩散模型这样的模型在生成输出时可能需要大量时间，而且速度较慢。高斯过程和大型数据集：随着数据集的增长，使用高斯过程进行推理的速度会越来越慢。增加防护栏：在生产模型中实施制衡措施，防止出现不良结果或误用。在封闭源模型中增加哪些防护措施，这对于确保不出现偏差至关重要。 2.4 LLM 面临的挑战大型语言模型面临许多挑战。不过，由于这些问题受到了相当多的关注，我们在此仅作简要介绍。 LLM 不提供参考文献，但可以通过检索增强生成（RAG）等技术来缓解没有参考文献等问题。幻觉：产生无意义、虚假或无关的输出。训练运行需要很长时间，而且数据集重新平衡的边际值很难预测，这就导致了缓慢的反馈循环。很难将人类的基本评估标准扩展到模型所允许的吞吐量。量化在很大程度上是需要的，但其后果却鲜为人知。下游基础设施需要随着模型的变化而变化。在与企业合作时，这意味着长时间的发布延迟（生产总是远远落后于开发）。不过，我们想重点介绍论文《沉睡代理：训练通过安全训练持续存在的欺骗性 LLMs》一文中的一个例子。作者训练的模型会在提示年份为 2023 年时编写安全代码，但在提示年份为 2024 年时插入可被利用的代码。他们发现，这种后门行为可以持续存在，因此标准的安全训练技术无法将其清除。这种后门行为在最大的模型中最持久，在经过经训练产生思维链路以欺骗训练过程的的模型中也最持久，甚至就算思维链路已经消失也一直存在。图 40 后门示意图。如果是 2024 年，模型的训练表现为 "正常"，但如果是 2024 年，则策略表现不同。资料来源：本文图 1 模型训练过程的透明度至关重要，因为即使是开源模型，也可能被训练出只在特定情况下使用的后门。例如，想象一下，将一个有资金的钱包连接到一个人工智能代理，结果却发现了一个后门。然后，这个代理就会将所有资金转移到一个特定的地址，或者以不同的身份恶意行事。在本章中，我们讨论了机器学习领域的许多挑战。显而易见，研究的巨大进步解决了许多此类问题。例如，基础模型为训练特定模型提供了巨大优势，因为您只需根据使用情况对其进行微调即可。此外，数据标注不再是全手工过程，使用半监督学习等方法可以避免大量的人工标注。本章的总体目标是先让读者对人工智能领域的问题有一些直观的了解，然后再探讨人工智能与密码学的交叉问题。报告外读物 3.1.1 Gensyn 网站： https://www.gensyn.ai/(opens new window) 一句话简介：去中心化机器学习计算协议，实现人工智能开发民主化。描述：旨在通过将全球所有计算能力整合到一个全球超级集群中，彻底改变人工智能和加密货币领域。该网络专为机器学习计算协议设计，任何人都可以随时访问，从而推动机器学习的发展。通过利用区块链技术，Gensyn实现了人工智能训练过程的去中心化，允许点对点、低成本高效率地访问计算资源。这就消除了对云寡头和大型科技公司的依赖，为人工智能开发提供了一个更加民主和无许可的环境。Gensyn的协议使世界各地的设备（包括未充分利用的硬件）都能为去中心化计算网络做出贡献，为任何人、任何地方都能实现人工智能潜力的未来铺平了道路。简短描述什么是数据类别中的公司，最好使用第 2 章中的框架进行细分。 3.1.2 Axiom 网站： https://www.axiom.xyz/(opens new window) 一句话简介： Axiom利用零知识证明，实现对以太坊历史的无信任链上查询和计算，适用于数据丰富的动态的去中心化应用。描述：为人工智能和加密货币的交叉领域铺平了道路，它使开发人员能够在以太坊上创建智能合约，这些合约可以通过零知识（ZK）证明对区块链数据的整个历史进行访问和计算。这一点至关重要，因为它为动态DeFi应用、定制化的预言机和链上忠诚度计划开辟了新的可能性，允许协议根据历史链上活动进行调整，而无需依赖外部预言机或修改已部署的合约。此外，该协议还旨在将 ZK 技术用于人工智能应用，例如通过确保数据完整性和无信任计算，Axiom可以验证在线内容并检测深度伪造。这使得Axiom成为以太坊上未来安全、数据丰富应用的关键参与者，利用人工智能和加密货币的优势，创建一个更加透明、高效和用户驱动的生态系统。来源：金色财经

金色财经02-22 17:01

【A股收市】英伟达热火烧到中国！股市连涨7日经济实质性起色有待观察

股通净买入11.38亿元。在英伟达(Nvidia)周三预计季度收入将增长约三倍，超出预期后，中国人工智能类股在午盘休市前飙升近4%。中国最大的人工智能相关芯片制造商之一寒武纪股价上涨超过10%。摩根士丹利(Morgan Stanley)股票策略师在一份报告中说，国有企业改革主题最近引起了投资者的关注，因为自上而下的政策焦点似乎已经回归。尽管股市表现在一系列救市措施的推动下有所改善，但如果经济活动没有实质性起色，投资者信心仍可能脆弱。彭博社周三报道，中国已禁止主要机构投资者在每个交易日开盘和收盘时减持股票。这种对交易活动的严格控制，有可能颠覆对冲基金和其他机构投资者使用的流行策略，并可能进一步疏远已经成群结队离开中国市场的外国基金。 “从短期来看，这些举措至少应该能阻止市场的螺旋式下跌，”Kamet Capital Partners Pte的首席投资长Kerry Goh说，“机器主导的大型快速交易应该会缩减，这样我们就不会造成意外的崩溃。” 包括Gilbert Wong和Laura Wang在内的摩根士丹利策略师在一份报告中援引IHS Markit的数据写道，即便如此，在本月股市上涨的趋势中，对中国内地和香港股市的做空兴趣上升，意味着投资者的整体情绪仍然谨慎。 “海外投资者总体上仍持谨慎态度。他们认为，最近的反弹主要是由空头回补和农历新年前的看空推动的，”瑞银(UBS)分析师表示，并补充称，房地产市场低迷和通缩仍是主要担忧。与此同时，在小盘股暴跌后，中国对冲基金经理正忙于安抚投资者，尽管监管机构正加强对主要市场参与者活动的审查，试图重振中国疲弱的股市。

云涌02-22 16:50

分析师：英伟达盈利情况可能会触发加密行情调整

ET 等人工智能相关代币也可能会影响 Nvidia 的盈利和该行业的前景。总部位于新加坡的 QCP Capital 在最近的一份报告中表示，如果英伟达 (NVDA) 第四季度收益未能达到华尔街的高预期，比特币 (BTC) 和更广泛的加密货币涨势可能会停止。 QCP 在一份报告中写道：“今天可能引发更广泛调整的一个关键事件是英伟达财报，该财报将在美国收盘后发布。” “作为标准普尔 500 指数的主要组成部分，英伟达的表现可能会为近期美国股市定下基调。” 设计人工智能革命所需芯片的 GPU 巨头英伟达 (Nvidia) 将于周三美国股市收盘后公布财报。这家芯片制造商的股价比去年上涨了近 220%。市场将高度关注该股维持涨势的潜力。事实上，此次涨势如此火爆，高盛甚至称其为“地球上最重要的股票”，因为期权交易员押注其涨势将达到 11%。 QCP 表示：“Nvidia 目前的市盈率为 90 倍，第四季度盈利预期最近已调高。” 相比之下，根据 FactSet 数据，亚马逊 (AMZN) 目前的市盈率为 52.4 倍，特斯拉 (TSLA) 的市盈率为 57.7 倍。如此高的估值，误差幅度非常小。 “在这些估值倍数和对盈利的高预期下，任何失望都可能导致抛售。这肯定也会拖累美国股市和加密货币价格，”QCP 继续说道。 Nvidia vs BTC 价格 (TradingView) Nvidia 的收益可能导致交易时段波动的另一个加密子行业是人工智能 (AI) 相关代币，例如 Ocean Protocol 的 OCEAN 和 Fetch.AI 的 FET。鉴于芯片制造商对人工智能行业情绪的影响，加密货币交易者将密切关注评估英伟达对该行业的前景并进行相应的交易。分析师还强调，英伟达的增长在很大程度上依赖于人工智能革命核心的服务器行业。 IDC数据显示，全球PC市场面临短期挑战，继2022年下降16.6%之后，2023年出货量预计将下降13.8%，连续两年出现两位数下降。然而，IDC 预测，在商用 PC 更新周期、人工智能集成和消费者安装基础复苏等因素的推动下，2024 年开始出现反弹，预计 2024 年增长 3.4%，复合年增长率为 3.1 2023 年至 2027 年期间的百分比。与此同时，台湾的 Digitimes Research 最近撰文称，由于 PC 和笔记本电脑需求饱和，计算行业的增长将趋于平稳，但新兴数据中心对于 Nvidia 等芯片公司的未来至关重要，将推动服务器出货量和 HPC 芯片需求。 Nvidia 的股价上周下跌了 7%，目前交易价格约为 680 美元。 FactSet 数据显示，大多数华尔街分析师对该股给予买入评级，12 个月平均目标价约为 751 美元。根据 CoinDesk Indices 数据，比特币交易价格为 51,200 美元，过去 24 小时下跌 0.4%，而衡量最大 20 种数字资产表现的 CoinDesk 20 指数 (CD20) 下跌 1.9%。来源：金色财经

金色财经02-22 11:44

英伟达2024 年第 4 季度业绩电话会分析师问答

老虎证券02-22 11:35

ACY证券汇评：【干货分享】从英伟达暴涨看热门个股规律

程度上用好财报后热门个股的突破动力。 NVIDIA一小时图对于英伟达来说，可参考的突破位置在前高点750美元，短线目标位置受情绪面决定难以确认，因此离场时机可以配合趋势终止类信号，或提前设好移动止损。联系我们电话：167 4049 5509（中国） 1300 729 171（澳大利亚）微信：acyauzh 官网：https://www.acy-ch.com 邮箱：support.cn@acy.com 本文内容由第三方提供。ACY证券对文中内容的准确性和完整性，不做任何声明或保证；由第三方的建议，预测或其他信息导致了投资损失，ACY证券不承担任何责任。本文内容不构成任何投资建议，与个人投资目标，财务状况或需求无关。如有任何疑问，请您咨询独立专业的财务或税务的意见。 2024-02-22

ACY证券02-22 11:34

英伟达2024 年第 4 季度业绩电话会高管解读财报

e Kress 大家下午好，欢迎参加 NVIDIA 第四季度和 2024 财年的电话会议。第四季度又是创纪录的季度。收入为 221 亿美元，环比增长 22%，同比增长高达 265%，远高于我们 200 亿美元的预期。2024 财年，收入为 609 亿美元，比上年增长 126%。从数据中心开始。2024 财年数据中心收入为 475 亿美元，比上年增长两倍多。世界已经到达新计算时代的转折点。价值 1 万亿美元的数据中心基础设施安装基础正在迅速从通用计算过渡到加速计算。随着摩尔定律的放缓，而计算需求持续飙升，公司可能会加速每项可能的工作负载，以推动未来性能、总体拥有成本和能源效率的改进。与此同时，企业已经开始建设下一代现代数据中心，即我们所说的人工智能工厂，其目的是在生成人工智能时代提炼原始数据并产生有价值的情报。第四季度，在 NVIDIA Hopper GPU 计算平台和 InfiniBand 端到端网络的推动下，数据中心收入达到创纪录的 184 亿美元，环比增长 27%，同比增长 409%。与去年相比，计算收入增长了 5 倍以上，网络收入增长了两倍。我们很高兴 Hopper 架构产品的供应正在改善。对霍珀的需求仍然非常强劲。我们预计，由于需求远远超过供应，我们的下一代产品将受到供应限制。第四季度数据中心的增长是由跨行业、用例和地区的生成式人工智能和大型语言模型的训练和推理推动的。我们的数据中心平台的多功能性和领先性能可为许多用例带来高投资回报，包括人工智能训练和推理、数据处理和广泛的 CUDA 加速工作负载。我们估计，去年大约 40% 的数据中心收入来自人工智能推理。构建和部署人工智能解决方案几乎已涉及每个行业。各行各业的许多公司都在通过云提供商（包括超大规模云、GPU 专用云、私有云或本地云）大规模培训和运营其 AI 模型和服务，以及跨 NVIDIA AI 基础设施的企业。 NVIDIA 的计算堆栈可跨云和本地环境无缝扩展，允许客户采用多云或混合云策略进行部署。第四季度，大型云提供商占我们数据中心收入的一半以上，支持内部工作负载和外部公共云客户。微软最近指出，超过 50,000 个组织使用 GitHub Copilot 业务来提高开发人员的工作效率，推动 GitHub 收入同比增长加速至 40%。Copilot for Microsoft 365 采用率在前两个月的增长速度比之前两个主要 Microsoft 365 企业套件版本的增长速度更快。消费互联网公司是人工智能的早期采用者，也是我们最大的客户类别之一。从搜索到电子商务、社交媒体、新闻和视频服务以及娱乐的公司都在使用人工智能来构建基于深度学习的推荐系统。这些人工智能投资通过提高客户参与度、广告对话和点击率而产生了丰厚的回报。 Meta 在最新季度中表示，更准确的预测和广告商业绩的改善有助于其收入大幅增长。此外，消费互联网公司正在投资生成式人工智能，通过内容和广告创建、在线产品描述和人工智能购物辅助的自动化工具为内容创作者、广告商和客户提供支持。企业软件公司正在应用生成式人工智能来帮助客户实现生产力提升。我们在生成式人工智能的训练和推理方面合作的早期客户已经取得了显着的商业成功。 ServiceNow 的生成式人工智能产品在最新一个季度推动了所有新产品系列发布中有史以来最大的年度净新合同价值贡献。我们还与许多其他领先的人工智能和企业软件平台合作，包括 Adobe、Databricks、Getty Images、SAP 和 Snowflake。大语言模型的基础领域正在蓬勃发展。Anthropic、谷歌、Inflection、微软、OpenAI 和 xAI 在生成人工智能领域不断取得惊人突破，处于领先地位。Adept、AI21、Character.ai、Cohere、Mistral、Perplexity 和 Runway 等令人兴奋的公司正在构建为企业和创作者服务的平台。新的初创公司正在创建法学硕士，以服务于世界许多地区的特定语言、文化和习俗。其他人正在创建基础模型来解决完全不同的行业，例如递归制药和生成：生物学生物医学。这些公司正在通过超大规模或 GPU 专业云提供商推动对 NVIDIA AI 基础设施的需求。就在今天早上，我们宣布与 Google 合作优化其最先进的新 Gemma 语言模型，以加速其在云数据中心和 PC 中 NVIDIA GPU 上的推理性能。过去一年最显着的趋势之一是汽车、医疗保健和金融服务等垂直行业的企业大量采用人工智能。NVIDIA 提供多种应用框架，利用我们的全栈加速计算平台，帮助企业在自动驾驶、药物发现、用于欺诈检测或机器人技术的低延迟机器学习等垂直领域采用人工智能。我们估计去年汽车垂直行业通过云或本地数据中心的收入贡献超过 10 亿美元。NVIDIA DRIVE 基础设施解决方案包括用于开发自动驾驶的系统和软件，包括数据摄取、创建、标记和 AI 培训，以及通过模拟进行验证。全球 OEM、新能源汽车、卡车运输、自动驾驶出租车和一级供应商的近 80 家汽车制造商正在使用 NVIDIA 的 AI 基础设施来训练法学硕士和其他 AI 模型，以实现自动驾驶和 AI 座舱应用。事实上，几乎所有致力于人工智能的汽车公司都在与 NVIDIA 合作。随着 AV 算法转向视频转换器以及更多汽车配备摄像头，我们预计 NVIDIA 的汽车数据中心处理需求将大幅增长。在医疗保健领域，数字生物学和生成人工智能正在帮助重塑药物发现、手术、医学成像和可穿戴设备。过去十年，我们在医疗保健领域积累了深厚的专业知识，创建了 NVIDIA Clara 医疗保健平台和 NVIDIA BioNeMo（一项生成式 AI 服务，用于开发、定制和部署用于计算机辅助药物发现的 AI 基础模型）。 BioNeMo 具有越来越多的预训练生物分子 AI 模型，可应用于端到端药物发现过程。我们宣布 Recursion 正在通过 BioNeMo 为药物发现生态系统提供其专有的人工智能模型。在金融服务领域，客户正在将人工智能用于越来越多的用例，从交易和风险管理到客户服务和欺诈检测。例如，美国运通使用 NVIDIA AI 将欺诈检测准确率提高了 6%。转向我们按地理位置划分的数据中心收入。所有地区的增长均强劲，但中国除外，在美国政府 10 月份实施出口管制法规后，我们的数据中心收入大幅下降。尽管我们尚未获得美国政府向中国运送受限制产品的许可证，但我们已经开始向中国市场运送不需要许可证的替代品。第四季度，中国数据中心收入占我们数据中心收入的中个位数百分比。我们预计第一季度它将保持在类似的范围内。在美国和中国以外的地区，主权人工智能已成为额外的需求驱动力。世界各国都在投资人工智能基础设施，以支持使用本国语言、基于国内数据构建大型语言模型，并支持当地研究和企业生态系统。从产品角度来看，绝大多数收入是由我们的 Hopper 架构和 InfiniBand 网络推动的。它们共同成为加速计算和人工智能基础设施的事实上的标准。我们有望在第二季度实现 H200 的首次发货。需求强劲，因为 H200 的推理性能几乎是 H100 的两倍。网络年化收入运行率超过 130 亿美元。我们的端到端网络解决方案定义了现代人工智能数据中心。我们的 Quantum InfiniBand 解决方案同比增长超过 5 倍。 NVIDIA Quantum InfiniBand 是最高性能 AI 专用基础设施的标准。我们现在正在进入以太网网络领域，推出了专为数据中心人工智能优化网络而设计的新 Spectrum-X 端到端产品。Spectrum-X 通过以太网引入了专为人工智能而构建的新技术。与传统以太网相比，我们的 Spectrum 交换机、BlueField DPU 和软件堆栈中采用的技术可将 AI 处理的网络性能提高 1.6 倍。包括戴尔、HPE、联想和超微在内的领先 OEM 拥有全球销售渠道，正在与我们合作，将我们的人工智能解决方案扩展到全球企业。我们有望在本季度推出 Spectrum-X。我们的软件和服务产品也取得了巨大进展，第四季度的年化收入达到了 10 亿美元。我们宣布 NVIDIA DGX Cloud 将扩大其合作伙伴名单，将亚马逊 AWS 纳入其中，加入 Microsoft Azure、Google Cloud 和 Oracle Cloud 的行列。DGX Cloud 用于 NVIDIA 自己的 AI 研发和自定义模型开发以及 NVIDIA 开发人员。它将 CUDA 生态系统带给 NVIDIA CSP 合作伙伴。好吧，转向游戏。游戏收入为 28.7 亿美元，环比持平，同比增长 56%，好于我们对假期期间消费者对 NVIDIA GeForce RTX GPU 强劲需求的预期。财年收入为 104.5 亿美元，增长 15%。在 CES 上，我们发布了 GeForce RTX 40 Super 系列 GPU 系列。它们起价 599 美元，提供令人难以置信的游戏性能和生成人工智能功能。销售有了一个良好的开端。 NVIDIA AI Tensor 核心和 GPU 提供多达 836 个 AI 顶级，非常适合为游戏 AI 提供动力，创造日常生产力。我们通过 RTX GPU 提供的丰富软件堆栈进一步加速了人工智能。借助我们的 DLSS 技术，八分之七的像素可以由 AI 生成，从而使光线追踪速度提高 4 倍并提高图像质量。借助适用于 Windows 的 Tensor RT LLM，我们的开源库可加速最新大语言模型生成式 AI 的推理性能，在 RTX AI PC 上的运行速度可提高 5 倍。在 CES 上，我们还宣布了各大 OEM 厂商推出的一系列新款 RTX 40 系列 AI 笔记本电脑。这些为各种外形尺寸带来了高性能游戏和人工智能功能，包括 14 英寸和轻薄笔记本电脑。这些下一代 AI PC 拥有高达 686 个顶级 AI 性能，将生成式 AI 性能提高了 60 倍，成为性能最佳的 AI PC 平台。在 CES 上，我们发布了 NVIDIA Avatar Cloud Engine 微服务，它允许开发人员将最先进的生成式 AI 模型集成到数字化身中。ACE 荣获多项 CES 2024 最佳奖项。 NVIDIA 拥有一个端到端平台，用于为 RTX PC 和工作站构建和部署生成式 AI 应用程序。这包括开发人员可以纳入其生成人工智能工作负载的库、SDK、工具和服务。NVIDIA 正在推动下一波进入 PC 的生成式 AI 应用程序。我们已经在路上，拥有超过 1 亿台 RTX PC 和超过 500 个支持 AI 的 PC 应用程序和游戏。转向专业可视化。收入为 4.63 亿美元，环比增长 11%，同比增长 105%。财年收入为 15.5 亿美元，增长 1%。本季度的连续增长是由 RTX Ada 架构 GPU 的丰富组合持续增长所推动的。企业正在更新其工作站，以支持与生成型人工智能相关的工作负载，例如数据准备、LLM 微调和检索增强生成。这些推动需求的关键垂直行业包括制造业、汽车和机器人技术。汽车行业也是 NVIDIA Omniverse 的早期采用者，因为该行业寻求将工厂和汽车从设计到建造、模拟、操作和体验的工作流程数字化。在 CES 上，我们宣布 Brickland、WPP 和 ZeroLight 等创意合作伙伴和开发商正在构建 Omniverse 支持的汽车配置器。像莲花这样的领先汽车制造商正在采用该技术，将个性化、真实性和互动性提升到新的购车体验水平。转向汽车。收入为 2.81 亿美元，环比增长 8%，同比下降 4%。由于汽车制造商继续采用 NVIDIA DRIVE 平台，该财年收入达到 10.9 亿美元，增长 21%，首次突破 10 亿美元大关。NVIDIA DRIVE Orin 是软件定义 AV 车队的首选 AI 车载计算机。其后续产品 NVIDIA DRIVE Thor 通常专为视觉变形者而设计，可提供更多 AI 性能，并将广泛的智能功能集成到单个 AI 计算平台中，包括自动驾驶和停车、驾驶员和乘客监控以及 AI 驾驶舱功能，并将明年上市。本季度有多家汽车客户发布公告，理想汽车、长城汽车、吉利旗下高端电动汽车子公司 ZEEKR 以及小米电动汽车均发布了基于 NVIDIA 的新车。转向损益表的其余部分。由于数据中心的强劲增长和组合，GAAP 毛利率连续扩大至 76%，非 GAAP 毛利率扩大至 76.7%。我们第四季度的毛利率受益于有利的零部件成本。随后，GAAP 运营费用增长了 6%，非 GAAP 运营费用增长了 9%，主要反映了计算和基础设施投资的增加以及员工的增长。第四季度，我们以股票回购和现金股息的形式向股东返还 28 亿美元。在 24 财年，我们使用了 99 亿美元的现金来回报股东，其中包括 95 亿美元的股票回购。让我谈谈第一季度的展望。总收入预计为 240 亿美元，上下浮动 2%。我们预计数据中心和供应商的环比增长将被游戏的季节性下降部分抵消。GAAP 和非 GAAP 毛利率预计分别为 76.3% 和 77%，上下浮动 50 个基点。与第四季度类似，第一季度的毛利率受益于有利的零部件成本。在第一季度之后，在今年剩余时间内，我们预计毛利率将恢复到 70% 左右的范围。 GAAP 和非 GAAP 运营费用预计分别约为 35 亿美元和 25 亿美元。随着我们继续投资于面前的巨大机遇，2025 财年 GAAP 和非 GAAP 运营费用预计将增长 30% 左右。 GAAP 和非 GAAP 其他收入和支出预计约为 2.5 亿美元，不包括非关联投资的损益。GAAP 和非 GAAP 税率预计为 17%，正负 1%（不包括任何离散项目）。更多财务细节包含在 CFO 评论和我们的 IR 网站上提供的其他信息中。最后，让我强调一下金融界即将发生的一些事件。我们将参加 3 月 4 日在旧金山举行的摩根士丹利技术与媒体和电信会议，以及 3 月 5 日在波士顿举行的 TD Cowen 第 44 届年度医疗保健会议。当然，请参加我们于 3 月 18 日星期一在旧金山举行的年度 DTC 会议加利福尼亚州何塞市将是五年来首次面对面举行。DTC 将以 Jen-Hsun 的主题演讲拉开帷幕，我们将在第二天（3 月 19 日）为金融分析师举办问答环节。 (这份记录可能不是100％的准确率，并且可能包含拼写错误和其他不准确的。提供此记录，没有任何形式的明示或暗示的保证。表达的记录任何意见并不反映老虎的意见)

老虎证券02-22 11:15

24小时热点