FX168财经网_全球视野外汇黄金加密货币NFT资讯网

VeraViews案例研究 - 英国的电竞发行商通过VeraViews验证实时活动情况

部署了13个独立的模块，包括人工智能和机器学习，以识别一些接触点上的欺诈性流量。活动管理、测量和报告是在一个定制的后端进行的。VeraViews提供专门的开发人员经理来管理客户活动。通过VeraViews独特的视图证明（PoV）专利技术，活动数据（包括欺诈性视图、有效视图和其他参数）使用开放账本技术进行存储，供所有各方（出版商和合作伙伴广告网络）验证。一旦数据被记录在开放账本上，就没有办法进行篡改或混淆，从而实现了对活动表现的透明记录。在这项研究中，领先的广告网络通过VeraViews广告堆栈为出版商的内容提供了供应和需求方面的广告库存。实施 VeraViews是通过与Brightcove网络播放器的简单集成来部署的，Publisher已经使用Brightcove平台来托管视频库存。通过VeraViews与Brightcove的整合，出版商能够在视频播放器层面上部署VeraViews。这种整合是 "即插即用 "的，设置要求简单，并通过托管在VeraViews.com的后端进行活动跟踪。可以在管理面板上添加无限数量的网络属性。通过VeraViews为Brightcove出版商提供的'即插即用'方法，出版商能够迅速将其原有的广告堆栈转换为VeraViews。这种方法对出版商和VeraViews来说都只需要最少的开发人员资源。结果这项研究的主要收获是：在研究期间，发行商的未识别欺诈份额从估计的23%降至仅1.52%，这意味着几乎所有的欺诈都被识别和消除了。发行商可以通过我们的开放式账目后台获得实时的活动数据。VeraViews每48小时产生详细的活动报告，每周和每月都有后续活动报告，以跟踪研究过程中的表现。重要的是，发行商（和他们的广告合作伙伴）可以在链上实时验证这些数据，而不是从一个黑盒子第三方解决方案中获取活动报告的表面价值，这是任何其他广告堆栈都没有提供的功能，据我们所知，这是一个行业的首创。在活动期间，超过52,000,000个浏览量证明和其他统计数据被储存在链上。这项研究为VeraViews提出了一个有趣的挑战--与一家出版商合作，该出版商表示希望得到透明和可审计的报告，以向他们的广告伙伴证明他们认真对待防欺诈问题。我们表明，我们的广告堆栈和获得专利的 "视图证明 "技术可以在更大程度上减少欺诈行为，而同时通过我们的开放式账本后台提供行业第一的实时数据访问。这项研究表明，VeraViews将是那些注重透明的广告活动数据访问和可审计的统计数据的出版商的主要兴趣。鉴于许多现有的反欺诈解决方案是数据黑匣子，向出版商提交的报告几乎没有数据透明度，VeraViews表明可以成为广告活动可审计性和实时数据的变革性工具。来源：金色财经

金色财经2023-03-15

OpenAI推出GPT-4！可以解析文本和图像输入券商：商业化应用将进一步加速，背后有四大投资新路径

达75%。　　第二个测试是与其他英文机器学习模型的技术能力。研究团队使用微软Azure Translate，将MMLU 基准——一套涵盖57个主题、14000个多项选择题翻译成多种语言。在测试的英语、拉脱维亚语、威尔士语和斯瓦希里语等26种语言中，有24种语言下，GPT-4优于GPT-3.5 和其他大语言模型（Chinchilla、PaLM）的英语语言性能。　　华泰证券表示，GPT-4 的核心升级点包括：1）能够处理复杂的长文本，准确性显著提升；2）接受文本和图像的输入；3）风格多样化，创造力强。建议关注应用落地方向包括：1）对话机器人：利用GPT-4 的提升交互能力，如社交与教育应用、直播、游戏等；2）搜索：借助GPT-4 的分析能力，总结生成建议，如导购平台、搜索引擎等；3）办公：引领B 端生产力变革，如营销文本等；4）开放内容创作：如小说创作。　　中信证券认为，伴随成本下降以及多模态的持续演进，GPT等大模型有望构筑AIGC核心基石，推动AI商业化进程加速和市场天花板打开。建议持续关注相关领域的AI公司：1）应用层；2）基础设施层。　　1、ChatGPT通过大模型突破AI瓶颈，GPT-4多模态应用带动商业化加速　　ChatGPT凭借大算力、大规模数据训练、基于人类知识的强化学习等方式突破AI技术瓶颈，获得超预期的用户体验效果与市场反响。回顾GPT系列模型演进，GPT-1结合无监督预训练与有监督微调过程，GPT-2突出零样本设定，GPT-3强调上下文学习能力，参数量、训练数据量不断提升。我们预计即将推出的GPT-4或支持多模态应用，开启通往人工通用智能（AGI）之路，并有望控制训练成本，降低使用门槛。目前，ChatGPT已在C端推出ChatGPT Plus订阅计划，B端开放ChatGPT API，且成本降低为0.002美金/1000token，海外多个应用率先接入。我们预计在GPT-4带动下，未来大模型以及多模态模型的商业化应用将进一步加速，带动行业景气度持续向上。　　2、Transformer架构支撑GPT走向多模态，构筑AIGC领域核心基石　　GPT系列模型使用Transformer架构，当前基于Transformer的多模态研究为AI领域研究热点，Transformer已开始打破NLP与CV领域壁垒，有望支撑GPT系列模型走向多模态应用，构筑AIGC领域核心能力基石。我们梳理出GPT的潜在基础能力包括文本生成（分析）、代码生成、对话交互、机器翻译、图像生成、视频生成等。我们认为，前述基础能力将支撑GPT系列模型在通用与垂直领域的应用，典型应用场景如：通用领域—搜索引擎/办公软件，垂直领域—教育/金融/医疗/图像视频等。　　3、通用与垂直场景多点开花，GPT变革内容生成与交互方式　　GPT有望革新各行各业的内容生成与交互方式。基于GPT+文本&代码&对话&翻译&图像&视频，我们看好GPT类技术未来在通用与垂直场景的应用空间。例如，搜索引擎结合GPT将重塑搜索结果呈现方式，多模态的引入带来一站式的文本、图像、视频汇集结果，将大为提升用户信息收集效率。　　中金公司机构以下四大环节有望迎来新机遇：　　（1）算力方面，ChatGPT训练所耗费的算力大约为3640 PF-days，即假设每秒运算一千万亿次，需要连续运行3640天，训练大模型需要强大的算力。人工智能的跨越式发展将成为算力流量消耗的重要驱动力，未来数据中心和相关的配套产业有望实现更好增长。其中，数据中心建设有四大重点方向：　　①第三方IDC运营环节：宝信软件、数据港（与阿里合作）、科华恒盛（与腾讯合作）、奥飞数据、美利云、光环新网、铜牛信息等。　　②储能温控环节：英维克（互联网IDC空调龙头）、佳力图（绑定中国移动）、高澜股份、依米康、申菱环境、朗进科技、科华数据、润泽科技等。　　③传输网设备、光纤光缆、光模块等ICT环节：光模块领域的新易盛、中际旭创、博创科技；光器件领域的天孚通信、腾景科技、光库科技；光纤光缆领域的中天科技、亨通光电等。　　④高性能计算芯片板块：澜起科技、国芯科技、聚辰股份、兆易创新、景嘉微、寒武纪、芯原股份等。　　（2）数据标注方面，ChatGPT的训练过程加大了人工标注的力度和精度，这代表着在未来的人工智能领域，优质的数据源和强大的标注能力，将成为行业的基础设施。　　（3）NLP（自然语言处理）方面，安信证券表示，由于ChatGPT主要基于自然语言处理，因此在NLP领域沉淀较多的企业，有望率先实现功能的部分复现，NLP头部厂商将率先受益。　　（4）AIGC（人工智能生成内容）方面，ChatGPT是AIGC应用的又一个起点，随着深度学习模型不断完善、开源模式的推动、大模型探索商业化的可能，AIGC有望加速发展。

金融界2023-03-15

二三四五：公司尚无直接与ChatGPT相关的产品和服务

技术能力较强的研发人员从事大数据分析、机器学习、人工智能及ChatGPT等技术的探索和研究。截至目前，公司尚无直接与ChatGPT相关的产品和服务。公司还表示，其持有上海国策科技制造股权投资基金合伙企业（有限合伙）2.67%的份额，并通过该基金间接持有字节跳动的少量股权，该部分股权对公司无重大影响。此外，公司与字节跳动开展流量合作等业务。（来源:界面AI）声明：本条内容由界面AI生成并授权使用，内容仅供参考，不构成投资建议。AI技术战略支持为有连云。

有连云2023-03-15

主打正统性和EVM兼容的Scroll 后来者能否居上？

来。 Haichen曾在亚马逊负责机器学习系统，工程能力强，擅长将理论进行实践搭建。行业OG Sandy曾在香港证监会从事研究工作，有游戏、产品类项目运营经验，熟悉初创团队的品牌运营。团队一开始有两个目标：建设通用的ZK Rollup和实现ZK prover的去中心化。因为一直和以太坊社区保持紧密联系，团队发现PSE（以太坊的研究机构，专注于ZK Proof前沿研究及其在以太坊的应用）也要做ZKEVM，二者技术路线匹配，Scroll随即获得与以太坊一起做EVM兼容ZK Rollup框架开发的机会。 Scroll非常重视技术基础。2022年中，团队规模为40人+，其中超过30位都是ZK或者区块链研究员和开发者。甚至挑选合作伙伴时也会关注对方的研究能力和技术实力，因为只有他们才能理解Scroll的技术难度，并指点项目或引荐人才，如Geometry的创始人曾是Aztec的CEO。 Scroll技术亮点 1.完全的EVM兼容开发者的代码在Scroll和以太坊上的执行效果相同，无需进行深度修改或重写。同时支持所有以太坊原生开发工具，开发者可以快速迁移合约，不需要重复审计。相比之下，Scroll的竞品Zksync和Starkware则需要开发者在将应用跨层迁移时进行重新编译，用户也需要相信新的虚拟机和编译器。Polygon Hermez则在执行交易过程中可能存在一定的风险。 Scroll继承了已被无数次检验过的EVM模型，同时重用Geth（以太坊智能合约必备开发工具），以尽量减少跟以太坊的差异，最大限度保证安全。 2.去中心化 Scroll开发了世界上最快的GPU prover，允许任何人利用GPU机器搭建证明节点（此前搭节点成本过高），实现去中心化。加入的节点越多，算力越大，成本越低，从而激励社区更新更好更快的硬件，迭代专属于ZK的ASIC，进一步缩小L1的最终确认时间和证明成本。在ZK Rollup赛道，Scroll拥有最高的硬件计算效率。除了技术层面，Scroll团队追求社会和文化层面的去中心化。2022年，Scroll团队增加了39名成员，分布于20多个城市，10多个时区。社区建设 Scroll团队很早就意识到，很多公链其实不缺技术，缺的是生态。 Scroll多次赞助以太坊核心活动，频繁在以太坊活动上露脸（如ETH Devcon, ETH CC, ETH Vietnam）。截至2022年，Scroll的Discord 用户达到12万+。与以太坊的策略相似，Scroll重视社区的声音。公共教育：去中心化的精髓是让成员也有能力解决问题。 Scroll在 0xPARC举办了关于证明堆栈的讲座，在斯坦福和伯克利举办了针对研究成果的演讲，每周更新零知识证明应用研究系列。开放平台：除了PSE和联创团队，Scroll的社区成员也能参与ZKEVM开发，如keccak电路和snark验证者的优化就是由社区成员完成的。Scroll每两周有一次社区电话会议，共同讨论技术优化。此外，Scroll还在维护一个python 版本的规范（类似于以太坊的consensus-spec和 execution-spec），方便不熟悉Rust和Halo2的人理解电路逻辑。现状与展望 2021年底，Scroll完成3千万美元A轮融资，天使投资人中不乏以太坊基金会成员和以太坊社区核心成员。 2022年8月，Scroll发布了测试网（得到超过10万社区用户的支持），10月进行升级。允许用户试用Uniswap v2等核心应用，执行L1和L2之间的转账。后推出无许可的Pre-Alpha测试网，任何人都可以在测试网上交互，开发者可以无需许可进行部署合约。 2023年1月，Scroll执行Pre-Alpha网络重置，提高Pre-Alpha测试网的吞吐量，解除社交账号的限制。网络重置一周后，Scroll测试网唯一地址数超过27万，每天在L2上处理11万笔交易。今年3月初，alpha测试网正式发布。用户可以完全无需许可部署合约，任何人都可以体验Scroll并测试其极限。目前，Scroll正致力于在未来几个月内迭代和提升zkEVM的性能，并争取在协议级别与以太坊在排序器上保持一致。总结除了在EVM兼容方面的优秀表现，Scroll证明节点的去中心化和开源的社区经营都体现了以太坊的正统性，达到了价值观层面的「兼容」，顶级硬件速度为Scroll注入了更大的潜力。虽然起步时间较晚，但其他ZK Rollup也仍未落地，凭借这些在短期内难以复制的优势，相信Scroll会在ZK Rollup赛道有相当的潜力。来源：金色财经

金色财经2023-03-15

以太坊正统性、EVM完全兼容 Layer2后来者Scroll能否弯道超车？

的未来。 Haichen曾在亚马逊负责机器学习系统，工程能力强，擅长将理论进行实践搭建。行业OG Sandy曾在香港证监会从事研究工作，有游戏、产品类项目运营经验，熟悉初创团队的品牌运营。团队一开始有两个目标：建设通用的ZK Rollup和实现ZK prover的去中心化。因为一直和以太坊社区保持紧密联系，团队发现PSE（以太坊的研究机构，专注于ZK Proof前沿研究及其在以太坊的应用）也要做ZKEVM，二者技术路线匹配，Scroll随即获得与以太坊一起做EVM兼容ZK Rollup框架开发的机会。 Scroll非常重视技术基础。2022年中，团队规模为40人+，其中超过30位都是ZK或者区块链研究员和开发者。甚至挑选合作伙伴时也会关注对方的研究能力和技术实力，因为只有他们才能理解Scroll的技术难度，并指点项目或引荐人才，如Geometry的创始人曾是Aztec的CEO。 Scroll技术亮点 1.完全的EVM兼容开发者的代码在Scroll和以太坊上的执行效果相同，无需进行深度修改或重写。同时支持所有以太坊原生开发工具，开发者可以快速迁移合约，不需要重复审计。相比之下，Scroll的竞品Zksync和Starkware则需要开发者在将应用跨层迁移时进行重新编译，用户也需要相信新的虚拟机和编译器。Polygon Hermez则在执行交易过程中可能存在一定的风险。 Scroll继承了已被无数次检验过的EVM模型，同时重用Geth（以太坊智能合约必备开发工具），以尽量减少跟以太坊的差异，最大限度保证安全。 2.去中心化 Scroll开发了世界上最快的GPU prover，允许任何人利用GPU机器搭建证明节点（此前搭节点成本过高），实现去中心化。加入的节点越多，算力越大，成本越低，从而激励社区更新更好更快的硬件，迭代专属于ZK的ASIC，进一步缩小L1的最终确认时间和证明成本。在ZK Rollup赛道，Scroll拥有最高的硬件计算效率。除了技术层面，Scroll团队追求社会和文化层面的去中心化。2022年，Scroll团队增加了39名成员，分布于20多个城市，10多个时区。社区建设 Scroll团队很早就意识到，很多公链其实不缺技术，缺的是生态。 Scroll多次赞助以太坊核心活动，频繁在以太坊活动上露脸（如ETH Devcon, ETH CC, ETH Vietnam）。截至2022年，Scroll的Discord 用户达到12万+。与以太坊的策略相似，Scroll重视社区的声音。公共教育：去中心化的精髓是让成员也有能力解决问题。 Scroll在 0xPARC举办了关于证明堆栈的讲座，在斯坦福和伯克利举办了针对研究成果的演讲，每周更新零知识证明应用研究系列。开放平台：除了PSE和联创团队，Scroll的社区成员也能参与ZKEVM开发，如keccak电路和snark验证者的优化就是由社区成员完成的。Scroll每两周有一次社区电话会议，共同讨论技术优化。此外，Scroll还在维护一个python 版本的规范（类似于以太坊的consensus-spec和 execution-spec），方便不熟悉Rust和Halo2的人理解电路逻辑。现状与展望 2021年底，Scroll完成3千万美元A轮融资，天使投资人中不乏以太坊基金会成员和以太坊社区核心成员。 2022年8月，Scroll发布了测试网（得到超过10万社区用户的支持），10月进行升级。允许用户试用Uniswap v2等核心应用，执行L1和L2之间的转账。后推出无许可的Pre-Alpha测试网，任何人都可以在测试网上交互，开发者可以无需许可进行部署合约。 2023年1月，Scroll执行Pre-Alpha网络重置，提高Pre-Alpha测试网的吞吐量，解除社交账号的限制。网络重置一周后，Scroll测试网唯一地址数超过27万，每天在L2上处理11万笔交易。今年3月初，alpha测试网正式发布。用户可以完全无需许可部署合约，任何人都可以体验Scroll并测试其极限。目前，Scroll正致力于在未来几个月内迭代和提升zkEVM的性能，并争取在协议级别与以太坊在排序器上保持一致。总结除了在EVM兼容方面的优秀表现，Scroll证明节点的去中心化和开源的社区经营都体现了以太坊的正统性，达到了价值观层面的「兼容」，顶级硬件速度为Scroll注入了更大的潜力。虽然起步时间较晚，但其他ZK Rollup也仍未落地，凭借这些在短期内难以复制的优势，相信Scroll会在ZK Rollup赛道有相当的潜力。来源：金色财经

金色财经2023-03-15

不可落入他人之手！“美国将亲手摧毁台积电” 前国家安全顾问、学者：与台湾官方存在分歧

生产。制造商生产更先进的芯片，主要用于机器学习和导弹等高度先进的技术。战略与国际研究中心的高级顾问William Alan Reinsch此前告诉美媒，尽管半导体的很多研究和开发都在美国进行，但过去30年来制造商决定最好将制造外包。 “你建立了一个大工厂，你生产了成千上万的这些东西，你在一个可能没有环境要求的低工资、无工会的国家这样做，”Reinsch提到说。“你把所有的设计和知识产权都留在家里，你在家里做所有的销售、营销和服务，这就是你赚钱的地方。” 实际上奥布莱恩并不是第一个提出摧毁台湾半导体工厂的人，两位美国学者也推荐此举，他们在美国陆军战争学院2021年发表的一篇论文中提出类似观点。 “首先，美国和台湾应该制定一项有针对性的焦土战略计划，这将使台湾不仅在被武力夺取时失去吸引力，而且维护成本也很高，”论文称。 “这可以通过威胁摧毁属于世界上最重要的芯片制造商和中国最重要的供应商台湾半导体制造公司的设施来最有效地完成，总部位于韩国的三星是切割的唯一选择。” 但台湾安全部门负责人陈明通说，如果发生入侵，美国没有必要摧毁台湾的半导体工厂，因为该系统已经深度融入全球供应链，这意味着美国和其他国家可以在不摧毁工厂的情况下关闭生产。例如，如果没有来自荷兰供应商ASML的组件，台积电将无法生产某些芯片。陈明通指出：“即使中国抓住了金母鸡，也下不了金蛋。” “如果台湾真的发生入侵，那将是我们所见过的对全球经济的最大影响，可能是有史以来最大的影响，”Forrester副总裁兼研究总监格伦·奥唐奈(Glenn O'Donnell)提到，并补充说这可能比1929年的股市崩盘更糟糕。

颜辞2023-03-15

OpenAI正式推出多模态GPT-4

认为下列结果是有代表性的。我们还在为机器学习模型设计的传统基准上，对GPT-4进行了评估。GPT-4大大超过现有的大语言模型，与多数最先进的（SOTA）模型并驾齐驱，这些模型包括针对基准的制作或额外的训练协议。由于现有的大多数ML基准是用英语编写的，为了初步了解其他语言的能力，我们使用Azure Translate将MMLU基准：一套涵盖57个主题的14000个选择题，翻译成了各种语言。在测试的26种语言中的24种语言中，GPT-4的表现优于GPT-3.5和其他大模型（Chinchilla，PaLM）的英语表现，这种优秀表现还包括类似拉脱维亚语、威尔士语和斯瓦希里语等等。我们一直在内部使用GPT-4，发现它对支持、销售、内容审核和编程等功能会产生很大影响，我们还在用它来协助人类评估AI的输出，这就是我们调整战略的第二阶段的开始。视觉输入 GPT-4可以接受文本和图像的提示语（prompt），这与纯文本设置平行。比如说，可以让用户指定任何视觉或语言任务，它可以生成文本输出（自然语言、代码等），给定的输入包括带有文字和照片的文件、图表或屏幕截图，GPT-4表现出与纯文本输入类似的能力。此外，还可以应用在为纯文本语言模型开发的测试时间技术，包括少数几个镜头和CoT的Prompting，不过目前图像输入仍然属于研究方面预览，没有像C端公开产品。下列图片显示了一个 "Lightning Cable "适配器的包装，有三个面板。面板1：一个带有VGA接口（通常用于电脑显示器的大型蓝色15针接口）的智能手机插在其充电端口。面板2："Lightning Cable "适配器的包装上有一张VGA接口的图片。面板3：VGA连接器的特写，末端是一个小的Lightning连接器（用于为iPhone和其他苹果设备充电）。这张图片的搞笑性质来自于将一个大的、过时的VGA连接器插入一个小的、现代的智能手机充电端口..因此看起来很荒谬通过在一套狭窄的标准学术视觉基准上，对GPT-4的性能进行评估，并且对它进行预览。然而，这些数字并不能代表其的能力范围，因为我们发现，这个模型能够处理很多的新的和令人兴奋的任务，OpenAI计划很快发布进一步的分析和评估数字，以及对测试时间技术效果的彻底调查结果。可控制的AI 我们一直在努力实现关于定义AI行为那篇文章中，所概述的计划的每个方面，包括AI的可控制性。与经典的ChatGPT个性的固定言语、语气和风格不同，开发者（很快就是所有的ChatGPT用户）现在可以通过在 "系统 "消息中描述这些方向，来规定自己的AI的风格和任务。系统消息允许API用户在范围内，大幅对用户体验进行定制，我们将持续改进。局限性尽管能力惊人，不过，GPT-4仍存在与早期GPT模型类似的限制。最重要的是，它仍然不是完全可靠的（比如说，它会对事实产生 "幻觉"，并出现推理错误）。在使用语言模型的输出时，特别是在高风险的情况下，应该非常小心谨慎，比如说：需要人类审查，完全避免高风险的使用）以及需要与特定的使用案例的需求相匹配。尽管各类情况仍然存在，但相较于以前的模型（这些模型本身也在不断改进），GPT-4大大减少了hallucinations（意思是网络错觉，这里指的是一本正经的胡说八道）。在我们内部的对抗性事实性评估中，GPT-4的得分比我们最新推出的GPT-3.5高40%。可控制的AI GPT-4的基础模型在这项任务中只比GPT-3.5略胜一筹；然而，在经过RLHF的后期训练后（应用我们对GPT-3.5使用的相同过程），却有很大差距。该模型在其输出中会有各种偏差，我们在这些方面已经取得了进展，但仍有更多工作要做。根据我们最近的博文，我们的目标是使我们建立的人工智能系统具有合理的默认行为，以反映广泛的用户价值观，允许这些系统在广泛的范围内被定制，并获得公众对这些范围的意见。 GPT-4通常缺乏对其绝大部分数据截止后（2021年9月）发生的事件的了解，也不会从其经验中学习。它有时会犯一些简单的推理错误，这似乎与这么多领域的能力不相符，或者过于轻信用户的明显虚假陈述。有时它也会像人类一样在困难的问题上失败，例如在它产生的代码中引入安全漏洞。GPT-4也可能在预测中自信地犯错。风险和缓解措施我们一直在对GPT-4进行迭代，使其从训练开始就更加安全，保持一致性，我们所做的努力包括预训练数据的选择和过滤、评估，邀请专家参与，对模型安全改进、监测，以及执行。 GPT-4与过去的模型会存在类似风险，如生产有害的建议、错误代码或不准确的信息。然而，GPT-4的额外能力还导致了新的风险面。为了明确这些风险的具体情况，我们聘请了50多位来自人工智能对接风险、网络安全、生物风险、信任和安全以及国际安全等领域的专家对该模型进行对抗性测试。他们的参与，使我们能够测试模型在高风险领域的行为，这些领域需要专业知识来评估。来自这些领域专家的反馈和数据，为我们缓解和改进模型提供了依据。比如说，我们已经收集了额外的数据，以提高GPT-4拒绝有关如何合成危险化学品的请求的能力。 GPT-4在RLHF训练中加入了一个额外的安全奖励信号，通过训练模型来拒绝对此类内容的请求，从而减少有害产出（由我们的使用指南定义）。奖励是由GPT-4的分类器提供的，它能够判断安全边界和安全相关提示的完成方式。为了防止模型拒绝有效的请求，我们从不同的来源（例如，标记的生产数据，人类的红队，模型生成的提示）收集多样化的数据集，并在允许和不允许的类别上应用安全奖励信号（存在正值或负值）。与GPT-3.5相比，我们的缓解措施大大改善了GPT-4的许多安全性能。与GPT-3.5相比，我们将模型对非法内容的请求的响应倾向，降低了82%，而GPT-4对敏感请求（如医疗建议和自我伤害）的响应符合我们的政策的频率提高了29% 总的来说，我们的模型级干预措施增加了诱发不良行为的难度，但仍然存在 "越狱 "的情况，以产生违反我们使用指南的内容。随着人工智能系统的风险的增加，在这些干预措施中实现极高的可靠性将变得至关重要。目前重要的是，用部署时间的安全技术来补充这些限制，如想办法监测。 GPT-4和后续模型，很有可能对社会产生正面或者负面的影响，我们正在与外部研究人员合作，以改善我们对潜在影响的理解和评估，以及建立对未来系统中可能出现的危险能力的评估。我们将很快分享我们对GPT-4和其他人工智能系统的潜在社会和经济影响的更多思考。训练过程和之前的GPT模型一样，GPT-4基础模型的训练是为了预测文档中的下一个单词，并使用公开的数据（如互联网数据）以及我们授权的数据进行训练。这些数据是来自于极大规模的语料库，包括数学问题的正确和错误的解决方案，弱的和强的推理，自相矛盾的和一致的声明，以及种类繁多的意识形态和想法。因此，当被提示有一个问题时，基础模型可以以各种各样的方式作出反应，而这些反应可能与用户的意图相去甚远。为了使其与用户的意图保持一致，我们使用人类反馈的强化学习（RLHF）对模型的行为进行微调。注意，模型的能力似乎主要来自于预训练过程，RLHF并不能提高考试成绩（如果不主动努力，它实际上会降低考试成绩）。但是对模型的引导来自于训练后的过程--基础模型需要及时的工程，甚至知道它应该回答问题。可预测的扩展 GPT-4项目的一大重点是建立一个可预测扩展的深度学习栈。主要原因是，对于像GPT-4这样非常大的训练运行，做大量的特定模型调整是不可行的。我们对基础设施进行了开发和优化，在多种规模下都有非常可预测的行为。为了验证这种可扩展性，我们提前准确地预测了GPT-4在我们内部代码库（不属于训练集）中的最终损失，方法是通过使用相同的方法训练的模型进行推断，但使用的计算量要少10000倍。我们认为，准确预测未来的机器学习能力是安全的一个重要部分，相对于其潜在的影响，它没有得到足够的重视（尽管我们已经被几个机构的努力所鼓舞）。我们正在扩大我们的努力，开发一些方法，为社会提供更好的指导，让人们了解对未来系统的期望，我们希望这成为该领域的一个共同目标。开放式人工智能评估我们正在开源OpenAI Evals，这是我们的软件框架，用于创建和运行评估GPT-4等模型的基准，同时逐个样本检查其性能。我们使用Evals来指导我们模型的开发（包括识别缺点和防止退步），我们的用户可以应用它来跟踪不同模型版本（现在将定期推出）和不断发展的产品集成的性能。例如，Stripe已经使用Evals来补充他们的人工评估，以衡量他们的GPT驱动的文档工具的准确性。因为代码都是开源的，Evals支持编写新的类来实现自定义的评估逻辑。然而，根据我们自己的经验，许多基准都遵循一些 "模板 "中的一个，所以我们也包括了内部最有用的模板（包括一个 "模型分级Evals "的模板--我们发现GPT-4有令人惊讶的能力来检查自己的工作）。一般来说，建立一个新的评估的最有效方法是将这些模板中的一个实例化，并提供数据。我们很高兴看到其他人能用这些模板和Evals更广泛地建立什么。我们希望Evals成为一个分享和众包基准的工具，最大限度地代表广泛的故障模式和困难任务。作为后续的例子，我们已经创建了一个逻辑谜题评估，其中包含GPT-4失败的十个提示。Evals也与实现现有的基准兼容；我们已经包括了几个实现学术基准的笔记本和一些整合CoQA（小的子集）的变化作为例子。我们邀请大家使用Evals来测试我们的模型，并提交最有趣的例子。我们相信Evals将成为使用和建立在我们的模型之上的过程中不可或缺的一部分，我们欢迎直接贡献、问题和反馈。 ChatGPT Plus ChatGPT Plus用户将在chat.openai.com上获得有使用上限的GPT-4权限。我们将根据实际需求和系统性能调整确切的使用上限，但我们预计容量将受到严重限制（尽管我们将在接下来的几个月里扩大和优化）。根据我们看到的流量模式，我们可能会为更高的GPT-4使用量引入一个新的订阅级别，我们也希望在某个时候提供一定数量的免费GPT-4查询，这样那些没有订阅的用户也可以尝试。 API 要获得GPT-4的API（使用与gpt-3.5-turbo相同的ChatCompletions API），请可以去OpenAI的官方Waitlist上注册。结论我们期待着GPT-4成为一个有价值的工具，通过为许多应用提供动力来改善人们的生活。还有很多工作要做，我们期待着通过社区的集体努力，在这个模型的基础上进行建设、探索和贡献，共同对模型进行改进。参考文献：1.https://openai.com/research/gpt-4 2.https://techcrunch.com/2023/03/14/openai-releases-gpt-4-ai-that-it-claims-is-state-of-the-art/ 3.https://www.theverge.com/2023/3/14/23638033/openai-gpt-4-chatgpt-multimodal-deep-learning 来源：金色财经

金色财经2023-03-15

国内运营商巨头重磅布局RISC-V领域 RISC-V在AI领域复合增长率将超70%

在RISC-V最有机会发力的人工智能和机器学习领域，复合增长率将超过70％；2027年左右，将会有250亿设备在RISC-V生态中。RISC-V技术快速发展下，相关领域公司受益。　　华泰证券指出，随着国内芯片产业链不断完善及生态构建，RISC-V商业化价值将更加凸显，我们看到芯原股份（688521 CH）、兆易创新（603986 CH）、乐鑫科技（688018 CH）、平头哥（未上市）、芯来科技（未上市）、赛昉科技（未上市）等有布局。

金融界2023-03-14

硅谷银行倒闭是市场清算中的一个警示

险，其中许多是科技股。这家研究公司使用机器学习和自然语言处理来分析公司文件和模拟经济收益，尽管其研究遇到了阻力。　　Trainer并不认为硅谷银行的问题会波及其他银行，从而产生多米诺骨牌效应。他写道:“我们不认为SVB的困境会蔓延到银行业的其他领域。”“大银行的存款基础比SVB多元化得多，大银行的财务状况良好。” 　　据特雷纳说，硅谷银行的困境确实为投资者提供了购买摩根大通（JPMorgan Chase & Co.）股票的机会。特雷纳称，摩根大通是New constructors最喜欢的银行股。他说:“摩根大通是长盛不衰的。”“它涉及多个业务线，为投资者提供了稳定性和现金流。”

金融界2023-03-14

浙数文化：3月8日接受机构调研，广发基金参与

例如，公司旗下杭州城市大脑公司积极探索机器学习、NLP（自然语言处理）、LSTM(长短时间记忆模型）、知识图谱等技术及在“一网统管”智慧城市建设、大数据趋势预测、智能客服体系建设等社会治理方面的应用。旗下传播大脑科技公司也密切关注相关技术的应用发展，探寻相关技术与业务的结合。截至目前，公司相关 I 技术还处于探索阶段，尚未对公司业绩构成影响。问：版号重发对边锋网络的影响大吗？边锋游戏经营是否稳健？答：2022 年版号重启有利于游戏行业整体发展。版号重启以来，边锋网络已作为出版单位获得 10 个游戏版号，包括《造个方舟》《魔法连环消》《萌宠庄园》等休闲游戏，具体上线进度将根据市场需求、研发及推广进度决定。问：边锋旗下社交类业务 2022 年增速很快，特别是对营收贡献很高，2023 年会保持吗？答：2022 年初，在版号停发的背景下，边锋网络公司团队持续探索新兴业务领域，在原有直播业务的基础上，搭建起多元化社交产品矩阵，目前相关业务尚处于培育发展阶段，具体业绩详见公司于 2023 年 4 月 13 日披露的 2022 年年度报告。2023 年，随着版号发放逐步正常化，边锋网络将根据市场情况推动休闲游戏等相关产品的研发上线。浙数文化（600633）主营业务：数字娱乐业务、大数据业务、数字体育业务、融媒体云平台、文化产业服务、文化产业投资浙数文化2022三季报显示，公司主营收入39.35亿元，同比上升75.74%；归母净利润3.59亿元，同比下降23.65%；扣非净利润5.05亿元，同比上升21.93%；其中2022年第三季度，公司单季度主营收入15.04亿元，同比上升96.96%；单季度归母净利润1.25亿元，同比下降31.66%；单季度扣非净利润1.73亿元，同比上升29.36%；负债率15.04%，投资收益3280.35万元，财务费用-99.23万元，毛利率44.64%。该股最近90天内共有4家机构给出评级，买入评级4家；过去90天内机构目标均价为11.0。以下是详细的盈利预测信息：融资融券数据显示该股近3个月融资净流出4777.12万，融资余额减少；融券净流出1005.73万，融券余额减少。根据近五年财报数据，证券之星估值分析工具显示，浙数文化（600633）行业内竞争力的护城河良好，盈利能力较差，营收成长性一般。财务可能有隐忧，须重点关注的财务指标包括：货币资金/总资产率、存货/营收率增幅。该股好公司指标2.5星，好价格指标2.5星，综合指标2.5星。（指标仅供参考，指标范围：0 ~ 5星，最高5星）以上内容由证券之星根据公开信息整理，与本站立场无关。证券之星力求但不保证该信息（包括但不限于文字、视频、音频、数据及图表）全部或者部分内容的的准确性、完整性、有效性、及时性等，如存在问题请联系我们。本文为数据整理，不对您构成任何投资建议，投资有风险，请谨慎决策。

证券之星2023-03-13

24小时热点