全球数字财富领导者
CoNET
|
客户端
|
旧版
|
北美站
|
FX168 全球视野 中文财经
首页
资讯
速递
行情
日历
数据
社区
视频
直播
点评旗舰店
商品
香港论坛
外汇开户
登录 / 注册
搜 索
综合
行情
速递
日历
话题
168人气号
文章
文生视频AI系列动画片启播 机构看好IP资源价值
go
lg
...
的应用会最先在海外落地,Sora强大的
视频生成
能力将助力IP版权公司、出海广告营销等公司快速制作符合国际市场的视频内容,吸引海内外用户,实现海外业务扩张并增厚业绩表现。随着国内文生视频模型的落地与迭代,业务场景将进一步向国内发展。该机构建议关注:1)IP版权公司:中文在线、捷成股份、上海电影、掌阅科技、奥飞娱乐、中信出版;2)影视公司:华策影视、芒果超媒、光线传媒、博纳影业;3)出海公司:昆仑万维、易点天下、蓝色光标;4)上游产业链:丝路视觉。
lg
...
金融界
2024-02-26
掌趣科技:我们预期会跨PC、手机端,具体的系统及适配后续也将逐步落实
go
lg
...
研究中心OpenAI正式发布了旗下首款
视频生成
模型Sora,再次在全球掀起了人工智能关注浪潮。相较于此前的
视频生成
模型,Sora在底层模型和算法上进行了创新,被业界称为
视频生成
领域的里程碑。请问贵公司在研发自动生成文字到自动生成图片,再到现如今自动生成视频,人工智能大模型技术方面有何布局? 掌趣科技董秘:尊敬的投资者您好,公司在“AI游戏创作平台”、LayaAir游戏引擎方面的布局,是游戏工具、平台与AI技术结合的积极探索,也是后续AI相关新技术(包括文生视频等)有效的应用场景与合作伙伴,同时相关3D素材、3D引擎技术的积累也或将有助于行业内相关技术的训练或迭代。此外,公司通过直接或间接投资等方式,在大模型的研发与应用领域积极布局,建立产业合作生态。感谢您的关注! 投资者:公司要抓紧学习、储备、掌握Sora相关技术哇,在Ai发展上不要掉队,加油哦! 掌趣科技董秘:尊敬的投资者您好,感谢您的建议! 投资者:公司与北京蓝亚盒子科技有限公司合作推出最新版本 LayaAir 3.1的测试版本,支持 AI 资源生成、AI 插件、编辑器 AI 控制与 AI 技术客服等功能,请问与Sora相比较,哪些不同的地方? 掌趣科技董秘:尊敬的投资者您好,公司在“AI游戏创作平台”、LayaAir游戏引擎方面的布局,是游戏工具、平台与AI技术结合的积极探索,也是后续AI相关新技术(包括文生视频等)有效的应用场景与合作伙伴,同时相关3D素材、3D引擎技术的积累也或将有助于行业内相关技术的训练或迭代,感谢您的关注! 投资者:“生成一颗松树,去掉所有的叶子”、“去掉花瓣,加一点树叶”,基于最新研发的三维场景生成系统 AI 游戏引擎 LayaAir3.1 版本中,通过模糊语音指令就可以实现数字资产的创建和细节调整,这无疑为高度复杂的游戏开发提供了强大助力。请问这是公司开发的吗? 掌趣科技董秘:尊敬的投资者您好,公司与北京蓝亚盒子科技有限公司达成业务合作协议。双方将共同致力于打造一款具有创新意义的 AI 游戏引擎,为游戏开发者提供更加高效、智能的开发工具,更好地服务小程序游戏等游戏类型及相关内容开发生态。双方已合作推出最新版本 LayaAir 3.1的测试版本,支持 AI 资源生成、AI 插件、编辑器 AI 控制与 AI 技术客服等功能。上述合作的研发和应用进展、未来收益等都存在不确定性。请投资者谨慎决策,注意投资风险。感谢您的关注! 投资者:Sora涌现出对3D模型的理解以及强大的物理世界仿真能力,会对游戏底层工具层面产生深远影响。请问公司在主营业务中,对AI
视频生成
降本增效是如何理解的,是否有实际的应用。 掌趣科技董秘:尊敬的投资者您好,公司重视并密切关注AI前沿技术发展,我们认为Sora等新技术的涌现,将有助于提升游戏研发效率,推进游戏创作的创意实现,提升游戏体验,促进游戏类型的多元化发展,更好地助力推动游戏行业向前发展。感谢您的关注! 投资者:作为A股少数直接得到英伟达公司的AI技术支持的游戏公司,公司在2月6号公告的,拟800万美元参设Genkibling美元基金 主投游戏动画及AI技术与应用等,请问会邀请英伟达公司一起参与AI项目的孵化吗? 掌趣科技董秘:尊敬的投资者您好,目前不存在您所述的相关计划,感谢您的关注! 投资者:公司要抓紧学习、储备、掌握Sora相关技术哇,在Ai发展上不要掉队,加油哦! 掌趣科技董秘:尊敬的投资者您好,感谢您的建议! 投资者:请问贵公司和英伟达等公司的合作,在AI创作游戏引擎方面的可以以文生成视频方面的研发吗?谢谢! 掌趣科技董秘:尊敬的投资者您好,公司在AI方面积极布局,获得了包括英伟达在内合作伙伴的支持。公司积极关注行业发展动态,以及行业领导者及合作伙伴在AI
视频生成
方面的进展。感谢您的关注! 投资者:董秘,你好!根据公众号介绍,在 AI 游戏引擎 LayaAir3.1 版本中,通过模糊语音指令就可以实现数字资产的创建和细节调整。但对于sora 文生视频功能并未找到相关说明,董秘请详细说明一下公司在文生视频方面的布局及进展情况? 掌趣科技董秘:尊敬的投资者您好,公司在“AI游戏创作平台”、LayaAir游戏引擎方面的布局,是游戏工具、平台与AI技术结合的积极探索,也是后续AI相关新技术(包括文生视频等)有效的应用场景与合作伙伴,同时相关3D素材、3D引擎技术的积累也或将有助于行业内相关技术的训练或迭代。感谢您的关注! 以上内容由证券之星根据公开信息整理,由算法生成,与本站立场无关。证券之星力求但不保证该信息(包括但不限于文字、视频、音频、数据及图表)全部或者部分内容的的准确性、完整性、有效性、及时性等,如存在问题请联系我们。本文为数据整理,不对您构成任何投资建议,投资有风险,请谨慎决策。
lg
...
证券之星
2024-02-25
洲明科技:电影屏市场增长及增速受到政策、市场需求、客户资金投入等多种因素的影响
go
lg
...
。感谢您的关注! 投资者:请教下,AI
视频生成
模型对公司的虚拟拍摄会造成怎样的影响? 洲明科技董秘:您好,相关技术将进一步降低创意实现的门槛,将进一步减少虚拟拍摄前期工作的准备时间和成本投入,有望加速虚拟影棚从工业级大型专业影棚走向企业级中型影棚和民用级小型影棚。公司积极关注前沿技术进步,将紧紧把握新技术的浪潮,努力为社会、客户、股东和员工创造更多的价值,感谢您的关注! 投资者:请问Sora对公司的影响如何? 洲明科技董秘:您好,相关技术将进一步降低创意实现的门槛,将进一步减少虚拟拍摄前期工作的准备时间和成本投入,有望加速虚拟影棚从工业级大型专业影棚走向企业级中型影棚和民用级小型影棚。公司积极关注前沿技术进步,将紧紧把握新技术的浪潮,努力为社会、客户、股东和员工创造更多的价值,感谢您的关注! 以上内容由证券之星根据公开信息整理,由算法生成,与本站立场无关。证券之星力求但不保证该信息(包括但不限于文字、视频、音频、数据及图表)全部或者部分内容的的准确性、完整性、有效性、及时性等,如存在问题请联系我们。本文为数据整理,不对您构成任何投资建议,投资有风险,请谨慎决策。
lg
...
证券之星
2024-02-25
洲明科技:Sora相关技术将减少虚拟拍摄前期工作准备时间和成本
go
lg
...
针对“AI
视频生成
模型Sora对公司的虚拟拍摄会造成怎样的影响”问题,洲明科技在互动平台回复称,相关技术将进一步降低创意实现的门槛,将进一步减少虚拟拍摄前期工作的准备时间和成本投入,有望加速虚拟影棚从工业级大型专业影棚走向企业级中型影棚和民用级小型影棚。公司积极关注前沿技术进步,将紧紧把握新技术的浪潮,努力创造更多的价值。
lg
...
金融界
2024-02-25
Web3与AI的交织还能碰撞出怎样的火花?
go
lg
...
6日,OpenAI公布了最新的文本控制
视频生成
扩散模型“Sora”,通过多段涵盖的广泛视觉数据类型的高质量生成视频,展现了生成式AI的又一个里程碑时刻。不同于Pika这类AI
视频生成
工具还处于用多张图像生成几秒视频的状态,Sora通过在视频和图像的压缩潜在空间中训练,将其分解为时空位置补丁,实现了可扩展的
视频生成
。除此之外该模型还体现出了模拟物理世界和数字世界的能力,最终呈现的60秒Demo,说是“物理世界的通用模拟器”也并不为过。 而在构建方式上,Sora延续了此前GPT模型“源数据-Transformer-Diffusion-涌现”的技术路径,这意味着其发展成熟同样需要算力作为引擎,且由于视频训练所需数据量远大于文本训练的数据量,对于算力的需求还将进一步拉大。但我们在早期的文章《潜力赛道前瞻:去中心化算力市场》中已经探讨过算力在AI时代的重要性,并且随着近期AI热度的不断攀升,市面上已经有大量算力项目开始涌现,而被动受益的其它Depin项目(存储、算力等)也已经迎来一波暴涨。那么除了Depin之外,Web3与AI的交织还能碰撞出怎样的火花?这条赛道里还蕴含着怎样的机会?本文的主要目的是对过往文章的一次更新与补全,并思考AI时代下的Web3存在哪些可能。 AI发展史的三大方向 人工智能(Artificial Intelligence)是一门旨在模拟、扩展和增强人类智能的新兴科学技术。人工智能自二十世纪五六十年代诞生以来,在经历了半个多世纪的发展后,现已成为推动社会生活和各行各业变革的重要技术。在这一过程中,符号主义、连接主义和行为主义三大研究方向的相互交织发展,成为了如今AI飞速发展的基石。 符号主义(Symbolism) 亦称逻辑主义或规则主义,认为通过处理符号来模拟人类智能是可行的。这种方法通过符号来表示和操作问题领域内的对象、概念及其相互关系,并利用逻辑推理来解决问题,尤其在专家系统和知识表示方面已取得显著成就。符号主义的核心观点是智能行为可以通过对符号的操作和逻辑推理来实现,其中符号代表对现实世界的高度抽象; 连接主义(Connectionism) 或称为神经网络方法,旨在通过模仿人脑的结构和功能来实现智能。该方法通过构建由众多简单处理单元(类似神经元)组成的网络,并通过调整这些单元间的连接强度(类似突触)来实现学习。连接主义特别强调从数据中学习和泛化的能力,特别适用于模式识别、分类及连续输入输出映射问题。深度学习,作为连接主义的发展,已在图像识别、语音识别和自然语言处理等领域取得突破; 行为主义(Behaviorism) 行为主义则与仿生机器人学和自主智能系统的研究紧密相关,强调智能体能够通过与环境的交互学习。与前两者不同,行为主义不专注于模拟内部表征或思维过程,而是通过感知和行动的循环实现适应性行为。行为主义认为,智能通过与环境的动态交互、学习而展现,这种方法应用于需要在复杂和不可预测环境中行动的移动机器人和自适应控制系统中时,显得尤为有效。 尽管这三个研究方向存在本质区别,但在实际的AI研究和应用中,它们也可以相互作用和融合,共同推动AI领域的发展。 AIGC原理概述 现阶段正在经历爆炸式发展的生成式AI(Artificial Intelligence Generated Content,简称AIGC),便是对于连接主义的一种演化和应用,AIGC能够模仿人类创造力生成新颖的内容。这些模型使用大型数据集和深度学习算法进行训练,从而学习数据中存在的底层结构、关系和模式。根据用户的输入提示,生成新颖独特的输出结果,包括图像、视频、代码、音乐、设计、翻译、问题回答和文本。而目前的AIGC基本由三个要素构成:深度学习(Deep Learning,简称DL)、大数据、大规模算力。 深度学习 深度学习是机器学习(ML)的一个子领域,深度学习算法是仿照人脑建模的神经网络。例如,人脑包含数百万个相互关联的神经元,它们协同工作以学习和处理信息。同样,深度学习神经网络(或人工神经网络)是由在计算机内部协同工作的多层人工神经元组成的。人工神经元是称为节点的软件模块,它使用数学计算来处理数据。人工神经网络是使用这些节点来解决复杂问题的深度学习算法。 从层次上划分神经网络可分为输入层、隐藏层、输出层,而不同层之间连接的便是参数。 ● 输入层(Input Layer):输入层是神经网络的第一层,负责接收外部输入的数据。输入层的每个神经元对应于输入数据的一个特征。例如,在处理图像数据时,每个神经元可能对应于图像的一个像素值; ● 隐藏层(Hidden Layer):输入层处理数据并将其传递到神经网络中更远的层。这些隐藏层在不同层级处理信息,在接收新信息时调整其行为。深度学习网络有数百个隐藏层,可用于从多个不同角度分析问题。例如,你得到了一张必须分类的未知动物的图像,则可以将其与你已经认识的动物进行比较。比如通过耳朵形状、腿的数量、瞳孔的大小来判断这是什么动物。深度神经网络中的隐藏层以相同的方式工作。如果深度学习算法试图对动物图像进行分类,则其每个隐藏层都会处理动物的不同特征并尝试对其进行准确的分类; ● 输出层(Output Layer):输出层是神经网络的最后一层,负责生成网络的输出。输出层的每个神经元代表一个可能的输出类别或值。例如,在分类问题中,每个输出层神经元可能对应于一个类别,而在回归问题中,输出层可能只有一个神经元,其值表示预测结果; ● 参数:在神经网络中,不同层之间的连接由权重(Weights)和偏置(Biases)参数表示,这些参数在训练过程中被优化以使网络能够准确地识别数据中的模式和进行预测。参数的增加可以提高神经网络的模型容量,即模型能够学习和表示数据中复杂模式的能力。但相对应的是参数的增加会提升对算力的需求。 大数据 为了有效训练,神经网络通常需要大量、多样及质量高和多源的数据。它是机器学习模型训练和验证的基础。通过分析大数据,机器学习模型可以学习数据中的模式和关系,从而进行预测或分类。 大规模算力 神经网络的多层复杂结构,大量参数,大数据处理需求,迭代训练方式(在训练阶段,模型需要反复迭代,训练过程中需要对每一层计算进行前向传播和反向传播,包括激活函数的计算、损失函数的计算、梯度的计算和权重的更新),高精度计算需求,并行计算能力,优化和正则化技术以及模型评估和验证过程共同导致了其对高算力的需求。 Sora 作为OpenAI最新发布的
视频生成
AI模型,Sora代表了人工智能处理和理解多样化视觉数据能力的巨大进步。通过采用视频压缩网络和空间时间补丁技术,Sora能够将来自世界各地、不同设备拍摄的海量视觉数据转换为统一的表现形式,从而实现了对复杂视觉内容的高效处理和理解。依托于文本条件化的Diffusion模型,Sora能够根据文本提示生成与之高度匹配的视频或图片,展现出极高的创造性和适应性。 不过,尽管Sora在
视频生成
和模拟真实世界互动方面取得了突破,但仍面临一些局限性,包括物理世界模拟的准确性、长
视频生成
的一致性、复杂文本指令的理解以及训练与生成效率。并且Sora本质上还是通过OpenAI垄断级的算力和先发优势,延续“大数据-Transformer-Diffusion-涌现”这条老技术路径达成了一种暴力美学,其它AI公司依然存在着通过技术弯道超车的可能。 虽然Sora与区块链的关系并不大,但个人认为之后的一两年里。因为Sora的影响,会迫使其它高质量AI生成工具出现并快速发展,并且将辐射到Web3内的GameFi、社交、创作平台、Depin等多条赛道,所以对于Sora有个大致了解是必要的,未来的AI将如何有效的与Web3结合,也许是我们需要思考的一个重点。 AI x Web3的四大路径 如上文所诉,我们可以知道,生成式AI所需的底层基座其实只有三点:算法、数据、算力,另一方面从泛用性和生成效果来看AI是颠覆生产方式的工具。 而区块链最大的作用有两点:重构生产关系以及去中心化。所以两者碰撞所能产生的路径我个人认为有如下四种: 去中心化算力 由于过去已经写过相关文章,所以本段的主要目的是更新一下算力赛道的近况。当谈到AI时,算力永远是难以绕开的一环。AI对于算力的需求之大,在Sora诞生之后已经是难以想象了。而近期,在瑞士达沃斯2024年度世界经济论坛期间,OpenAI首席执行官山姆·奥特曼更是直言算力和能源是现阶段最大的枷锁,两者在未来的重要性甚至会等同于货币。而在随后的2月10日,山姆·奥特曼在推上发表了一个极为惊人的计划,融资7万亿美元(相当于中国23年全国GDP的40%)改写目前全球的半导体产业格局,创立一家芯片帝国。在写算力相关的文章时,我的想象力还局限在国家封锁,巨头垄断,如今一家公司就想要控制全球半导体产业真的还是挺疯狂的。 所以去中心化算力的重要性自然不言而喻,区块链的特性确实能解决目前算力极度垄断的问题,以及购置专用GPU价格昂贵的问题。从AI所需的角度来看,算力的使用可以分为推理和训练两种方向,主打训练的项目,目前还是寥寥无几,从去中心化网络需要结合神经网络设计,再到对于硬件的超高需求,注定是门槛极高且落地极难的一种方向。而推理相对来说简单很多,一方面是在去中心化网络设计上并不复杂,二是硬件和带宽需求较低,算是目前比较主流的方向。 中心化算力市场的想象空间是巨大的,常常与“万亿级”这个关键词挂钩,同时也是AI时代下最容易被频繁炒作的话题。不过从近期大量涌现的项目来看,绝大部分还是属于赶鸭子上架,蹭热度。总是高举去中心化的正确旗帜,却闭口不谈去中心化网络的低效问题。并且在设计上存在高度同质化,大量的项目非常相似(一键L2加挖矿设计),最终可能会导致一地鸡毛,这样的情况想要从传统AI赛道分一杯羹着实困难。 算法、模型协作系统 机器学习算法,是指这些算法能够从数据中学习规律和模式,并据此做出预测或决策。算法是技术密集型的,因为它们的设计和优化需要深厚的专业知识和技术创新。算法是训练AI模型的核心,它定义了数据如何被转化为有用的见解或决策。较为常见的生成式AI算法比如生成对抗网络(GAN)、变分自编码器(VAE)、转换器(Transformer),每个算法都是为了一个特定领域(比如绘画、语言识别、翻译、
视频生成
)或者说目的而生,再通过算法训练出专用的AI模型。 那么如此之多的算法和模型,都是各有千秋,我们是否能将其整合为一种能文能武的模型?近期热度高涨的Bittensor便是这个方向的领头者,通过挖矿激励的方式让不同AI模型和算法相互协作与学习,从而创作出更高效全能的AI模型。而同样以这个方向为主的还有Commune AI(代码协作)等,不过算法和模型对于现在的AI公司来说,都是自家的看门法宝,并不会随意外借。 所以AI协作生态这种叙事很新奇有趣,协作生态系统利用了区块链的优势去整合AI算法孤岛的劣势,但是否能创造出对应的价值目前尚未可知。毕竟头部AI公司的闭源算法和模型,更新迭代与整合的能力非常强,比如OpenAI发展不到两年,已从早期文本生成模型迭代到多领域生成的模型,Bittensor等项目在模型和算法所针对的领域也许要另辟蹊径。 去中心化大数据 从简单的角度来说,将私有数据用来喂AI以及对数据进行标记都是与区块链非常契合的方向,只需要注意如何防止垃圾数据以及作恶,并且数据存储上也能使FIL、AR等Depin项目受益。而从复杂的角度来说,将区块链数据用于机器学习(ML),从而解决区块链数据的可访问性也是一种有趣的方向(Giza的摸索方向之一)。 在理论上,区块链数据可随时访问,反映了整个区块链的状态。但对于区块链生态系统之外的人来说,获取这些庞大数据量并不容易。完整存储一条区块链需要丰富的专业知识和大量的专门硬件资源。为了克服访问区块链数据的挑战,行业内出现了几种解决方案。例如,RPC提供商通过API访问节点,而索引服务则通过SQL和GraphQL使数据提取变得可能,这两种方式在解决问题上发挥了关键作用。然而,这些方法存在局限性。RPC服务并不适合需要大量数据查询的高密度使用场景,经常无法满足需求。同时,尽管索引服务提供了更有结构的数据检索方式,但Web3协议的复杂性使得构建高效查询变得极其困难,有时需要编写数百甚至数千行复杂的代码。这种复杂性对于一般的数据从业者和对Web3细节了解不深的人来说是一个巨大的障碍。这些限制的累积效应凸显了需要一种更易于获取和利用区块链数据的方法,可以促进该领域更广泛的应用和创新。 那么通过ZKML(零知识证明机器学习,降低机器学习对于链的负担)结合高质量的区块链数据,也许能创造出解决区块链可访问性的数据集,而AI能大幅降低区块链数据可访问性的门槛,那么随着时间的推移,开发者、研究人员和ML领域的爱好者将能够访问到更多高质量、相关的数据集,用于构建有效和创新的解决方案。 AI赋能Dapp 自23年,ChatGPT3爆火以来,AI赋能Dapp已经是一个非常常见的方向。泛用性极广的生成式AI,可以通过API接入,从而简化且智能化分析数据平台、交易机器人、区块链百科等应用。另一方面,也可以扮演聊天机器人(比如Myshell)或者AI伴侣(Sleepless AI),甚至通过生成式AI创造链游中的NPC。但由于技术壁垒很低,大部分都是接入一个API之后进行微调,与项目本身的结合也不够完美,所以很少被人提起。 但在Sora到来之后,AI赋能GameFi(包括元宇宙)与创作平台的方向将是接下来关注的重点。因为Web3领域自下而上的特性,肯定很难诞生出一些与传统游戏或是创意公司抗衡的产品,而Sora的出现很可能会打破这一窘境(也许只用两到三年)。以Sora的Demo来看,其已具备和微短剧公司竞争的潜力,Web3活跃的社区文化也能诞生出大量有趣的Idea,而当限制条件只有想象力的时候,自下而上的行业与自上而下的传统行业之间的壁垒将被打破。 来源:金色财经
lg
...
金色财经
2024-02-24
Sora横空出世 2024或成AI+Web3变革元年?
go
lg
...
6日,OpenAI公布了最新的文本控制
视频生成
扩散模型“Sora”,通过多段涵盖的广泛视觉数据类型的高质量生成视频,展现了生成式AI的又一个里程碑时刻。不同于Pika这类AI
视频生成
工具还处于用多张图像生成几秒视频的状态,Sora通过在视频和图像的压缩潜在空间中训练,将其分解为时空位置补丁,实现了可扩展的
视频生成
。除此之外该模型还体现出了模拟物理世界和数字世界的能力,最终呈现的60秒Demo,说是“物理世界的通用模拟器”也并不为过。 而在构建方式上,Sora延续了此前GPT模型“源数据-Transformer-Diffusion-涌现”的技术路径,这意味着其发展成熟同样需要算力作为引擎,且由于视频训练所需数据量远大于文本训练的数据量,对于算力的需求还将进一步拉大。但我们在早期的文章《潜力赛道前瞻:去中心化算力市场》中已经探讨过算力在AI时代的重要性,并且随着近期AI热度的不断攀升,市面上已经有大量算力项目开始涌现,而被动受益的其它Depin项目(存储、算力等)也已经迎来一波暴涨。那么除了Depin之外,Web3与AI的交织还能碰撞出怎样的火花?这条赛道里还蕴含着怎样的机会?本文的主要目的是对过往文章的一次更新与补全,并思考AI时代下的Web3存在哪些可能。 AI发展史的三大方向 人工智能(Artificial Intelligence)是一门旨在模拟、扩展和增强人类智能的新兴科学技术。人工智能自二十世纪五六十年代诞生以来,在经历了半个多世纪的发展后,现已成为推动社会生活和各行各业变革的重要技术。在这一过程中,符号主义、连接主义和行为主义三大研究方向的相互交织发展,成为了如今AI飞速发展的基石。 符号主义 (Symbolism) 亦称逻辑主义或规则主义,认为通过处理符号来模拟人类智能是可行的。这种方法通过符号来表示和操作问题领域内的对象、概念及其相互关系,并利用逻辑推理来解决问题,尤其在专家系统和知识表示方面已取得显著成就。符号主义的核心观点是智能行为可以通过对符号的操作和逻辑推理来实现,其中符号代表对现实世界的高度抽象; 连接主义 (Connectionism) 或称为神经网络方法,旨在通过模仿人脑的结构和功能来实现智能。该方法通过构建由众多简单处理单元(类似神经元)组成的网络,并通过调整这些单元间的连接强度(类似突触)来实现学习。连接主义特别强调从数据中学习和泛化的能力,特别适用于模式识别、分类及连续输入输出映射问题。深度学习,作为连接主义的发展,已在图像识别、语音识别和自然语言处理等领域取得突破; 行为主义 (Behaviorism) 行为主义则与仿生机器人学和自主智能系统的研究紧密相关,强调智能体能够通过与环境的交互学习。与前两者不同,行为主义不专注于模拟内部表征或思维过程,而是通过感知和行动的循环实现适应性行为。行为主义认为,智能通过与环境的动态交互、学习而展现,这种方法应用于需要在复杂和不可预测环境中行动的移动机器人和自适应控制系统中时,显得尤为有效。 尽管这三个研究方向存在本质区别,但在实际的AI研究和应用中,它们也可以相互作用和融合,共同推动AI领域的发展。 AIGC原理概述 现阶段正在经历爆炸式发展的生成式AI(Artificial Intelligence Generated Content,简称AIGC),便是对于连接主义的一种演化和应用,AIGC能够模仿人类创造力生成新颖的内容。这些模型使用大型数据集和深度学习算法进行训练,从而学习数据中存在的底层结构、关系和模式。根据用户的输入提示,生成新颖独特的输出结果,包括图像、视频、代码、音乐、设计、翻译、问题回答和文本。而目前的AIGC基本由三个要素构成:深度学习(Deep Learning,简称DL)、大数据、大规模算力。 深度学习 深度学习是机器学习(ML)的一个子领域,深度学习算法是仿照人脑建模的神经网络。例如,人脑包含数百万个相互关联的神经元,它们协同工作以学习和处理信息。同样,深度学习神经网络(或人工神经网络)是由在计算机内部协同工作的多层人工神经元组成的。人工神经元是称为节点的软件模块,它使用数学计算来处理数据。人工神经网络是使用这些节点来解决复杂问题的深度学习算法。 从层次上划分神经网络可分为输入层、隐藏层、输出层,而不同层之间连接的便是参数。 输入层(Input Layer):输入层是神经网络的第一层,负责接收外部输入的数据。输入层的每个神经元对应于输入数据的一个特征。例如,在处理图像数据时,每个神经元可能对应于图像的一个像素值; 隐藏层(Hidden Layer):输入层处理数据并将其传递到神经网络中更远的层。这些隐藏层在不同层级处理信息,在接收新信息时调整其行为。深度学习网络有数百个隐藏层,可用于从多个不同角度分析问题。例如,你得到了一张必须分类的未知动物的图像,则可以将其与你已经认识的动物进行比较。比如通过耳朵形状、腿的数量、瞳孔的大小来判断这是什么动物。深度神经网络中的隐藏层以相同的方式工作。如果深度学习算法试图对动物图像进行分类,则其每个隐藏层都会处理动物的不同特征并尝试对其进行准确的分类; 输出层(Output Layer):输出层是神经网络的最后一层,负责生成网络的输出。输出层的每个神经元代表一个可能的输出类别或值。例如,在分类问题中,每个输出层神经元可能对应于一个类别,而在回归问题中,输出层可能只有一个神经元,其值表示预测结果; 参数:在神经网络中,不同层之间的连接由权重(Weights)和偏置(Biases)参数表示,这些参数在训练过程中被优化以使网络能够准确地识别数据中的模式和进行预测。参数的增加可以提高神经网络的模型容量,即模型能够学习和表示数据中复杂模式的能力。但相对应的是参数的增加会提升对算力的需求。 大数据 为了有效训练,神经网络通常需要大量、多样及质量高和多源的数据。它是机器学习模型训练和验证的基础。通过分析大数据,机器学习模型可以学习数据中的模式和关系,从而进行预测或分类。 大规模算力 神经网络的多层复杂结构,大量参数,大数据处理需求,迭代训练方式(在训练阶段,模型需要反复迭代,训练过程中需要对每一层计算进行前向传播和反向传播,包括激活函数的计算、损失函数的计算、梯度的计算和权重的更新),高精度计算需求,并行计算能力,优化和正则化技术以及模型评估和验证过程共同导致了其对高算力的需求。 Sora 作为OpenAI最新发布的
视频生成
AI模型,Sora代表了人工智能处理和理解多样化视觉数据能力的巨大进步。通过采用视频压缩网络和空间时间补丁技术,Sora能够将来自世界各地、不同设备拍摄的海量视觉数据转换为统一的表现形式,从而实现了对复杂视觉内容的高效处理和理解。依托于文本条件化的Diffusion模型,Sora能够根据文本提示生成与之高度匹配的视频或图片,展现出极高的创造性和适应性。 不过,尽管Sora在
视频生成
和模拟真实世界互动方面取得了突破,但仍面临一些局限性,包括物理世界模拟的准确性、长
视频生成
的一致性、复杂文本指令的理解以及训练与生成效率。并且Sora本质上还是通过OpenAI垄断级的算力和先发优势,延续“大数据-Transformer-Diffusion-涌现”这条老技术路径达成了一种暴力美学,其它AI公司依然存在着通过技术弯道超车的可能。 虽然Sora与区块链的关系并不大,但个人认为之后的一两年里。因为Sora的影响,会迫使其它高质量AI生成工具出现并快速发展,并且将辐射到Web3内的GameFi、社交、创作平台、Depin等多条赛道,所以对于Sora有个大致了解是必要的,未来的AI将如何有效的与Web3结合,也许是我们需要思考的一个重点。 AI x Web3的四大路径 如上文所诉,我们可以知道,生成式AI所需的底层基座其实只有三点:算法、数据、算力,另一方面从泛用性和生成效果来看AI是颠覆生产方式的工具。 而区块链最大的作用有两点:重构生产关系以及去中心化。所以两者碰撞所能产生的路径我个人认为有如下四种: 去中心化算力 由于过去已经写过相关文章,所以本段的主要目的是更新一下算力赛道的近况。当谈到AI时,算力永远是难以绕开的一环。AI对于算力的需求之大,在Sora诞生之后已经是难以想象了。而近期,在瑞士达沃斯2024年度世界经济论坛期间,OpenAI首席执行官山姆·奥特曼更是直言算力和能源是现阶段最大的枷锁,两者在未来的重要性甚至会等同于货币。而在随后的2月10日,山姆·奥特曼在推上发表了一个极为惊人的计划,融资7万亿美元(相当于中国23年全国GDP的40%)改写目前全球的半导体产业格局,创立一家芯片帝国。在写算力相关的文章时,我的想象力还局限在国家封锁,巨头垄断,如今一家公司就想要控制全球半导体产业真的还是挺疯狂的。 所以去中心化算力的重要性自然不言而喻,区块链的特性确实能解决目前算力极度垄断的问题,以及购置专用GPU价格昂贵的问题。从AI所需的角度来看,算力的使用可以分为推理和训练两种方向,主打训练的项目,目前还是寥寥无几,从去中心化网络需要结合神经网络设计,再到对于硬件的超高需求,注定是门槛极高且落地极难的一种方向。而推理相对来说简单很多,一方面是在去中心化网络设计上并不复杂,二是硬件和带宽需求较低,算是目前比较主流的方向。 中心化算力市场的想象空间是巨大的,常常与“万亿级”这个关键词挂钩,同时也是AI时代下最容易被频繁炒作的话题。不过从近期大量涌现的项目来看,绝大部分还是属于赶鸭子上架,蹭热度。总是高举去中心化的正确旗帜,却闭口不谈去中心化网络的低效问题。并且在设计上存在高度同质化,大量的项目非常相似(一键L2加挖矿设计),最终可能会导致一地鸡毛,这样的情况想要从传统AI赛道分一杯羹着实困难。 算法、模型协作系统 机器学习算法,是指这些算法能够从数据中学习规律和模式,并据此做出预测或决策。算法是技术密集型的,因为它们的设计和优化需要深厚的专业知识和技术创新。算法是训练AI模型的核心,它定义了数据如何被转化为有用的见解或决策。较为常见的生成式AI算法比如生成对抗网络(GAN)、变分自编码器(VAE)、转换器(Transformer),每个算法都是为了一个特定领域(比如绘画、语言识别、翻译、
视频生成
)或者说目的而生,再通过算法训练出专用的AI模型。 那么如此之多的算法和模型,都是各有千秋,我们是否能将其整合为一种能文能武的模型?近期热度高涨的Bittensor便是这个方向的领头者,通过挖矿激励的方式让不同AI模型和算法相互协作与学习,从而创作出更高效全能的AI模型。而同样以这个方向为主的还有Commune AI(代码协作)等,不过算法和模型对于现在的AI公司来说,都是自家的看门法宝,并不会随意外借。 所以AI协作生态这种叙事很新奇有趣,协作生态系统利用了区块链的优势去整合AI算法孤岛的劣势,但是否能创造出对应的价值目前尚未可知。毕竟头部AI公司的闭源算法和模型,更新迭代与整合的能力非常强,比如OpenAI发展不到两年,已从早期文本生成模型迭代到多领域生成的模型,Bittensor等项目在模型和算法所针对的领域也许要另辟蹊径。 去中心化大数据 从简单的角度来说,将私有数据用来喂AI以及对数据进行标记都是与区块链非常契合的方向,只需要注意如何防止垃圾数据以及作恶,并且数据存储上也能使FIL、AR等Depin项目受益。而从复杂的角度来说,将区块链数据用于机器学习(ML),从而解决区块链数据的可访问性也是一种有趣的方向(Giza的摸索方向之一)。 在理论上,区块链数据可随时访问,反映了整个区块链的状态。但对于区块链生态系统之外的人来说,获取这些庞大数据量并不容易。完整存储一条区块链需要丰富的专业知识和大量的专门硬件资源。为了克服访问区块链数据的挑战,行业内出现了几种解决方案。例如,RPC提供商通过API访问节点,而索引服务则通过SQL和GraphQL使数据提取变得可能,这两种方式在解决问题上发挥了关键作用。然而,这些方法存在局限性。RPC服务并不适合需要大量数据查询的高密度使用场景,经常无法满足需求。同时,尽管索引服务提供了更有结构的数据检索方式,但Web3协议的复杂性使得构建高效查询变得极其困难,有时需要编写数百甚至数千行复杂的代码。这种复杂性对于一般的数据从业者和对Web3细节了解不深的人来说是一个巨大的障碍。这些限制的累积效应凸显了需要一种更易于获取和利用区块链数据的方法,可以促进该领域更广泛的应用和创新。 那么通过ZKML(零知识证明机器学习,降低机器学习对于链的负担)结合高质量的区块链数据,也许能创造出解决区块链可访问性的数据集,而AI能大幅降低区块链数据可访问性的门槛,那么随着时间的推移,开发者、研究人员和ML领域的爱好者将能够访问到更多高质量、相关的数据集,用于构建有效和创新的解决方案。 AI赋能Dapp 自23年,ChatGPT3爆火以来,AI赋能Dapp已经是一个非常常见的方向。泛用性极广的生成式AI,可以通过API接入,从而简化且智能化分析数据平台、交易机器人、区块链百科等应用。另一方面,也可以扮演聊天机器人(比如Myshell)或者AI伴侣(Sleepless AI),甚至通过生成式AI创造链游中的NPC。但由于技术壁垒很低,大部分都是接入一个API之后进行微调,与项目本身的结合也不够完美,所以很少被人提起。 但在Sora到来之后,我个人认为AI赋能GameFi(包括元宇宙)与创作平台的方向将是接下来关注的重点。因为Web3领域自下而上的特性,肯定很难诞生出一些与传统游戏或是创意公司抗衡的产品,而Sora的出现很可能会打破这一窘境(也许只用两到三年)。以Sora的Demo来看,其已具备和微短剧公司竞争的潜力,Web3活跃的社区文化也能诞生出大量有趣的Idea,而当限制条件只有想象力的时候,自下而上的行业与自上而下的传统行业之间的壁垒将被打破。 结语 随着生成式AI工具的不断进步,我们未来还将经历更多划时代的“iPhone时刻”。尽管许多人对AI与Web3的结合嗤之以鼻,但实际上我认为目前的方向大多没有问题,需要解决的痛点其实只有三点,必要性、效率、契合度。两者的融合虽处于探索阶段,却并不妨碍这条赛道成为下个牛市的主流。 对新事物永远保持足够的好奇心和接纳度是我们需要必备的心态,历史上,汽车取代马车的转变瞬息之间便已成定局,亦如同铭文和过去的NFT一样,持有太多偏见只会和机遇失之交臂。 来源:金色财经
lg
...
金色财经
2024-02-23
Sora涌现:2024年会是AI+Web3革命年吗
go
lg
...
I 宣布推出名为“Sora”的最新文生
视频生成
式扩散模型,凭借其在各种视觉数据类型上生成高质量视频的能力,标志着生成式AI的另一个里程碑。与 Pika 等从多个图像生成几秒钟视频的 AI
视频生成
工具不同,Sora 在视频和图像的压缩潜在空间中进行训练,将它们分解为时空补丁,以生成可扩展的视频。此外,该模型展示了模拟物理和数字世界的能力,其 60 秒的演示被描述为“物理世界的通用模拟器”。 Sora延续了以往GPT模型中“源数据-Transformer-Diffusion-emergence”的技术路径,表明其发展成熟度也依赖于算力。鉴于视频训练所需的数据量比文本更大,其对计算能力的需求预计将进一步增加。然而,正如我们之前的文章《潜力行业前瞻:去中心化算力市场》中所讨论的那样,算力在AI时代的重要性已经被探讨,随着AI的日益普及,众多算力项目应运而生,惠及DePIN项目(存储、计算能力等),它们的价值激增。除了 DePIN之外,本文旨在更新和完善过去的讨论,思考Web3和AI交织可能产生的火花以及AI时代这一赛道中的机会。 AI发展的三大方向 AI是一门旨在模拟、延伸和增强人类智能的新兴科学技术。自20世纪50年代和60年代诞生以来,AI已经发展了半个多世纪,现已成为推动社会生活和各行业变革的关键技术。在此过程中,符号主义、联结主义、行为主义三大研究方向的交织发展,为当今人工智能的快速发展奠定了基础。 符号主义 符号主义也称为逻辑主义或基于规则的推理,认为通过符号的处理来模拟人类智能是可行的。这种方法使用符号来表示和操纵问题域内的对象、概念及其关系,并采用逻辑推理来解决问题。符号主义取得了巨大的成功,特别是在专家系统和知识表示方面。符号主义的核心思想是智能行为可以通过符号的操纵和逻辑推理来实现,其中符号代表了现实世界的高级抽象。 联结主义 或称为神经网络方法,旨在通过模仿人脑的结构和功能来实现智能。该方法构建由许多简单处理单元(类似于神经元)组成的网络,并调整这些单元(类似于突触)之间的连接强度以促进学习。连接主义强调从数据中学习和概括的能力,使其特别适合模式识别、分类和连续输入输出映射问题。深度学习作为联结主义的演变,在图像识别、语音识别、自然语言处理等领域取得了突破。 行为主义 行为主义与仿生机器人和自主智能系统的研究密切相关,强调智能体可以通过与环境的交互来学习。与前两者不同,行为主义并不注重模拟内部表征或思维过程,而是通过感知和行动的循环来实现适应性行为。行为主义认为,智能是通过与环境的动态交互和学习来体现的,这使得它对于在复杂和不可预测的环境中运行的移动机器人和自适应控制系统特别有效。 这三个研究方向虽然存在根本差异,但在AI的实际研究和应用中可以相互作用、相互融合,共同推动人工智能领域的发展。 AIGC的原则 AIGC的爆炸性发展领域代表了联结主义的演变和应用,能够通过模仿人类创造力来生成新颖的内容。这些模型使用大型数据集和深度学习算法进行训练,学习数据中的底层结构、关系和模式。根据用户提示,它们生成独特的输出,包括图像、视频、代码、音乐、设计、翻译、问题答案和文本。目前,AIGC基本上由三个要素组成:深度学习、大数据和海量计算能力。 深度学习 深度学习是机器学习的一个子领域,它采用模仿人脑神经网络的算法。例如,人脑由数百万个相互连接的神经元组成,它们一起工作来学习和处理信息。同样,深度学习神经网络(或人工神经网络)由在计算机内协同工作的多层人工神经元组成。这些人工神经元(称为节点)使用数学计算来处理数据。人工神经网络利用这些节点通过深度学习算法解决复杂问题。 神经网络分为层:输入层、隐藏层和输出层,参数连接不同层。 输入层:神经网络的第一层,负责接收外部输入数据。输入层中的每个神经元对应于输入数据的一个特征。例如,在处理图像数据时,每个神经元可能对应于图像的一个像素值。 隐藏层:输入层处理数据并将其进一步传递到网络中。这些隐藏层在不同级别处理信息,在接收新信息时调整其行为。深度学习网络有数百个隐藏层,可以从多个角度分析问题。例如,当呈现需要分类的未知动物的图像时,你可以通过检查耳朵形状、腿数量、瞳孔大小等将其与你已经知道的动物进行比较。深度神经网络中的隐藏层以类似的方式工作方式。如果深度学习算法尝试对动物图像进行分类,每个隐藏层都会处理动物的不同特征并尝试对其进行准确分类。 输出层:神经网络的最后一层,负责生成网络的输出。输出层中的每个神经元代表一个可能的输出类别或值。例如,在分类问题中,每个输出层神经元可能对应一个类别,而在回归问题中,输出层可能只有一个神经元,其值代表预测结果。 参数:在神经网络中,不同层之间的连接由权重和偏差表示,它们在训练过程中进行优化,以使网络能够准确识别数据中的模式并做出预测。增加参数可以增强神经网络的模型能力,即学习和表示数据中复杂模式的能力。然而,这也增加了对计算能力的需求。 大数据 为了进行有效的训练,神经网络通常需要大量、多样化、高质量和多源的数据。它构成了训练和验证机器学习模型的基础。通过分析大数据,机器学习模型可以学习数据中的模式和关系,从而实现预测或分类。 海量计算能力 神经网络多层结构复杂,参数众多,大数据处理要求,迭代训练方式(训练时模型需要反复迭代,涉及到每一层的前向和后向传播计算,包括激活函数计算、损失函数计算、梯度计算和权重更新)、高精度计算需求、并行计算能力、优化和正则化技术以及模型评估和验证过程共同导致了高计算能力的需求。 Sora 作为 OpenAI 最新的
视频生成
AI 模型,Sora 代表了人工智能处理和理解多样化视觉数据的能力的重大进步。通过采用视频压缩网络和时空补丁技术,Sora 可以将全球范围内不同设备捕获的海量视觉数据转换为统一的表示形式,从而实现对复杂视觉内容的高效处理和理解。利用文本条件扩散模型,Sora 可以生成与文本提示高度匹配的视频或图像,展现出高度的创造力和适应性。 然而,尽管Sora在
视频生成
和模拟现实世界交互方面取得了突破,但它仍然面临一些局限性,包括物理世界模拟的准确性、生成长视频的一致性、理解复杂的文本指令以及训练和生成的效率。本质上,Sora通过OpenAI的垄断算力和先发优势,延续了“大数据-Transformer-Diffusion-emergence”的老技术路径,实现了一种蛮力美学。其他人工智能公司仍然有通过技术创新实现超越的潜力。 虽然Sora与区块链的关系并不大,但相信未来一两年,由于Sora的影响力,其他优质的AI生成工具将会出现并迅速发展,冲击各个Web3领域如GameFi、社交平台、创意平台、Depin等。因此,对Sora有一个大致的了解是必要的,未来AI如何与Web3有效结合是一个重点考虑的问题。 AI x Web3融合的四种途径 正如前面所讨论的,我们可以理解生成式AI所需的基本要素本质上有三重:算法、数据和计算能力。另一方面,考虑到其普遍性和产出效果,AI是一种彻底改变生产方式的工具。同时,区块链最大的影响是双重的:重组生产关系和去中心化。 因此,我认为这两种技术的碰撞可以产生以下四种路径: 去中心化算力 如前所述,本节旨在更新计算能力格局的状态。谈到AI,计算能力是不可或缺的一个方面。Sora的出现,让原本难以想象的AI对算力的需求凸显出来。近日,在2024年瑞士达沃斯世界经济论坛期间,OpenAI首席执行官Sam Altman公开表示,算力和能源是当前最大的制约因素,暗示它们未来的重要性甚至可能等同于货币。随后,2月10日,Sam Altman在推特上宣布了一项令人震惊的计划,将筹集7万亿美元(相当于2023年中国GDP的40%)来彻底改革当前的全球半导体产业,旨在打造一个半导体帝国。我之前对算力的思考仅限于国家封锁和企业垄断;一家公司想要主宰全球半导体行业的想法确实很疯狂。 因此,去中心化计算能力的重要性是不言而喻的。区块链的特性确实可以解决当前计算能力极度垄断的问题,以及与获取专用 GPU 相关的昂贵成本的问题。从AI需求的角度来看,算力的使用可以分为推理和训练两个方向。专注于训练的项目还很少,因为去中心化网络需要集成神经网络设计,对硬件要求极高,是一个门槛较高、实施难度较大的方向。相比之下,推理相对简单,因为去中心化网络设计没有那么复杂,对硬件和带宽的要求也较低,是更主流的方向。 中心化算力市场想象空间广阔,常常与“万亿级”关键词联系在一起,也是AI时代最容易炒作的话题。然而,纵观最近出现的众多项目,大多数似乎都是利用趋势的考虑不周的尝试。他们经常高举去中心化的旗帜,但却避免讨论去中心化网络的低效率。另外,设计同质化程度很高,很多项目非常相似(一键L2加挖矿设计),最终可能会导致失败,很难在传统AI竞赛中占据一席之地。 算法与模型协同系统 机器学习算法是那些可以从数据中学习模式和规则,并根据它们做出预测或决策的算法。算法是技术密集型的,因为其设计和优化需要深厚的专业知识和技术创新。算法是训练人工智能模型的核心,定义了如何将数据转化为有用的见解或决策。常见的生成式 AI 算法包括生成对抗网络 (GAN)、变分自编码器 (VAE) 和 Transformers,每种算法都是针对特定领域(例如绘画、语言识别、翻译、
视频生成
)或目的而设计的,然后用于训练专门的 AI模型。 那么,这么多的算法和模型,各有千秋,是否有可能将它们整合成一个通用的模型呢?Bittensor是最近备受关注的一个项目,它通过激励不同的AI模型和算法相互协作和学习,从而创建更高效 、更有能力的AI模型,从而引领了这个方向。其他专注于这个方向的项目包括Commune AI(代码协作),但算法和模型对于AI公司来说是严格保密的,不容易共享。 因此,AI协作生态系统的叙述新颖而有趣。协作生态系统利用区块链的优势来整合孤立的AI算法的劣势,但是否能够创造相应的价值还有待观察。毕竟,拥有自主算法和模型的领先AI公司,拥有强大的更新、迭代和集成能力。例如,OpenAI 在不到两年的时间内从早期的文本生成模型发展到多领域生成模型。像 Bittensor 这样的项目可能需要在其模型和算法目标领域探索新路径。 去中心化大数据 从简单的角度来看,利用隐私数据来喂养AI和注释数据是与区块链技术非常吻合的方向,主要考虑的是如何防止垃圾数据和恶意行为。此外,数据存储可以使 FIL 和 AR 等 DePIN项目受益。从更复杂的角度来看,使用区块链数据进行机器学习来解决区块链数据的可访问性是另一个有趣的方向(Giza 的探索之一)。 理论上,区块链数据是随时可访问的,反映了整个区块链的状态。然而,对于区块链生态系统之外的人来说,访问这些大量数据并不简单。存储整个区块链需要丰富的专业知识和大量的专业硬件资源。为了克服访问区块链数据的挑战,行业内出现了多种解决方案。例如,RPC 提供商通过 API 提供节点访问,索引服务使通过 SQL 和 GraphQL 进行数据检索成为可能,在解决该问题方面发挥了至关重要的作用。然而,这些方法都有其局限性。RPC服务不适合需要大量数据查询的高密度用例,往往无法满足需求。同时,尽管索引服务提供了一种更加结构化的数据检索方式,但 Web3 协议的复杂性使得构造高效查询变得极其困难,有时需要数百甚至数千行复杂代码。这种复杂性对于一般数据从业者和那些对 Web3 细节了解有限的人来说是一个重大障碍。这些限制的累积效应凸显了需要一种更易于访问和利用的方法来获取和利用区块链数据,这可以促进该领域更广泛的应用和创新。 因此,将ZKML(零知识证明机器学习,减轻链上机器学习的负担)与高质量的区块链数据相结合,可能会创建解决区块链数据可访问性的数据集。AI可以显着降低区块链数据的访问障碍。随着时间的推移,开发人员、研究人员和机器学习爱好者可以访问更多高质量、相关的数据集,以构建有效和创新的解决方案。 AI赋能Dapp 自2023年ChatGPT3爆发以来,AI对Dapp的赋能已经成为一个非常普遍的方向。广泛适用的生成式人工智能可以通过API集成,从而简化和智能化数据平台、交易机器人、区块链百科全书和其他应用程序。另一方面,它还可以充当聊天机器人(如 Myshell)或 AI 伴侣(Sleepless AI),甚至可以使用生成式 AI 在区块链游戏中创建 NPC。但由于技术门槛较低,大多数只是集成API后的调整,与项目本身的集成并不完善,因此很少被提及。 但随着Sora的到来,我个人认为AI对GameFi(包括元宇宙)和创意平台的赋能将是未来的重点。鉴于Web3领域自下而上的性质,它不太可能生产出可以与传统游戏或创意公司竞争的产品。然而,Sora的出现可能会打破这一僵局(也许只需两到三年)。从Sora的演示来看,它有与短剧公司竞争的潜力。Web3活跃的社区文化还可以催生出大量有趣的想法,当唯一的限制就是想象力时,自下而上的行业与自上而下的传统行业之间的壁垒将被打破。 结论 随着生成式人工智能工具的不断发展,未来我们将见证更多突破性的“iPhone时刻”。尽管人们对AI与Web3的整合持怀疑态度,但我相信目前的方向基本上是正确的,只需要解决三个主要痛点:必要性、效率和契合度。虽然这两者的融合还处于探索阶段,但并不妨碍这条路径成为下一次牛市的主流。 对新事物保持足够的好奇心和开放的态度是我们的基本心态。从历史上看,从马车到汽车的转变是瞬间解决的,正如铭文和过去的 NFT 所显示的那样。持有太多偏见只会导致错失机会。 来源:金色财经
lg
...
金色财经
2024-02-23
云鼎科技(000409.SZ):公司正积极探索多模态AI在能源行业中的应用
go
lg
...
司注意到近期OpenAI推出的Sora
视频生成
大模型,公司也将结合自身业务实际,积极拓展
视频生成
等AI能力,助力公司业务发展。 以上内容与数据,与界面有连云频道立场无关,不构成投资建议。据此操作,风险自担。
lg
...
有连云
2024-02-23
消息称谷歌VideoPoet项目负责人蒋路已加入TikTok
go
lg
...
t是谷歌在2023年12月30日发布的
视频生成
模型,类似于OpenAI最近发布的
视频生成
模型Sora。
lg
...
金融界
2024-02-23
Sora爆火后如何识别AI造假 这家融资1亿元的以色列公司或成新独角兽
go
lg
...
至超越了之前的Runway和Pika等
视频生成
工具。而就在昨晚,谷歌开源了Gemma大模型,能够在笔记本电脑上轻松运行,这意味着普通人现在也可以轻松接触到AI技术。 然而,技术的迅猛更迭也带来了更多人对于“深度伪造”的恐慌。由AI生成的图片和视频足以迷惑肉眼,让人真假难辨。 早在1月底,美国流行歌手“霉霉”就因为AI“不雅照”事件引发了轩然大波,甚至引起了白宫的关注。更有甚者,香港一家跨国公司被AI诈骗团伙伪造其高管参会,损失惨重达1.8亿人民币。 为了缓解个人和企业对AI安全性的担忧,Clarity这家AI网络安全初创公司应运而生。凭借独特的专利算法和前沿技术,Clarity能够精准识别并打击深度造假行为,确保网络信息的真实性和可信度。 Clarity不仅旨在帮助更多人避免成为AI技术滥用的“牺牲品”,更希望为整个行业的健康发展注入新的活力。 01.1分钟项目速览 1.项目名称者:Clarity 2.成立时间:2022年 3.产品简介: Clarity是一个打击深度造假的AI检测平台。利用专利算法,Clarity能精确检测视频、图像和音频中的篡改,并通过加密水印确保内容真实。各大组织通过集成Clarity的解决方案,能够加强其对数字欺骗的防御能力,从而全面保障内容与资产的安全。 4.创始人团队: Michael Matias 曾在斯坦福大学学习AI,曾担任以色列“8200情报部队”官员,同时也是70多家深度技术初创企业的天使投资人。 Natalie Fridman 计算机科学博士,巴伊兰大学计算机科学讲师。 Gil Avriel 毕业于哈佛大学肯尼迪学院和乔治敦法学院(第一名),曾在以色列总理办公室国家安全委员会担任高级主管(14 年)。 5.融资情况: 2024年2月,Clarity获得了由Walden Catalyst Ventures和Bessemer Venture Partners领投的1600万美元种子投资。 02.群英荟萃,对深度伪造“重锤出击” 随着AI技术的发展,深度伪造(Deepfakes)也随之而来。 Pew Research最近的一项调查发现,66%的美国人表示,他们“至少有时”会遇到被篡改或者完全虚构的内容;63%的人表示,捏造或更改的图像或视频会导致人们对于时事的“认知混乱”。 美联社和芝加哥大学的另一项民意调查则发现,58%的成年人认为AI工具将导致选举错误信息。据估计,到2026年,90%的在线内容将由AI生成。 由于创建深度伪造所需的工具越来越容易获得、价格越来越便宜,虚假照片、视频现已如洪水般泛滥。在AI生成内容的时代,新闻的真实性和可信度受到了极大的挑战。 快速识别和消灭“病毒” 网络安全初创公司Clarity最近筹集了1600万美元(折合成人民币约为1.15亿元)的风险投资资金来对深度伪造进行反击。这家总部位于纽约的公司使用AI来识别深度伪造创建中常见的模式,使企业能够快速识别和防范虚假内容。 尽管Clarity的核心利用了AI技术,但它在本质上仍是一家网络安全公司。 与其他网络安全供应商一样,Clarity通过应用程序及其接口来提供扫描工具,该工具利用经过训练的多个AI模型来识别视频、图像和音频深层创建技术中的模式。此外,Clarity还提供了一种水印形式,客户可以用它来表明自己的内容是合法的。 谈到和其竞争对手的区别时,Clarity首席执行官Michael Matias表示,差异化因素并不在于表面,而隐藏于产品内核之中,即Clarity对新型深度伪造的快速反应。 Clarity将深度伪造视为能够迅速分叉和复制的“病毒”,因此,它的解决方案也是为了分叉和复制而构建的,以保持适应性和弹性。公司团队还专门建立了相应的基础设施和AI模型,以完美达到这一要求。 众多大佬云集 尽管Clarity目前仅有13名员工,但该公司的创始人团队资历非常雄厚。 首席执行官:Michael Matias Matias曾在以色列“8200情报部队”担任一级干事,并创建了两个获得国防奖的AI团队。随后,Matias在斯坦福大学学习AI,并在Hippo Insurance领导AI团队。他是70多家深度技术初创企业的天使投资人,也曾是多家风险投资公司的投资团队成员。 首席技术官:Natalie Fridman Fridman在AI和研究领域拥有10多年的管理经验,擅长集体智能、深度学习和自主代理建模。Fridman曾任ImageSat International研发高级副总裁(从成立到上市),拥有AI和集体智能博士学位。她发表过超过25篇论文,曾是巴伊兰大学计算机科学的主要讲师,拥有多项AI算法专利。 首席战略官兼首席运营官:Gil Avriel Avriel毕业于哈佛大学肯尼迪学院和乔治敦法学院(第一名),曾在以色列总理办公室国家安全委员会担任高级主管(14 年)。在担任国家安全委员会法律顾问期间,曾就国家安全战略问题为8位国家安全顾问和4位总理提供咨询。 除了卓越的创始人团队,Clarity的顾问委员会成员也都是来自各个行业的顶尖专家,包括斯坦福大学民主学教授Larry Diamond、加拿大前国防部长Irwin Cotler以及前谷歌研究副总裁Alfred Spector等。 03.各行业联手清除造假“迷雾” AI模型迭代更新,深度伪造技术也在做进一步的提升,这类技术的复杂性已经让人们很难区分真实与捏造的内容。 “我们的数字生活正遭受着猛烈攻击,人们说了他们从未说过的话,做了他们从未做过的事情。”Clarity的联合创始人兼首席执行官Michael Matias在一份声明中表示。 一年前,大多数关于“AI欺诈”的新闻还几乎来自大学研究实验室;一年后,有关AI造假的问题已经充斥在我们的生活中。 短短一年时间里,涌现出了一大波文生图像、视频以及语音克隆模型,例如本月ElevenLabs宣布为Sora推出音效模型,可以自动为视频配音。 这些AI应用在不知不觉中“帮助”恶意行为者利用广泛且免费的工具快速生成深度伪造内容。 “随着语音克隆和其他AI骗局的增加,保护美国人免受冒充者欺诈比以往任何时候都更加重要,”美国联邦贸易委员会(FTC)主席Lina M. Khan在一份声明中提到。 为了弥补这一行业漏洞,检测深度伪造的初创公司正在涌现并不断壮大,并吸引了大量风险投资。 众多深度伪造检测公司,目前正在竞相开发深度伪造检测工具。除了Clarity外,还包括AI浏览器工具Reality Defender以及专注于深度伪造图像和视频的Sentinel公司。 Reality Defender主要提供了一个帮助检测文本、视频和图像深度伪造的平台,可以验证社媒内容是否由AI生成或者以某种方式修改。另外,该公司在去年10月获得由DCVC领投的1500万美元A轮融资,将用于扩大团队并改进其AI内容检测模型。 站在解决AI深度伪造问题的风口上,不少投资人对Clarity持有相当乐观的态度。美国有线电视新闻网(CNN)前战略主管Chris Marlin,作为一名天使投资人的他表示,“生成式AI制作的内容和深度伪造的激增有可能造成更大的选民不信任。” 在1月末,美国总统大选就出现了AI造假问题,有人用AI冒充拜登给选民打电话并且影响了大选的讨论。此外,美国其他州的选举也受到AI伪造的干扰。 Clarity将致力于解决这些问题,正如Chris Marlin强调,“Clarity的技术将清除不确定性的迷雾,为选民和政治领导人提供更好的清晰度。” 斯坦福大学社会学和政治学教授,Larry Diamond也曾表示,“我们很高兴能与Clarity合作,并提供一个可扩展且值得信赖的平台,任何组织都可以用它来验证敏感新闻、防止欺诈并建立一个安全的AI环境。” 04.Clarity身兼长期发展使命 在被AI裹挟的大环境下,如果呼吁监管和立法无法在短期内实现,快速识别和解决深度伪造不失为当前的一个良方。 正如Clarity首席执行官Matias所说,“这是一场快节奏的军备竞赛,任何想要解决深度伪造问题的公司都需要像那些创建和传播深度伪造的公司一样快速行动。” 目前,Clarity正在与以色列政府以及一些大型新闻机构合作,而最新的这笔融资将推动Clarity的扩张计划,使该公司能够加大招聘力度,进一步开发其技术,并在美国市场建立更强大的影响力。 参考链接: 1.https://www.getclarity.ai/ 2.https://techcrunch.com/2024/02/15/clarity-raises-16m-to-fight-deepfakes-through-detection/ 【声明】:未经允许严禁转载,如需转载请联系我们,文章版权和最终解释权归元宇宙之心所有。 来源:金色财经
lg
...
金色财经
2024-02-23
上一页
1
•••
22
23
24
25
26
•••
41
下一页
24小时热点
特朗普突然扔下“重磅炸弹”!中概股暴跌 阿里巴巴狂泻10% 究竟发生了什么
lg
...
突发语出惊人!普京支持与习近平、特朗普“砍半”军防 美国可共享稀土开采权
lg
...
全球吓了一跳,特朗普突发对中国大规模攻势!比特币失守9万,英伟达财报逼近
lg
...
特朗普突然对中国实施“新制裁”!黄金2951继续升高 比特币崩跌9.2万遇贸易战压境
lg
...
市场突传重大利空!比特币崩跌、Solana熄火价格腰斩 做市商罕见提前解锁代币
lg
...
最新话题
更多
#SFFE2030--FX168“可持续发展金融企业”评选#
lg
...
19讨论
#链上风云#
lg
...
60讨论
#VIP会员尊享#
lg
...
1756讨论
#比特币最新消息#
lg
...
908讨论
#CES 2025国际消费电子展#
lg
...
21讨论