全球数字财富领导者
CoNET
|
客户端
|
旧版
|
北美站
|
FX168 全球视野 中文财经
首页
资讯
速递
行情
日历
数据
社区
视频
直播
点评旗舰店
商品
财富汇
登录 / 注册
搜 索
综合
行情
速递
日历
话题
168人气号
文章
GPT-4将在下周发布 必应日活破亿 谷歌还有招架之力吗
go
lg
...
握类ChatGPT技术两年,却被微软和
OpenAI
步步抢先,正在逐渐失去自己曾经制霸的领土。谷歌的故事,值得所有人深思。 最近,微软是喜讯连连。 昨天,微软德国CTO在活动中透露,GPT-4将在下周发布,将提供多模态模型。 毫无疑问,微软要搞个大的——GPT-4将转向多模态,Kosmos-1也是多模态,微软亚研院3月8日提出的Visual ChatGPT,也把视觉基础模型整合进ChatGPT里。 在其他方面,今天微软官宣ChatGPT正式整合进Azure中。 另外,就在昨天,必应的日活用户数在史上首次破亿。 毫无疑问,这完全是ChatGPT的功劳。整合进ChatGPT后,必应势如破竹。而谷歌的搜索引擎市场,正在被这个可怕的对手一点点蚕食。 2月8日,微软宣布ChatGPT整合进必应后,谷歌的使用率跌惨了 而微软的野心不止于此,它不止想要撼动谷歌搜索引擎的市场,还希望把ChatGPT整合进各个软件生态中,建起一个办公软件帝国。 谷歌两年前就可以走的路,被微软提前走了,现在,谷歌只能接受现状——自己被微软打得满地找头,疆土尽失。 在社交网络上,网友纷纷留言:RIP Google。 GPT-4下周发布,还是多模态的 微软最近的连环组合拳,简直把谷歌打懵了。 3月9日,微软德国CTO Andreas Braun在一场名为「AI in Focus - Digital Kickoff」的活动中表示:GPT-4,将于下周问世! 果然,
OpenAI
的效率不会令人失望。 尽管许多技术消息还在保密,但一个关键细节已经被透露:GPT-4将是多模态的。 一个多模态的语言模型,这意味着什么? 微软德国公司的技术总监Andreas Braun表示,「有了GPT-4,AI就有可能生成文本、图像甚至视频。」而以前版本的ChatGPT只能够生成文本。」 GPT-4作为多模态语言的另一个强大功能在于,它可以管理不同语言的数据输入和输出。 比方说,你可以用西班牙语对ChatGPT提出要求,而得到的生成文本是英语。显然,这种新奇的东西对翻译工具也会有很大的帮助。 Braun将GPT-4描述为人工智能领域的游戏规则改变者,它将向着拥有人类的解释能力这一目标更进一步。 显然,网友对GPT-4的发布充满期待。 有网友还做了一张GPT-4和GPT-3参数对比图。
OpenAI
创始人Sam Altman此前曾表示,GPT-4仍然将是纯文本模式,且训练参数不会比GPT-3高出太多,因为研发的重点将放在如何提升利用现有数据的能力上。 纽约时报曾猜测,微软必应所增加的聊天功能很有可能就是由GPT-4驱动的。 一次
OpenAI
内部采访中,其中提到了
OpenAI
现在用了微软一半的算力,2.8万张A100。在2022年,就花费了4-5亿美元,今年预期要亏损20多亿美元。 其中还提到了,在有隐私限制及其他不能用
OpenAI
API的场景,底层算力大型的提升非常重要。 对于新一代GPT能否帮助
OpenAI
节省算力,也值得我们拭目以待。 当然也有人表示担忧,飞速发展的AI是否会开启人类的末日? 不过微软的人重申,ChatGPT给人们日常生活带来的影响与十多年前的iPhone相似。 由Saya Nadella领导的公司也明确表示,GPT-4不是来抢人饭碗的,而是帮助人类简化工作、提升质量。 高调官宣:必应日活首次破亿 而在3月8日,ChatGPT版必应的日活用户数在历史上首次突破了1亿,这距离它在2月8号的发布,正好一个月。 前有ChatGPT用时俩月月活破亿,今有ChatGPT版必应用时一月日活破亿,微软真的是在不断创造奇迹。 现在,每天有1/3的预览版用户都在使用ChatGPT版必应,而且自推出以来,用户已经和必应进行了4500万次聊天。 博文地址:https://blogs.bing.com/search/march_2023/The-New-Bing-and-Edge-%E2%80%93-Momentum-from-Our-First-Month/ 虽然必应的市场份额与谷歌相比还差得多,但在经历了长达数年的疲软之后,微软对这次的增长还是非常满意的。 副总裁Yusef Mehdi在最新的博文中表示:「我们很高兴与大家分享,经过几年的稳步发展,再加上100多万新的必应预览用户的一点点推动,我们的必应日活跃用户已经突破了1亿。」 除此之外,随着新的应用程序的推出,必应在移动端的日活用户也增加了6倍。 顺便,微软再再再次放宽了ChatGPT版必应聊天限制——每天120轮对话,每轮10句。 前几周,微软刚刚制定了计划,要在价值约5000亿美元的数字广告市场上,进一步增加收入。 微软财务副总裁Philippe Ockenden在上个月与分析师的电话会议上说:「搜索广告市场的份额每增加1个点,我们的广告业务就有20亿美元的收入机会。」 在过去的12个月里,微软的广告业务收入已经增长到180亿美元,而上一财年为100亿美元。 这个成就在很大程度上要归功于必应,但要接近谷歌2022年超过2000亿美元的广告收入,微软仍有很长的路要走。 但对微软来说,这是一个从谷歌那里抢占市场份额、虎口夺食的最好机会。 ChatGPT正式加入Azure
OpenAI
,同时还有GPT-3.5、Dall-E 2 除了搜索引擎,ChatGPT也被微软火速整进了云平台Azure中。 今年1月中旬,纳德拉就曾预告,微软即将在Azure中整合进ChatGPT。 微软说到做到,这才不到俩月,就正式完成了。 北美时间3月9日,微软在官方博客宣布,ChatGPT已被正式整合进Azure Open AI服务中,现在是预览版。 (体验地址:https://azure.microsoft.com/en-in/products/cognitive-services/
openai
-service/) 这意味着,企业和个人开发者现在都可以借助Azure
OpenAI
服务,用上最先进的AI模型,包括Dall-E 2、GPT-3.5、Codex等。 比如GitHub Copilot通过Azure
OpenAI
服务中的Codex模型,能帮开发者自动生成代码。 使用Power Platform中的Co-pilot,用户能够编写Power Fx命令,甚至实现自动化流程 Microsoft Teams Premium通过GPT-3.5模型打造了「智能回顾」功能,可以自动生成会议记录、笔记、实时翻译等。 Microsoft Viva Sales通过GPT-3.5模型提升了销售效率,可自动生成邮件内容、生成个性化销售文案等。 Azure
OpenAI
Studio的无代码开发模式,能让企业和开发者快速开发智能应用程序和解决方案。 在设计软件中,Azure
OpenAI
使用了DALL·E 2模型,在提示栏中不断明确自己的要求,软件就会生成越来越符合用户要求的图像 其实前几天,微软就已宣布低代码应用平台Power Platform整合进ChatGPT,开发者可以使用最少的代码创建应用程序。链接 借助Azure
OpenAI
服务中的ChatGPT预览版,企业和开发者可以把它的功能直接集成到应用产品中,私人定制自己的ChatGPT,提供个性化客户服务,生成个性化营销文案,建立企业级智能化知识库搜索引擎等。 技术公司可以快速将机器人连接到不同的产品,支持知识库和常见问题解答,在不编写任何代码的前提下,就能为客户提供支持 微软的办公软件帝国,眼看要成形了。 谷歌埋葬了自己 其实,谷歌不是没有这样的机会。 据华尔街日报称,几年前,2名前谷歌工程师曾push高管向公众发布ChatGPT类似聊天机器人,但直接被毙掉了。 原因很简单,不安全。 可以说,谷歌高管们谨慎的态度把自家的前程给葬了。 2018年,谷歌研究工程师Daniel De Freitas开始从事一个人工智能副项目,目标是创建一个模仿人类说话方式的对话聊天机器人。 谷歌人工智能研究部门的软件工程师Noam Shazeer后来加入了该项目。 当时,De Freitas和Shazeer建立的聊天机器人称为「Meena」,随后便更名了,也就是现在的LaMDA。 Meena能够哲学辩论、随意谈论电视节目、还能做双关。当时,他们相信Meena可以从根本上改变人们在网上搜索的方式。 他们多次尝试将聊天机器人对外公布,将聊天功能添加到Google Assistant,并向公众推出演示。 不幸的是,谷歌高管表示,聊天机器人不遵守其AI安全和公平标准,推出机聊天器人的计划便陷入了僵局。 高管们的反应,让De Freitas和Shazeer非常失望。因此,他们在2021年底离开谷歌创办了自己的公司,尽管谷歌CEO皮查伊亲自要求他们留下来继续从事聊天机器人的工作。 他们成立的这家公司名为Character.Ai,并在此后发布了一个聊天机器人,可以扮演埃隆马斯克或任天堂的马里奥等人物。 Shazeer上个月在接受采访时表示,这在谷歌内部引起了一些轰动。但最终我们决定,作为一家初创公司,我们可能会有更多的运气推出产品。 谷歌对人工智能采取小心谨慎的态度并不是什么新鲜事儿了。自2012年以来,这家公司一直在阻挠其人工智能工作。 2012年,谷歌聘请了计算机科学家Ray Kurzweil来研究其语言处理模型。大约一年后,谷歌收购了英国人工智能公司DeepMind,该公司旨在创建通用人工智能。 然而,出于对大规模监控的道德担忧,学者和技术专家推迟了使用这项技术,谷歌对限制其使用人工智能的方式做出了承诺。 2018年,由于员工的强烈反对,谷歌宣布终止将其人工智能技术用于军事武器的项目。 尽管谷歌Bard聊天机器人在上个月的第一次公开演示中犯下一个事实错误后,导致谷歌股价大跌。 但谷歌的人工智能计划现在可能终于看到了曙光。 Alphabet董事长John Hennessy认为,谷歌的聊天机器人还没有真正为产品做好准备。CE皮查伊要求所有谷歌员工花两到四个小时的时间帮助测试产品,以便为发布做好准备。 皮查伊在二月份的一份备忘录中写信给谷歌员工: 我知道这一刻令人不安地兴奋,这是意料之中的。底层技术正在迅速发展,潜力巨大。我们现在能做的最重要的事情是专注于构建一个伟大的产品并负责任地开发它。 17年,谷歌提出了Transformer,为如今大语言模型的种种繁荣景象夯实了基础,然而,谷歌自己却没能把握住时代的命脉,自己制霸多年的搜索引擎和办公软件市场,现在眼看就要被微软偷家。 一个太过谨慎的巨头,是怎样被锐意进取、打法创新的对手击败的? 这个故事值得我们深思。 参考资料: https://www.theverge.com/2023/3/9/23631912/microsoft-bing-100-million-daily-active-users-milestone https://www.gearrice.com/update/gpt-4-will-arrive-next-week-and-will-be-multimodal/ https://www.businessinsider.com/google-ai-chatbot-chatgpt-years-ago-execs-shut-down-report-2023-3 来源:新智元、DeFi之道 原标题:《GPT-4下周王者登基!必应日活破亿,谷歌已被打残》 来源:金色财经
lg
...
金色财经
2023-03-12
年薪百万 只需陪聊 ChatGPT 正在带起一种很新的职业
go
lg
...
程师,写提示词已经成了一门手艺,还被
OpenAI
的 CEO Sam Altman 看好: 为聊天机器人编写一个非常棒的 prompt,是一项惊人的技能,也是使用少量自然语言进行编程的早期案例。 只要和 AI 搭边的行业,都在向提示工程师抛出橄榄枝。 自由职业者工作平台 Upwork 开出每小时 40 美元的薪酬,请提示工程师生成博客文章和常见问题解答等网站内容。 看似和 AI 八竿子打不着的波士顿儿童医院,也打算招募 AI 提示工程师,负责编写分析医疗保健数据的脚本,白纸黑字征集跨学科人才: 理想的候选人应具有人工智能 / 机器学习、数据科学和自然语言处理方面的深厚背景,以及医疗保健研究和运营方面的经验。 由前
OpenAI
员工联合创立、被 Google 投资的 AI 初创企业 Anthropic,最近也在旧金山招募提示工程师,年薪高达 17.5 万到 33.5 万美元,换算成人民币就是百万年薪,这一岗位负责的主要内容是: 找出提示我们的 AI 完成各种任务的最佳方法,然后记录这些方法,构建一个工具库和一组教程,使其他人可以学习提示工程或简单地找到理想的提示词。 具体要求如下,其中硬性要求有 2 项:了解大型语言模型的架构、掌握基本的编程技能。 可见风口并不等人,这项工作已经越来越专业和细分,就像随便生成一幅画作不算什么,你要画得更符合甲方要求。 就算不做全职,兼职的口子也开好了。Krea、PromptBase、PromptHero 和 Promptist 等买卖提示词的平台已经出现,将提示词这门生意真正商业化。 这些平台晒出了大量 AI 生成的艺术品,你可以选择你喜欢的风格。如果没有中意的,有些卖家还提供一对一聊天和自定义提示词服务。 它们的商业模式也并不复杂,采取抽成的形式。 去年 6 月上线的 PromptBase,提供 DALL·E、GPT-3、Midjourney、Stable Diffusion、ChatGPT 等生成式 AI 的提示词,售价多为 1.99 到 4.99 美元,也有少数在 9.99 美元,平台向提示词创作者抽成 20%。 不过在民间,免费的「ChatGPT 指令大全」等指南也在广为流传,它们提供精炼过的提示词,让你充分发挥 ChatGPT 的强大功能,这种感觉就像在游戏里帮你设置好了预设队伍。 是科学还是「占卜」 提示工程师的前途看起来一片光明,但也有人持反对意见。 华盛顿大学语言学教授 Shane Steinert-Threlkeld 认为,提示工程师实际上无法预测 AI 会说什么。 这不是一门科学。我们只不过用不同的方法捉弄熊,看它如何咆哮回来。 AI 艺术家 Xe Iaso 甚至直言: 我也不太清楚为什么人们会把 prompt 称为「工程」,我个人更愿意把它称为「占卜」。 作为一个普通 AI 用户,我也有着类似的体会:当我每次使用 AI 生成文字或图片时,总感觉像是开盲盒。 因为 ChatGPT 等生成式 AI 是不可预测的,它们生成的内容其实是概率计算的结果,简单来说,就是我们在 ChatGPT 输入文字,模型给出一个最可能的下文。所以,AI 有时候也会出错,生成不连贯甚至错误的回答。 在 AI 这个不可捉摸的「黑箱」里,还可能有着不为人所知的潜规则,就连研究人员也无法弄明白。 比如在用 AI 制图时,各种单词可能有不同的权重,但这个也要不断试验才能知道。 先来猜一猜,「一幅非常漂亮的画,山旁有瀑布」和「一幅非常非常非常非常漂亮的画,山旁有瀑布」这两个提示,哪个用 DALL-E 2 输出的结果会更好? 答案是后面一个。麻省理工学院副教授 Phillip Isola 发现,「very」这个词被赋予了很高的权重。 面对 AI 这等庞然巨物,我们仍然在盲人摸象。 也有观点认为,不必再吵了,提示工程师存在的前提是 AI 还不够「聪明」。如果 AI 再发展下去,更好地理解人类的意图,可能人人就是所谓的提示工程师了。 唯一确定的是,AI 发展的速度永远不会让你失望。 文字生成 AI 和图片生成 AI 的「强强联合」,已经替代了提示工程师的一部分工作。 比如 ChatGPT 被拿来与 Stable Diffusion 联动:用 ChatGPT 形成一段符合自己要求的文字,再把文字输入给 Stable Diffusion,生成的作品一般比自己直接输入好看很多。 同事用 ChatGPT 生成提示词. 这可能是因为 AI 之间的「脑回路」更接近,ChatGPT 的描述也更细致,更容易被提取。 作为使用 AI 的普通用户,我们不必像提示工程师那么专业,但可以有意识地培养这种思维。 宾夕法尼亚大学沃顿商学院教授 Ethan Mollick,曾经要求他的学生仅用 AI 撰写短论文,其实他真正想强调的是,如何更好地输入提示词。 如果只是输入简单的提示词,让 AI 写关于某个主题的 5 段话,内容无趣,文字也很平庸。 但当学生们和 AI 合作,让 AI 对论文多次修改,比如抛弃无用的短语、加入生动的细节、修改结尾的情感色彩,就能让论文增色不少。 所以,如果 AI 就是未来互联网的交互界面、新的个人计算机,那么不如开始得更早一些,学习如何和它聊天。正如英国营销公司 Ladder 创始人 Michael Taylor 所说: 当你可以创造任何你想要的东西时,你能多准确地表达「那是什么」的能力就变得很重要。 撰文:张成晨 来源:爱范儿、DeFi之道 来源:金色财经
lg
...
金色财经
2023-03-11
美股开盘:道指跌近50点 中概股及科技股走高B站涨近3%
go
lg
...
视频 微软德国分公司的CTO宣布,
OpenAI
下周将发布GPT4.0,其中包括多模态的模型。“我们将在下周推出GPT-4,在那里我们将有多模态模型,将提供完全不同的可能性,例如视频”布劳恩说。 特斯拉墨西哥超级工厂已开启招聘,有望两个月内动工 特斯拉已开始为墨西哥蒙特雷(Monterrey)附近的超级工厂开始招聘,招聘岗位包括管理顾问、建筑安全经理、财务分析师和物流专家等。公司此前已宣布,计划在那里生产下一代汽车。此前,墨西哥总统洛佩斯发文称,他与特斯拉董事和技术人员会面,讨论将在新莱昂州建造的电动汽车工厂事宜,表示已在该厂和其他项目方面取得进展,特斯拉在墨西哥的超级工厂将在两个月内动工。 特斯拉正尝试将干式电极涂层工艺用于4680电池生产 据报道,特斯拉正尝试将一种名为干式电极涂层的新电池制造工艺用于4680电池生产。特斯拉在2019年通过收购加州初创公司Maxwell Technologies获得了该工艺。特斯拉此前表示,干式涂层工艺有可能大幅减少电池制造厂的规模、成本、能耗和生产周期,同时提高电池单元的能量密度和功率。 甲骨文第三财季净利润同比下降18% 甲骨文发布了该公司的2023财年第三财季财报。报告显示,甲骨文第三财季总营收为123.98亿美元,与去年同期的105.13亿美元相比增长18%,不计入汇率变动的影响为同比增长21%;净利润为18.96亿美元,与去年同期的23.19亿美元相比下降18%。甲骨文备受关注的云业务营收同比增长45%,至41亿美元,但增速未能达到市场预期。 DocuSign Q4业绩、Q1营收指引均超预期 DocuSign发布业绩,第四季度营收6.6亿美元,超预期的6.3亿美元;调整后每股盈余0.65美元,超预期的0.52美元。公司预计第一季度营收6.39-6.43亿美元,其中值超预期6.4亿美元;2024财年营收26.95-27.07亿美元,其中值超预期的26.9亿美元。公司CFO Cynthia Gaylor将于接下来几个月离职。 通用汽车向受薪员工提供买断计划,以加速推进裁员 通用汽车表示,将为大部分受薪员工提供买断,并预计将收取高达15亿美元的税前费用来覆盖成本。通用汽车称,根据裁员计划的条款,所有在美国工作至少五年的受薪员工和所有在全球工作至少两年的高管,都将获得一次性付款和其他离职补偿。通用汽车首席执行官玛丽·巴拉在一份给员工的备忘录中表示,通用汽车正在概述“降低结构性成本的最大机会”,包括“降低汽车复杂性,扩大现有内燃机和未来电动汽车项目之间共享子系统的使用”。 百度计划于3月16日14时召开新闻发布会,主题围绕文心一言 据百度官方微博消息,百度计划于3月16日14时在北京总部召开新闻发布会,主题围绕文心一言。百度创始人、董事长兼首席执行官李彦宏,百度首席技术官王海峰将出席。 雾芯科技:去年第四季度营收下降超八成 雾芯科技发布财报,2022年Q4财报实现营收4929.7万美元,前值为2.988亿美元,销售额同比下降了83.50%。不按美国通用会计准则(Non-GAAP),去年第四季度实现净利润为2.497亿元人民币,前年同期净利润为5.365亿元人民币。去年10月1日开始,国内电子烟开始实施新国标限制果味电子烟,随后还开始征收消费税。 台积电2月净收入约1631.7亿新台币,同比增加11.1% 台积电公布,该公司2月的净收入约为1631.7亿新台币,环比减少18.4%,同比增加11.1%。2023年前2个月收入总计3632.3亿新台币,较2022年同期增加了13.8%。
lg
...
金融界
2023-03-10
AIGC 行业专题报告:从 AI 技术演进看 AIGC
go
lg
...
DVD-GAN 模型。2021 年,
OpenAI
推出了 DALL-E,并于2022 年将其升级为DALL-E-2。该产品主要生成文本与图像的交互内容,可根据用户输入的简短描述性文字,得到极高质量的卡通、写实、抽象等风格的图像绘画作品。 爆发与破圈阶段(2022-至今):2022 年以来,AIGC 产品密集发布,ChatGPT爆火出圈。Google 于 2022 年五月推出了文本图像生成模型lmagen,同年8月,开源 AI 绘画工具 StableDiffusion 发布;2022 年 9 月,Meta 推出可利用文字生成视频的产品 Make-A-Video 以推动其视频生态的发展。2022 年11 月30 日,OpenAl推出 AI 聊天机器人 ChatGPT,AIGC 的内容产出能力迅速吸引大批用户,至2022年 12 月 5 日,根据
OpenAI
创始人表示,ChatGPT 用户数已突破100 万。2023年2 月,微软宣布推出由 ChatGPT 支持的新版本 Bing 搜索引擎和Edge 浏览器,AIGC与传统工具进入深度融合历程。 算力与数据皆备、大模型加速 AIGC 技术导入,应用创新、场景落地渐行渐近 深度模型的进步与创新奠定 AIGC 走向成熟的基础。就底层技术而言,不断创新的生成算法、预训练模型、多模态等技术是 AIGC 行业发展的前提,以此为基础AIGC在自动化内容生成上具备了通用性、基础性多模态、参数多、训练数据量大、生成内容高质稳定等特征优势。 预训练模型进一步打开了 AIGC 的技术和商业化可能。以往的生成模型存在使用门槛高、训练成本高、内容生成简单和质量偏低等劣势,而真实内容消费场景具备灵活多变、高精度、高质量等痛点要求。预训练模型的出现通过提高AIGC技术能力解决了上述问题。AI 预训练模型。即大模型、基础模型(FoundationModel),其基于大量数据与巨量参数的模型,可适应下游广泛任务并显著提高各种下游任务的性能。AIGC 进入预训练模型时代以 2018 年谷歌发布基于Transformer机器学习方法的自然语言处理预训练模型 BERT 为标志。当前按照基本类型分类,预训练模型包括:(1)自然语言处理(NLP) 预训练模型,如谷歌的LaMDA 和PaLM、OpenAl 的 GPT 系列;(2)计算机视觉(CV)预训练模型,如微软的Florence:(3)多模态预训练模型,即融合文字、图片、音视频等多种内容形式。 以 GPT 为代表的大模型表现优异,AIGC 加速从实验室设想向产业化落地。1)根据 IDC 的定义,AI 大模型是基于海量多源数据打造的预训练模型,是对原有算法模型的技术升级和产品迭代,用户可通过开源或开放API/工具等形式进行模型零样本/小样本数据学习,以实现更优的识别、理解、决策、生成效果和更低成本的开发部署方案。大模型的核心作用是突破数据标注的困境,通过学习海量无标注的数据来做预训练,拓展整体模型前期学习的广度和深度,以此提升大模型的知识水平,从而低成本、高适应性地赋能大模型在后续下游任务中的应用;2)以GPT 系列自然语言处理模型为例,从 2018 年 6 月的GPT-1 模型,经过数代的模型迭代,GPT3.5 已经从早期的 1.17 亿参数量提升至当前的千亿级以上,而基于GPT3.5 的 ChatGPT 在人机对话中表现优异并火爆出圈,印证了大模型在文本、图像乃至视频等领域内容生成的可能性和商业化潜力。 从 PGC 到 AIGC,AI 有望重构内容与媒介生态 AIGC 多样化的内容生成能力使其覆盖各类内容形式,各类应用场景正随技术进步逐渐落地。AIGC 不仅可覆盖文本、音频、图像、视频等基本内容模态,还可综合图像、视频、文本进行跨模态生成,并应用于各类细分行业成为具体的生产力要素,例如游戏行业中的 AI NPC、虚拟人的视频制作与生成等。 从 PGC 到 AIGC,内容与平台从生态到商业模式有望重塑,新投资周期即将来临。1)从 PGC 到 UGC、PUGC,传媒互联网从 web 1.0 的门户时代进入到移动互联网的web 2.0 时代,结合算法推荐的信息分发模式诞生了以字节跳动(抖音、今日头条)、美团、快手、小红书等为代表移动互联网新贵;2)算法推荐重塑了信息分发模式,而 AIGC 则实现了信息、内容的 AI 创作,内容生产将从PGC、UGC、PUGC迈入 AIGC 时代,内容生产的效率有望实现跨越式提高,内容将迎来大爆发时刻,与之相应的,从内容到媒介平台都将会迎来生态和商业模式的重塑,内容与平台的新投资周期即将来临。 投资分析 AI 是新一轮生产力革命,算法创新及算力进步、数据爆发,催化本轮人工智能奇点将至。1)人工智能(AI)基于机器学习和数据分析的方法,赋予机器人类的能力,从而实现解放人力、降本提效的目的,已经成为推动新一轮生产力革命的核心技术方向;2)经历符号主义、连接主义和行为主义的持续演进,最终诞生了引导本轮 AI 落地的深度学习技术;深度学习技术的出现,改变了传统AI 的技术路线,解决了传统机器学习算法无法处理大量数据、准确率遭遇瓶颈的问题,使得AI 从理论上具备了工程化落地的可能;基于摩尔定理的算力提升,互联网及数字经济的快速发展带来的数据量井喷,使得 AI 最终从设想走向场景落地,在语音识别、图像识别等领域的计算准确度都实现了突破性进展并得到广泛应用。 从算法推荐到内容生成,AIGC 有望带动新一轮内容与平台革命。1)从传媒互联网的实践来看,基于 AI 算法推送的信息分发模型已经为web 2.0 时代主流的信息组织模式,并诞生出以字节跳动、快手、小红书等为代表典型产品和商业案例;2)从算法推动到内容生成(AIGC),新时代的大门正在打开:海量的数据资源、快速提升的算力水平和不断降低的单位算力成本开销、基于深度学习的预训练大模型构建的通用大模型显著降低应用开发门槛,数字化的高渗透率赋予充裕场景应用可能;从 PGC 到 AIGC,内容生产的大爆炸将重塑内容与平台生态、商业模式,新一轮产业机遇渐行渐近。 来源:金色财经
lg
...
金色财经
2023-03-10
元宇宙周刊 | 江苏昆山成立10亿元工业元宇宙产业基金 两会代表提出要加快元宇宙发展
go
lg
...
心项目落户昆山。 微软发布Azure
OpenAI
服务新功能。 Mint Werx和Vivid Labs、福布斯旅游指南合作开发独家数藏。 Chainlink正推出新平台让开发者使用AWS和Meta等Web 2.0 API构建Web3应用程序。 知名说唱歌手Snoop Dogg为Web3实时流媒体应用程序Shiller联合创始人。 Unity为游戏去中心化技术引入新资产商店类别。 Jack Dorsey支持的去中心化社交网络Bluesky已支持用户注册域名Handle。 英伟达可从ChatGPT赚取3亿美元。 继去年11月裁员13%之后 Meta将进行新一轮裁员。 Damus发布V1.2.0版本,新增Private zaps功能。 Ristband作为官方音乐元宇宙活动合作伙伴重返SXSW音乐节。 Mysten Labs与阿里云签署合作协议。 Avalanche宣布与电子竞技巨头TSM达成合作。 Citadel旗下众多公司正在寻求使用ChatGPT工具的企业许可证。 意法半导体发布最新骨传导传感器。 苹果新专利发布,通过对象检测算法为用户提供定制虚拟化身服务。 家居建材用品零售巨头家得宝入驻Roblox元宇宙。 隐私搜索引擎DuckDuckGo推出AI搜索查询功能测试版DuckAssist。 谷歌公布2023全球开发者大会信息,将于5月10日开幕。 Decrypt推出人工策划与AI生成相结合的实验性产品News Explorer。 腾讯幻核APP将于6月30日下线,提醒用户在此日期前申请退款。 中国电影资料馆将设立艺术电影数字藏品交易平台。 Cavrnus与Ruby Groupe合作为奢侈品牌部署元宇宙体验。 Animoca Brands和Planet Hollywood将推出会员制俱乐部CLUB 3。 投融资新闻 Web3平台Few and Far完成1050万美元融资。 Web3内容创作平台REPUBLIK获得370万美元种子轮融资。 WGFdesocial完成2000万美元种子轮融资,Dao venture capital领投。 Infodriver Capital正推出1000万美元新基金,以支持DeFi、GameFi等领域初创公司。 游戏巨头Wemade对智能出行平台HwikGo进行战略投资。 Token Pocket宣布对NFT流动性协议Litra Finance进行战略投资。 3D资产可视化管理平台Hexa完成2050万美元A轮融资。 AR新锐企业雷鸟创新完成首轮过亿元融资,由复星创富、容亿投资领投。 Web3游戏商务平台Fungies.io开启pre-seed轮融资。 元宇宙板块再度拉升,周涨幅达3.52%。 NFT交易市场Coresky完成600万美元融资,PAYSON LEE PRIVATE FOUNDATION领投。 Web3游戏工作室Redemption Games完成700万美元融资。 Solana链上NFT交易平台Tensor完成300万美元种子轮融资。 区块链时尚透明度平台tex.tracer完成150万欧元种子轮融资。 TrueBridge拟为新推出的区块链基金募资1.25亿美元。 女性内容品牌Rebel Girls完成800万美元融资,将探索元宇宙市场。 Web3应用程序Kresus完成2500万美元A轮融资。 Alberta Enterprise向Alpaca VC第三只基金投资750 万美元。 Web3初创公司nealthy完成130万美元pre-seed轮融资。 比特币矿企Riot前高管创立的游戏公司Believer完成5500万美元融资。 元宇宙工作空间平台Tangle完成400万美元融资,Qualcomm Ventures参投。 Web3足球游戏公司Matchday完成2100万美元种子轮融资。 区块链公司Alpha Transform Holdings将推出两只资管规模总额1亿美元的基金。 Web3电子邮件解决方案EtherMail获得400万美元的融资。 zkSync开发公司Matter Labs完成4.58亿美元融资。 Web3游戏开发商NFT Gaming Company收购保加利亚的人工智能公司Voxpow。 云基础设施初创公司Vantage宣布完成2100万美元的A轮融资。 Redeem宣布完成250万美元种子前融资。 德国电信合资企业tooz被蔡司收购作为其AR/VR部门。 Web3艺术平台Wild完成700万美元种子轮融资。 观点 《雪崩》作者表示,用户生成的内容可以稳定数字经济。 阿迪达斯Web3负责人表示涉足Web3是受到特斯拉启发。 前「半衰期」编剧认为VR内容开发为时过早。 HTC董事长王雪红表示苹果入局AR/VR市场对HTC业务有利。 德联邦金融监管局指出在监管意义上,NFT尚未被归类为证券。 来源:金色财经
lg
...
金色财经
2023-03-10
ChatGPT爆火之后 AIGC往何处去?
go
lg
...
缩写,表示生成型预训练变换模型。这个由
OpenAI
研发的语言模型激起了人们对AI技术新一轮的热情。人们与ChatGPT畅谈古今,请它翻译文本、编代码、写文章。(p.s.猜猜看,这篇文章是不是ChatGPT写的?) 爆火背后,我们试图对ChatGPT有更多理解。如果说以ChatGPT为代表的AIGC(AI-generated content,AI生产内容)本质上是技术革命,那么,脱离了对技术的认知来讨论这个议题,难免会出现偏差。 在这篇报告,我们会先梳理ChatGPT发展的历史沿革:它从哪里来,到底是什么技术在驱动它向前。我们的思考也会围绕人们对它的讨论而展开:它能火多久,有机会成为“人类大脑”或通用人工智能(AGI)吗?同样重要地,我们会把落点放在创投行业,来探讨与AIGC相关的创业及投资机会。 01 火爆了的ChatGPT,到底是什么? ▍ChatGPT的本源——语言模型 ChatGPT其实是一种语言模型。依据
OpenAI
官方的介绍,ChatGPT已具备理解和生成人类语言文本的能力,可以跟人类轻松对话。 图片来源:
OpenAI
官网 人类的语言非常复杂,而比语言更复杂的,是创造语言的思维。人们曾经试图给语言建模,但是一直没有取得显著性的成功。而ChatGPT则为语言建模打开了新的窗口,这也是它的诞生轰动全球的原因之一。 Wikipedia对语言模型的定义是:“单词序列的概率分布,给定任何长度为m的单词序列,语言模型通过对语言的文本语料库进行训练,来生成概率分布”。斯坦福的公开课说得更为直接:“语言模型就是用来预测下一个出现的词的概率”。(斯坦福的定义概括了GPT的核心原理,而不是BERT类语言模型的原理。或许这能从侧面反映,人们已将GPT采用的技术路线,视为主流语言模型路线。) GPT系列的语言模型,其主要目标是预测下一个单词。比如,前半句是“the students opened their”,语言模型要预测的是下一个单词出现“books”或者“laptops”或者“exams”等词汇的概率分别是多少。语言模型的技术原理虽然简单,但是却衍生出了ChatGPT这样智能、有复杂应用场景的产品。 ▍ChatGPT可能是当前最成功的大型语言模型,我们正在经历iPhone Moment ChatGPT可能是目前最成功的语言模型,人们把当下这个ChatGPT诞生的时刻称为“iPhone moment”。 GPT是Generative Pre-trained Transformer 的缩写。Transformer神经网络算法是当前最新的一种算法模型,我们会在下文展开。GPT系列模型都是语言模型,是新型神经网络算法、新型模型训练方式加上海量数据算力多重因素叠加产出的成果。 GPT模型有几个主干版本,从 GPT-1、GPT-2、GPT-3演进到最新的GPT-3.5版本。 当下人们使用的ChatGPT是在3.5版本的基础上,专门针对人类需求做了大量微调,引导模型输出更符合人类需求的结果。这让GPT模型逐渐“社会化”,变得更像人。经过微调的ChatGPT“情商”变高了,不再只是个话痨,也不再那么口无遮拦。 ▍ChatGPT的诞生过程 图片来源:微信公众号@AI语者 在ChatGPT问世之前,GPT模型经历了怎样的发展历程? 2017年6月,Google发布Transformer这一神经网络算法模型,它为大型语言模型的发展奠定了基础。 一年之后,
OpenAI
公司推出了GPT-1,GPT-1采用语言模型预训练+微调训练两阶段的训练方法,在问答和常识推理、语义相似度、分类等任务中,取得了还不错的语言任务执行效果。 2018年10月,Google推出另一个语言模型——BERT,效果超过GPT-1。 图片来源:知乎@雅正冲蛋 GPT和BERT都是基于Transformer衍生出的算法,但在技术路线上各有侧重。GPT基于 Transformer 右边部分,叫解码器。BERT基于 Transformer 的左边部分,叫编码器。 GPT的技术原理是预测下一个词,你可以看作是“文字接龙”,你写出前面的句子,由GPT来猜下一个词。但BERT更像是“完形填空”,其技术原理是把一句话中某个词给遮挡住,然后请BERT来猜。 解码器擅长创作,编码器擅长理解,当时它们要做的更多是屏蔽语言模型(Masked LM,类似“完形填空”)、相邻句子判断(Next Sentence Prediction,判断句子是否能相连)这类偏阅读理解的任务,因此BERT占了上风。 2019年,GPT-2发布,它采用15亿个参数的Transformer解码器,在当时是个比较大的模型。相比BERT,
OpenAI
研究人员发现,GPT-2预训练的语言模型无需微调训练,可直接执行多种下游任务。这个发现坚定了研究人员沿着现有技术路线,继续研发的决心。 2020年5月,GPT-3诞生,它采用了史无前例的1750亿参数的Transformer解码器,用了接近5000亿单词的文本训练数据。整个训练过程可以说是“大力出奇迹”,让GPT-3在文字生成方面实现质的飞跃。GPT-3除了可以出色完成文字生成、翻译、问答和文本填空等语言类任务外,还“涌现”出了其他一些智能,包括上下文学习,以及更强大的零样本和少样本执行任务的能力,等等。 GPT-3生成的文本质量非常高,有时候人们甚至难以区分文本到底是人类写的,还是GPT-3生成的。 基于GPT-3,已经衍生出很多应用,人们用GPT-3来创作各种类型的文本。有人用它写了一篇新闻,被某热门新闻点评网站排到头部。一家名为Jasper的公司利用GPT-3为企业提供商业文本写作服务,2022年其收入达到9000万美元左右。 GPT-3之后,
OpenAI
通过增加程序代码训练和人类反馈强化学习等多种训练手段,并将主版本升级到GPT-3.5。最终,2022年11月,ChatGPT横空出世。 ▍训练GPT-3模型的三“大”要素:算法、数据、算力 我们称GPT-3为大模型,这个“大”体现在哪些地方? 首先是算法。GPT-3采用的是Transformer的解码器,具有1750亿个参数和2048个Token(可简单理解为单词,下同)的训练文本长度。 图片来源:
OpenAI
团队论文 《Language Models are Few-Shot Learners》 第二是数据。上图是GPT-3的训练数据,总共接近5000亿个token的文本,主要包括Common Crawl、Webtext2、Books1、Book2、Wikipedia等等。其中占比最大的训练数据是Common Crawl,它是一个开源的数据集,抓取并保存了全球大量网页的数据。 第三是算力。据微软发布的信息,
OpenAI
使用一台全球排名前5的超级计算机系统来训练GPT-3,该系统拥有超过28.5万个CPU核心,1万个GPU和每秒400G的网络。据悉其训练成本约为1200万美元。 02 人们如何看待ChatGPT? ChatGPT诞生以来,引发的讨论非常多。那么说回来,人们如何看待这个新事物,对它又有什么期待?虽然众说纷纭,有3个议题是被频繁提到的。 ▍人们肯定ChatGPT是一个称职的语言模型 首先,ChatGPT是迄今为止最成功的人类语言模型,已经具备形式语言能力(洞悉语言的规则模式等知识)。 ChatGPT具备理解和生成人类语言文本的能力,可跟人类轻松对话。它用数据驱动的大型神经网络的计算方式,某种程度上解码了人类语言的内部规律。这个内部规律不是某种公式,而是一个神秘、暂不被人类理解的权重参数矩阵。 以前,人们认为算法模型如果仅靠输入文本,很难获取关于语言的知识。但如今,ChatGPT可以从文本中直接学习语言的层次结构和抽象类别等,这是一种无监督学习的能力。 此外,ChatGPT也不只是个话痨。它可以写作文、创作诗歌、撰写商业文本、翻译、做阅读理解、代码理解和生成等。可以说,作为一个语言模型,ChatGPT已经比较称职。 ▍人们期待ChatGPT具有思维能力 人们对ChatGPT的期望不仅仅是语言模型,人们甚至期待ChatGPT成为一个思维机器,发展出功能语言能力(用语言思考和做事的能力)。 ChatGPT“涌现”出一些智能,包括上下文学习(理解和学习人类对话输入文字的能力)、世界知识抽象(例如事实性知识和常识)、执行泛化任务(包括没有做过的新任务)、复杂推理等。然而,当前ChatGPT的这些功能都还不算强大,出错甚至崩溃时有发生。 当前,人们在思维机器方向的探索有很多,例如有一种借助思维链(Chain of Thought)的方法,试图引导或者优化语言模型展现出复杂的推理能力。这些研究方向的进展仍在持续。 上图展示的是,一位科研人员在跟ChatGPT的对话中,通过分步骤提示引导的示例训练(引导过程未展示),使ChatGPT展现出分步骤思考和计算的能力。据分析,ChatGPT的这个能力来自GPT-3.5模型本身,思维链训练方法只是让它意识到应该用这种方式来思考和回答问题。整个过程有点类似老师辅导学生做题。 虽然这道题对于10岁的孩子来说很容易,但对语言模型来说却很难,主要是由于数学和语言混合在一起。这类问题只是开始,当前思维链的前沿科研工作已经转向更有难度的问题,例如高中、大学,甚至是国际数学奥林匹克问题。 加利福尼亚大学洛杉矶分校(UCLA)近期的一篇论文发现,ChatGPT似乎展现出了类比推理的能力。 什么叫类比推理?推理分三种,包含演绎、归纳、类比。“类比推理通常被视为人类抽象和概括能力的典型能力。在广泛的问题类型中,ChatGPT达到或者超越人类水平...显示出这种零样本类比推理的能力。” 然而,ChatGPT的推理能力因其对世界缺乏物理理解而受限,因为它仅仅依靠文本输入,缺少视觉(图像和视频)、声音、嗅觉等多模态数据输入。文本对世界的物理描述是有限的,比如你很难通过文字描述清楚一间屋子里不同物品的位置具体,相反,看一张关于这间屋子的图片,物品的位置信息就一目了然。 听说GPT-4将于2023年发布,届时会加入视觉等多模态数据输入,这将有望进一步提升它的智能。 ▍对于ChatGPT能否成为“人类大脑”或通用人工智能,人们持有巨大争议 目前,针对ChatGPT是否能够变成“人类大脑”或者通用人工智能(AGI),争议还非常大。Yan Lecun是深度学习的三巨头之一,他也是Meta(原Facebook)公司的首席AI科学家。他认为机器和人类不一样,人类会在心智里面构建一个虚拟世界,进行推理和模拟,这点目前机器做不到。 著名语言学家乔姆斯基在2019年的一次采访中提到,深度学习更偏工程,有点像推土机,可以使用,但它没有能力告诉你人类语言的任何事情。(注:ChatGPT这类语言模型可以输出很精彩的文本,但是我们没有确凿证据证明它真正掌握了语言的规律,当然也有可能是它掌握了规律,但人类无法理解。) Kyle Mahowald等学者认为,“擅长语言” 未必 “擅长思考”。虽然人类的语言和思想是不可分离的,但专⻔处理语言的人脑区域,与负责记忆、推理和社交技能的人脑区域是分开的。因此不应该对语言模型有过多期望。 Kyle Mahowald提到了一个GPT-3没能理解的失败案例:怎么把沙发放到你家屋顶上。 就像我们在上文提到的,屋顶、沙发、起重机等更偏世界的物理知识,对于人类来说,很容易就想到用各种办法把沙发放到屋顶上去,但你很难让ChatGPT理解这样的操作思路。这个例子也说明世界物理知识的输入,特别是视觉等多模态数据输入的重要性。 03 背后的技术和发现很精彩,也还有很多发展空间 讲完ChatGPT究竟是什么,我们再来讲一下背后的技术。 我们在上文提到,ChatGPT相当于用“文字接龙”这样简单的技术原理来训练和使用语言模型,从而实现跟人类的高质量智能文本对话。这个技术原理,理论上是有升级和改善机会的,从而可能达到更好的效果。 在神经网络参数量方面,业界有人认为有优化空间,例如是否可以用参数量较小的模型达到同等效果。2048个token文本输入窗口的设计及计算机制,也可能有优化空间。例如当前有人试图让ChatGPT写推理小说,但推理小说里面的推理线索往往不易察觉且距离较远(例如好几个章节之前的一个小线索),这个距离远远超出2048个token文本的窗口,如何把当前窗口之外的知识信息容纳进来,也存在优化可能。 整体而言,作为底层算法模型的Transformer在2017年6月才诞生,现在还处在发展早期,在快速迭代和改进完善之中,应该还有很多发展空间。 此外,前面提到的多模态数据输入,会给GPT-4带来什么样的能力涌现和性能提升,也是业内人士和群众翘首以待的。 ▍人类可以从ChatGPT中学到什么关于语言的规律? 在对人类语言的探索上,ChatGPT比以往的任何产品都走得更远更深。我们人类可以从ChatGPT身上学到什么? Stephen wolfram这名科学家认为,人类语言可能没那么复杂,只是因为我们人类没有能力理解和掌握其背后的规律;而ChatGPT用基于神经网络的算法,成功解码了人类语言的本质。 据
OpenAI
公开的GPT-2的论文,GPT-2的训练数据是纯英语文本(做了非英语文本过滤)。即便如此,它还是显示出一些多语言能力,并且展现出非常出色的法英互译能力,尽管只是接受了10MB左右残留的法语文本训练数据。 这个现象引发了人们的思考,当前人类在语言学习方面花费大量的时间和精力,这个学习效率是不是有提升的空间?我们能不能向语言模型学习,更加有效率地学习人类语言? ChatGPT在生成文本时,是每次选择一个词,这个词是在语言模型给出的概率表中做出的选择。当前科研人员的发现是,如果每次都选择概率最高的词汇,理论上是最优解,最后呈现却往往是一篇非常普通的文章;如果不是每次选择最优解,例如随机选择排名稍微靠后一点的,却有更大机会生成一篇精彩文章。这也是个有意思的未解之谜。 以前,我们可能认为创作一篇散文或者一首诗,背后是人类精心的构思和创造。但对于AI而言,创作意味着概率和选择,我们认为的精彩文章创作原来只是AI枯燥的选择过程而已。由ChatGPT反观,可能人类对语言本身的奥秘还知之甚少。 ▍语言特征空间的单词分布 GPT把文字向量化了,建立了语言的高维特征空间,也称为隐含空间(Latent Space)。 GPT-2中每个词是一个768维的向量,GPT-3中每个词则是12288维的向量。每一个维度代表着一个属性,相当于GPT-3用1万多种属性,来描述人类语言中的词汇特征。 Stephen wolfram试图打开人类语言的特征空间,来观察其中的规律。他选择规模较小的GPT-2的特征空间,把它映射到人类比较容易理解的二维空间,从中发现了许多有意思的现象。比如,crocodile鳄鱼 和 alligator短吻鳄 离得很近,苹果跟梨聚在一起,这个可能容易理解。有趣的是,词汇之间的关系,还能从向量加减操作中反映出来,比如皇帝(King)的向量减去男人(man)的向量,再加上女人(woman)的向量,就变成了女皇(Queen)的向量。 另外,他还试图在GPT-2的语言特征空间中,寻找每次生成一个句子的游走规律,我们能从上面这个图片中,看到GPT-2是怎么在768维度的空间中游走并陆续做出下一个词的选择,但是很遗憾他还没有找到其中的规律。虽然从高维映射到二维中丢失了很多信息,但是未来如果能结合多维空间中的向量,我们可能会发现更多关于语言的规律。 ▍Transformer神经网络算法架构及注意力机制 2017年6月,Google发表了非常著名的Transformer论文,论文标题是《Attention is all you need》,意思是说你只需要注意力机制就足够了。 图片来源: 知乎@雅正冲蛋 Transformer神经网络算法架构的框图如上,如前文所述,左边部分是编码器,右边部分是解码器。Google研发的BERT用的是编码器,而
OpenAI
的GPT系列用的是解码器。 在AI领域,有四大类神经网络算法,包括MLP、CNN、RNN、Transformer。MLP是多层感知器,CNN是卷积神经网络,RNN是循环神经网络。 Transformer是最新的算法模型。在一些场景中,它正在逐渐替代CNN和RNN。Transformer的特征提取能力比较强,擅长长序列处理、并行计算、多模态处理等。Transformer的注意力机制有点像人一样,选择性关注,因为资源有限,只会关注最重要的事情。 Transformer已经被广泛应用在自然语言处理、计算机视觉以及生物科技等领域。生物科技行业用来预测蛋白质三维形状的Alpha Folder算法就是基于Transformer算法模型来做的。 ▍哪个模块是GPT-3储存智能的地方? GPT-3模型发布时,
OpenAI
团队发布了论文《Language Models are Few-Shot Learners (语言模型是少样本学习者)》。 上图是GPT-3模型的框图,它基本上跟Transformer 的右边部分的解码器是类似的。无论是预训练还是推理(做任务),都是从框图的最底部输入前面部分的文本(GPT-3模型最大的长度是2048个token),然后经过12次运算,从Text prediction输出下一个词概率预测(Task Classifier是微调训练分支,在此不详述)。 一个有意思的话题是,GPT-3用1750亿个参数,去学习接近5000亿单词的文本,显然它不是简单地把3个单词存在1个参数中去,而是大抵掌握了一些语言规律且抽象了某些知识和能力。那么,问题来了,这些规律、知识和能力到底存在哪些地方呢? 有学者认为,1750亿参数主要集中在框图中的注意力处理层和前馈网络层,前者的值是动态计算的(每输入2048个token,就重新计算一次),它们是数据相关的动态权重,因为它们会根据数据动态变化。而前馈网络层的权重是随着训练过程而缓慢变化的,因此,有学者猜想在前馈网络层中存储着GPT发现的语言规律、知识和能力等,因为要经过12次运算,运算次数越靠后存储的信息越抽象。 Stephen wolfram把GPT-2的某个前馈网络层存储的768*768维度的权重参数矩阵提取出来,压缩到64x64尺寸,就形成了如下一张神秘的图像,代表着GPT-2总结的神秘的人类语言编码规律及其他一些知识和能力的一部分。很好奇什么时候科学家可以逐步解密其中的部分内容,相信对于人类提升自我能力有好处。 图片来源:writings.stephenwolfram.com 04 未来,ChatGPT能否进化出自我意识? 和AI相比,自我意识和自由意志可以算作是人类最后的堡垒。 但是有一种观点认为,人类其实没有所谓的自由意志。人类有两个自我,一种是体验自我,另一种是陈述自我。体验自我,负责相对“机械”地解读信息、作出决策;陈述自我,则负责对体验自我的决策进行解释和表述,有时甚至会虚构故事来“欺骗”我们自己。所谓的自由意志,不过是陈述型自我给自己编的一个故事而已。 一些科学家和学者认为,理论上,我们可以构造出一个自我模拟的自指机器(Self-referential Machine),让它也具备两套体系,一个负责执行算法,另一个则专门负责对自我进行模拟(描述,或者可称为在内嵌虚拟世界中模拟自我)。这种机器会表现得就“像”一个具有自我意识的系统,以至于我们可以用这样的系统来定义所谓的“自我意识”。在古代欧洲,有一种传说中的衔尾蛇,能够自己吃自己,实现持续进化。后来,有人提出哥德尔机( Gödel Machine)的设想,认为只要程序能够模拟自身、改造自身,那么我们就可以将其称为具有自我意识的。此外,还有Quine程序结构、克莱因Kleene第二递归定理等也提出和支持了与之相似的假设。 图片来源:维基百科 我们很难预料,未来机器是否能进化出自我意识。 05 生成式AI领域的其他进展 需要指出,当前讨论的生成式AI,跟之前的分析式AI是有较大不同的。分析式AI的主要能力是分析,例如:数据分析、趋势预测、商品推荐、图像识别等,而生成式AI主要的能力是创造,例如:写诗、绘画、设计产品、编写代码等。 当前除语言模型外,生成式AI领域的其他进展还包括图像生成模型等等。未来,多模态(文本、图、视频等)对齐、融合、理解和生成等方向的进展,意义也非常重大。 关于图像生成模型,不得不提的是扩散模型(Diffusion Model)。它主要解决通过文本生成图像及其他媒体格式的难题,业内知名的扩散模型包括:DALIE2、Stable Diffusion等。 图片来源:Denoising Diffusion Probabilistic Models 06 生成式AI相关的6点创业思考与建议 2022年,大语言模型爆发。据统计,2022年,平均每4天就有一个新的大语言模型问世。 生成式AI技术也在持续引发人们对一些知名的模型层平台和应用的访问,数据增长很快,投资火热。2019 年至2021年期间,流向生成式AI业务的资本增加了约130%,其中文本和写作增长630%、图像增长400%、数据增长 370% 、音频/视频增长350% 。 图片来源:A16Z 上图是投资公司A16Z总结的生成式AI的行业堆栈。底层深蓝色的部分是基础硬件和云平台,中间蓝色的部分是模型层,再往上浅蓝色的部分是应用层。 在应用层,有的创业公司自身只做应用,模型能力则是调用外部的;还有一类叫端到端的应用模式,它会自己做模型,但一般不做大模型,或者在其他大模型基础上微调出自己的模型。 在模型层,有开源模型和闭源模型。深蓝色部分的Model hubs是用于模型存储和训练的第三方平台。 当前应用层的增长比较快,主要是由AI赋能的新型应用案例所驱动,主要集中在图像生成、文案写作和代码编写,三个类别各自的年收入已超1亿美元。 关于生成式AI的创业,我有6点思考和建议: 第一,目前,与AI相关的科研、工程、产品和商业化,都在同时快速迭代,变数很大。这个过程中,会出现不同的技术分支和业务路径,如果选错了技术分支和业务路径,再掉头就很麻烦。这就需要创业团队既懂技术又懂业务,在创业初期努力做出正确选择。 第二,对创业公司而言,从应用层或者端到端的应用层切入,可能是相对能降低风险的做法。模型层有少量机会,但不一定适合大部分的创业者。第三,应用层在做商业模型设计的时候,要警惕模型层的边界。 以Jasper公司为例。2020年在GPT-3模型基础上,Jasper衍生出付费商业文本写作的商业模式。到了2022年底,ChatGPT向用户免费开放,给Jasper带来较大的压力。尽管
OpenAI
未必会以商业文本生成作为自己的主要商业模式,但它平等赋能了入场的其他竞争者。Jasper需要展现出有竞争力的技术积累与业务纵深,才能稳住脚跟。 第四,把AI技术应用到产业场景,可分为新模式和旧模式改造两类方式。新模式是指创造之前没有的全新的应用场景,旧模式改造则指在现有产业场景里用AI技术来改造部分环节,或者团队带着深度行业认知和新的AI技术在成熟的产业场景中创业。新模式和旧模式改造,都存在巨大的机会。 在峰瑞已投企业中,有好几家企业在垂直产业的场景中做业务创新。比如线上心理咨询平台阁楼、短视频及直播SAAS服务企业特看科技、线上健身私教平台BodyPark,都在积极使用生成式AI来赋能自己的业务。本周六(3月11日),我们将邀请这3家公司的创始人来分享他们的探索和发现,欢迎参与。 第五,AI还面临科研知识快速溢出的问题,因此找到自己的壁垒很重要。创业公司一定要想清楚自己未来的壁垒在哪里,比如到底是数据壁垒、工程壁垒(例如模型微调)、场景壁垒,还是规模壁垒等等。在应用层创业,仅依靠外部模型层提供的能力,是无法形成壁垒的。 第六,应用层的创业,应该是“技术为先、场景为重”。 “技术为先”,是指虽然通用AI技术未必是你的核心壁垒,但团队一定要懂技术,才有能力思考如何更早更好地把技术应用到合适的应用场景里,做出好用的产品。 “场景为重”,意味着最后的产品和业务需要找到合适的落地场景,建立自己的商业模式,并在场景里形成自己的核心竞争力。 07 生成式AI行业的未来格局展望和猜想 最后来聊聊对AI行业格局的未来展望和猜想。这个部分我参考了奇绩创坛陆奇博士之前的一个思考框架。 ▍以AI和大模型为中心的新IT 新的硅基硬件产业:硅基产业架构和集合可能迎来新的发展机遇(例如:新的计算芯片及周边技术和产业等)。 新的软件和云服务体系:算力、模型和数据的云服务、基础软件、ML&Dev Ops、人机互助编程工具等。 ▍新的基础智能终端设备:智能传感器、新型手机等 未来的智能终端会越来越智能,最近苹果公司官宣支持Stable Diffusion图像生成模型在iPad等终端上运行,也有工程师把经过裁剪的Stable Diffusion应用在iPhone上运行起来,可以预见以后我们的手机美颜和照片生成可以达到何等出神入化的境界。 此外,当前的翻译软件技术,在语义理解方面还是比较浅,翻译质量差强人意。如果可以把类似ChatGPT这样的语言模型能力嵌入到智能终端中去,随着文本和语音的实时翻译成为可能,跨语言交流将变得很方便,这对于提升人类之间的交流效率意义重大。 ▍围绕内容创作展开的产业 文、图、视频、3D等各种媒体格式的AI内容创作工具,是当前可以看到创业机会较多的新产业。 以ChatGPT为代表的语言模型的文本生成技术,和以扩散模型为代表的图像视频多模态生成技术,可能会对内容产业产生深远的影响。从PGC到UGC,再到如今的AIGC,内容领域会有更多新变化与新玩法。 从媒体行业发展情况来看,当前头部的内容媒体平台比如抖音快手B站是所谓的Web2.0平台,普遍采用UGC方式为主来生产内容,但是随着AI生产内容(AIGC)的出现,AI可以生成大量优秀内容,成本较低、效果精良,而且甚至不乏创意,这个情况下内容媒体平台和行业就有可能出现较大的变化。 ▍围绕语言模型展开的产业 在这个领域,新的机会可能包括:语言学习范式改变,重塑跨语言沟通方式,更友好的人机界面等。 其中特别值得一提的,是语言学习范式的改变。如前文所述,如果我们可以打开语言模型,从中寻找到语言学习的规律,说不定可以帮助我们更有效率地学习语言。事实上,
OpenAI
投资了一家韩国的英语学习APP叫Speak。从有限的公开信息来看,这家公司未来的产品是一个语言学习助手,或者叫做虚拟语言老师——借助语言模型的能力和发现的语言规律,去帮助人们更好地学习外语,而且成本极低。 跨语言沟通的技术目前还不成熟。如前面所说,如果我们能够把语言模型加载到智能终端,可能会极大改进跨语言沟通的能力。 因为语言模型足够强大,未来我们的人机界面,会采用更友好的自然语言人机界面,无论是跟APP对话还是跟智能硬件对话。 ▍围绕思维模型展开的产业 不妨畅想一下,更聪明的软件(或机器人)、科研服务、 “知识工程”、“世界大脑”等。 当前的软件产业,即便有AI的加持,通用性和智能程度还是不尽如人意的,大多数情况下只能做一些特定的任务,只能成为人类的效率助手;随着更加通用的AI能力出现,软件也可以像人类一样思考和做事,可以想象软件就可以帮助人类承接较为完整的任务了。 如果AI可以发展出接近人类的思维能力,它也许可以成为人类科学家的科研助手,因为AI可以不知疲倦,且可广泛使用。当前,我们很难想象AI可以达到人类顶尖科学家的水平。打个比方,你让它去证明下哥德巴赫猜想,应该还是很不现实的。当然也有其他可能,如前文所述,如果AI程序可以实现自我优化,具备迭代自己的算法和技术的能力,相信它的智能会很快赶上来。 如果我们展开想象,就可以有更多的可能性。例如“知识工程”,如果把人类的知识建模,然后让人类以某种方式可以调用或者学习,那么就不用经过“痛苦”的学习过程。“世界大脑”,是指规模极大的思维模型,它可以帮助我们执行各种重要的计算和思考。不过,如果真的发展到这个地步,可能离电影《黑客帝国》里边的Matrix就不远了。 ▍赋能人类,深入改变各行各业(特别是知识工作者) 语言是人类最主要的沟通方式,是知识和思维的主要载体;而深度思维是人类的高阶能力,也是人类不同于其他物种的最重要的能力。如果AI掌握了这两种能力,就基本具备了在某种程度上赋能或替代一部分人类知识工作者的可能。 类似于自动化生产制造设备赋能传统工业,各类AI模型和应用软件也将有机会更好地赋能各行各业。但是不同于制造行业,大批量使用的软件,其边际使用成本是非常低的,而且它很聪明、善学习、会思考、会交流,应该会有大量的应用场景有待开发。这里边有非常多的创业机会,也会给各行各业带来新的发展动力。 08 写在最后,为什么AIGC不会是短期风口? 首先,ChatGPT是语言模型领域的重大进展,鉴于语言对人类沟通和思维的重大意义,语言模型本身具备很强的通用性,以及人类可以通过研究语言模型获取语言及知识的学习规律并得到效率提升,这些都会持续带来长期的创新机会。 第二,AI在思维机器这个方向上还有更远的路可以走。例如,如果AI能够实现良好的多模态信息输入,增加对物理世界的理解,可能可以“涌现”出更多的智能。这个方向的任何进步都意义重大。 第三,与AIGC相关的底层技术原理和算法都还处在发展早期,未来还有很长的迭代和优化机会。 一切,才刚刚开始。 来源:金色财经
lg
...
金色财经
2023-03-10
AI与Web3前沿技术融合创新的价值有多大
go
lg
...
sion,支持文本到图像生成(类似于
OpenAI
的 DALL·E 2 )。该应用的文本到图像生成器目前有 Photoshop 插件,但其旨在成为元宇宙 AI,并使游戏开发人员能够根据文本、语音或参考内容构建整个世界,从而显著优化开发成本和时间线。 Utiliti.AI 为了促进应用层的发展,Utiliti.AI 正在构建一个智能 Web3 企业开发平台。其将通过企业级 API 和 SDK,使任何技术堆栈连接到区块链网络。通过训练 ML 模型来识别和分类用于铸造、质押和其他标准用例的智能合约框架,旨在帮助开发者轻松构建和扩展去中心化应用程序所需的一切。Utiliti 将为其开发人员客户提供模板、安全评分、气体效率评级和其他关键数据的库,以优化和加快建设。 Mirror World Mirror World 是 AI 驱动的链游项目。其作为基于区块链的互联互通的元宇宙世界,是一个拥有丰富的游戏矩阵的元宇宙平台。游戏用户在创建一个角色后,可以在该平台的各个游戏空间中穿梭,在不同游戏里获取的装备、道具等也能自由使用。而 Mirror World 的游戏虚拟生命“ Mirrors”,这些游戏角色将由 AI 驱动。此外,该链游项目秉持着“游戏第一,加密第二”的设计原则,Mirror World 正与 Republic Crypto 的经纪团队合作,在保证游戏性的基础上,共同进行 DAO 的设计。 潜力与未来 就像历史无法重演,我们也无法准确预判未来,所能做的就是把握现在。从 ChatGPT 的流行趋势来看,人工智能已经在切实地改变我们使用互联网的方式,并且类似 AI 产品会越来越多,深入渗透工作、生活中的每个角落。无独有偶,Web3 作为下一代互联网,当 AI 与加密结合,可谓是新上加新。 如果 Web3 能够结合并利用人工智能所带来的生产力变革,这意味着我们可以期待未来两者深入结合带来更多令人惊奇的创新。期待的各位行业建设者的卓越方案,或许这将成为下一个引爆加密市场的全新领域。 来源:金色财经
lg
...
金色财经
2023-03-10
MetaGPT——连接AI创造者和AI用户的桥梁
go
lg
...
些挑战。 针对这一需求,我们开发了基于
OpenAI
的MetaGPT,将AI和Web3巧妙结合。其独特的Train to Earn模型激励用户参与Web3行业的AI模型训练和优化。 MetaGPT专注于加密货币领域,旨在成为加密货币世界的“智库”,为投资者、交易员、分析师和加密货币社区提供丰富的信息和实用工具。 未来,MetaGPT将推出KryptaI,一款能够理解加密货币领域专业术语和语言的AI聊天机器人。致力于为进入Web3领域的用户以更便捷、更友好的问答形式提供最新的加密货币行业知识库指南。我们的模型还可以从各种加密货币市场数据源自动学习和更新,以确保信息的及时性和准确性。 此外,MetaGPT还拥有丰富的加密货币知识库,涵盖了加密货币的历史、技术、市场、投资等各个方面。我们的用户可以使用 MetaGPT 了解最新的市场趋势,分析加密货币的价格和趋势,甚至做出交易和投资决策。无论您是初学者还是经验丰富的投资者,寻求信息或进行交易,MetaGPT 都是您的最佳选择。我们相信,在 MetaGPT 的帮助下,您可以更好地了解加密货币市场,做出更明智的投资决策,并分享您的见解和经验。 MetaGPT,让加密货币世界更加透明! JP.crypto Web3前沿动态社区,专注于项目投研与价值投资。加入我们获取更多项目信息。 推特:https://twitter.com/Crytpojp_JP 来源:金色财经
lg
...
金色财经
2023-03-10
OpenAI
下周将发布GPT4.0!微软德国CTO重磅宣布,包括多模态模型
go
lg
...
日消息 微软德国分公司CTO刚刚宣布,
OpenAI
下周将发布GPT4.0,其中包括多模态的模型。“我们将在下周推出GPT-4,在那里我们将有多模态模型,将提供完全不同的可能性,例如视频。”Andreas Braun在3月9日的人工智能启动活动中提到。
lg
...
金融界
2023-03-10
“人工智能就是新时代的电力” 美国银行:2026年AI产值将达9000亿美元!看好这“13个行业”将受益
go
lg
...
过中国和印度目前产出的总和”。 自从
OpenAI
于 2022 年 11 月向公众推出 ChatGPT 以来,人工智能就抢占了聚光灯。如今华尔街也注意到了这一点,世界上一些最大金融公司的分析师也正在认真研究新技术将在未来几年对市场产生什么样的影响。 同时,大大小小的公司都开始将这项技术融入到他们的业务中。BuzzFeed 计划使用 ChatGPT 为读者编写内容和创建测验,而心理健康公司 Koko 使用 ChatGPT 作为聊天机器人在网上协助客户。最为人知的就是微软拥有 100 亿美元的
OpenAi
股份,计划将 ChatGPT 整合到其搜索引擎 Bing 中以与谷歌竞争。 人工智能将改变游戏规则的 4 个原因 美国银行认为,这对人工智能来说是一个转型时刻,主要原因有四个:它以前所未有的方式使数据民主化,它以无与伦比的速度被采用,它以指数级的速度发展,它有无数的商业用例。 美国银行全球专题研究团队负责人 Haim Israel 指出,Open AI 的聊天机器人在短短五天内就达到了 100 万用户,并在短短三个月内达到了 10 亿次访问,这比 TikTok 快三倍,比 Instagram 快 10 倍。 根据美国银行的数据,人工智能正在以惊人的速度发展,因为在过去十年中,训练其数据集所需的计算能力每三个月翻一番,而 LLM 的参数数量在过去十年中增长了 1,900 倍。Haim Israel写道,按照这样的速度,在未来 10 年内,AI 的功能可能比 ChatGPT 现在的功能强大一百万倍。 然而,人工智能并非没有批评者,他们从财务、环境和道德角度提出担忧。Haim Israel 写道,向 ChatGPT 提问的成本是谷歌在其引擎上搜索成本的 300 倍。他进一步补充,人工智能需要大量的能量来训练,并指出对模型进行编程可能产生的排放量是普通汽车使用寿命的五倍。此外,许多人认为人工智能不道德,或对聊天机器人的回答持怀疑态度。 13个最受益于人工智能的行业 尽管如此,美国银行仍然看好人工智能对商业的影响,并在此过程中丰富这 13 个行业的投资者,分别软件开发、半导体、数据中心、网络安全、搜索引擎、教育、媒体、音乐、法律、远程医疗、药品、银行、金融科技。
lg
...
IreneLim
2023-03-10
上一页
1
•••
434
435
436
437
438
•••
483
下一页
24小时热点
特朗普重大决定引爆行情!美元大跌70点 金价短线巨震26美元 究竟怎么回事?
lg
...
特朗普重大宣布震惊市场!比特币猛烈反弹9.8万、黄金2717持稳上行 普京作战惊传“巨响”
lg
...
【直击亚市】黄金今日暴跌60美元!特朗普重大决定打击美元,全球股债涨声欢迎
lg
...
特朗普重要决定引发美元大跌、金价仍惊人暴跌近50美元 原因在这里!
lg
...
黄金突然大变脸!中东传重要停火消息 金价日内大跌逾17美元 如何交易黄金?
lg
...
最新话题
更多
#SFFE2030--FX168“可持续发展金融企业”评选#
lg
...
14讨论
#链上风云#
lg
...
47讨论
#美国大选#
lg
...
1329讨论
#VIP会员尊享#
lg
...
1501讨论
#比特币最新消息#
lg
...
605讨论