动荡和富有戏剧性的一周行结束,在本周,百度发布文心一言、OpenAI发布GPT-4、微软发布Microsoft 365 Copilot。围绕科技圈,人们的话题从赞叹GPT-4的强大、百度的股价再到打工人命途多舛,可谓跌宕起伏、目不暇接。
客观上,AIGC正在重构人们的办公、娱乐乃至生活方式。正如我们早先预计的那样,这场AIGC浪潮才刚刚开始。(以下所谓AIGC指AI Generated Content即人工智能内容生成技术,目前该技术已在文字、音乐、图像、视频等领域得到应用,并在行业内诞生了不少专注于此的技术型公司)。
从短期来看,AIGC对一些行业的改变是立竿见影的。
对软件开发行业的影响:在年初,人们对GPT的判断仍是,它对语境理解不深入、缺乏实际编程经验,以至于无法替代程序员的工作。但时隔几周,这种看法就被重新塑造。某企业内部首席科学家对数科星球(ID:digital-planet)这样提及:“在代码检测,效率提升是明显的,以前可能我需要一百个人,现在需要十个人就够了”。
在这位高管看来,至少在软件行业,低端开发工作将更多地被取代,取而代之的是,内容生成、内容策划、数据分析师等工作可能更有前景。
对教育培训行业的影响:在我们和不同行业的从业者对答后,发现AIGC对教育培训的影响度极为快速和深远。“我们的产品被很多做培训的人买了,比如西班牙语培训机构这种”,一位创业者表示。在培训行业,AIGC的使用者越来越多,老师们正在让生成课件等教学资源更加高效,而且,在其中,不少人还发现了个性化对学生匹配教学资源的方式。
此外,在媒体与广告行业,AIGC由于可快速生成大量的文章、视频、图片等内容极大提升了相关从业者的工作效率;在游戏行业,AIGC还可以被用于游戏场景、角色、任务等元素的生成,为游戏开发提供更高效、更丰富的创作工具,同时也可以提高游戏的可玩性和趣味性;在消费零售行业,该技术被用于自动生成商品描述、推荐语等内容,帮助零售商提高商品销售效率和客户满意度;在制造和工业行业,AIGC技术可以帮助制造和工业行业生成产品设计、模拟和测试数据,从而提高产品质量和生产效率。
GPT-4一经发布,展示了其在图片语义理解等多模态场景下的优势。“看到GPT-4能理解图片,我觉得挺惊讶的”,一位投资人对数科星球(ID:digital-planet)这样说。在他看来,以往计算机在图片语义理解上进展龟速,而目前,该项技术已经可以识别颜色、形状、纹理、深度和透视等诸多要素。
更为关键的是,深度学习算法还能自动识别对象、场景和行为信息,这点在未来应用组智能驾驶、安防监控、医学影像分析等都有极大的想象力。“虽然目前,抽象概念、情感意图和文化等还有所欠缺,但这已经是巨大的进步了”,一位从业者分析。就趋势来看,影响图片语义理解的准确性虽还有复杂场景或光照条件等因素制约,但对比过去的“龟速”,突破确实肉眼可见。
“我看到他们在ChatGPT里加了很多‘专科语料’,以至于能在更多场景中解决更多的事”,一位投资人这样说。在他看来,加入“语料”的结果是,有更多用户参与到产品之中,而在这个过程中生成了更多数据,形成了更大的用户-数据飞轮。
暴力计算、思维链、多步推理是目前GPT的特色。不过,这个类型的软件似乎存在发展上限,一些行业内人士对此的回应是;“即便是加入了多模态(包括文字在内的,图片、视频等),它根本上还在数据中‘空转’,未来还应和物理世界连接”。
与微软不同的是,谷歌将走出一条AI+物理世界的新路。因后者在物联网、传感器等方面着大量积累,以至于,在未来谷歌或将在改造物理世界上贡献非凡。在其中,一些场景被描述为:利用人工智能算法对工业生产过程进行优化,以提高生产效率和品质和利用人工智能算法对城市交通进行管理和调度,以提高交通效率和减少拥堵等。
如果把视角拉回至GPT,会发现,其图像描述、视频字幕、语音识别和对话系统领域均存在应用场景。在以上基础上,由于计算机将对语言表达有更精准理解,结合多模态数据,智能客服、智能家居、医疗等行业的智能化将有巨大飞跃。
目前,在数科星球(ID:digital-planet)所关注的项目和投资机构中,得到的最多表述是;“Domain Model(领域模型)会进一步释放AIGC的市场空间”。由于Domain Model具有在软件中实现特定业务领域实现对象和规则的能力,这样一来,开发人员便可以依据此更好地理解业务需求从而转化为代码实现。
另外,在预训练模型中数据流的输入、输出分离技术也可进一步提高AIGC的通用性和灵活性,从另一个角度而言,也降低了其部署难度。(从技术角度上,之前大模型中存在数据不匹配、模型泛化能力不足等问题,如若将输入、输出分离,可以让不同行业使用相同模型和算法,这样一来,则降低了大模型在进入细分市场的门槛和成本,也利于这类公司拥有更多的市场份额和更强的竞争力)。
目前,在国内,AIGC同样发展迅速,文心一言的刷屏便可见一斑。较之GPT与文心一言,网络上虽有不同意见,实际上,数科星球(ID:digital-planet)认为,国内的AIGC行业正是因为焦虑的产生反而更加有前景。
在产品上,国内企业仍有较强竞争力,这体现在三个方面:
首先,国内巨头企业大多都有创造巨型用户基础产品的经验,比如在广告、社交媒体和活动等方式获取用户的经验可再次迁移。
其次,国内对产品的二次开发经验相当丰富。“我们认为,未来可能有更多更好玩的应用GPT等产品的场景存在”,一位投资人说。
再次,对比GPT未将大量资源投入中文语境的事实,一些人觉得依赖本土文化和国内数据可弥补GPT目前在这些方面的短板。
在技术突破上,仍有一些跨行技术可用于AIGC的弯道超车:
“我觉得对于中国来说还有一个利好,那就是我们在并行计算上的优势”,一位从业者这样说。在近日,硬件不足的问题受到了广泛关注,甚至有文章称发生了“几个专家抢一块卡”的事情。在一些人看来,如若将分布式计算技术应用至AIGC领域,则可通过在多台计算机并行子任务的方式提升速度和效率,而不用依赖单节点计算性能。
“对于这个问题,你可以理解成这是一个性价比关系,比如如果3090、4090显卡只有好显卡的1/2性能,但成本更低的话,那么异构计算就有可能成为现实,并有一定经济性”,一位从业者表示。(对比来说,3090和4090显卡的硬件设计在内存带宽、内存容量有瑕疵,并不具备Tensor Cores和Sparsity等技术,但如果任务规模较小或要求不是很高,3090和4090显卡也可以作为替代选择。)
还有,在国内,AIGC的应用场景仍然广阔。
“在RPA领域,AIGC可以满足软件自动化在逻辑层输入的相关需求”,一位从业者表示。在他看来,AIGC可以帮助RPA系统更好地处理复杂、结构化和非结构化数据,从而提高自动化程度和准确性。其次,AIGC可以通过分析和学习数据,实现更加智能化的RPA自动化流程,从而提高效率和降低成本。另外,AIGC还可以实现跨系统、跨部门和跨业务领域的数据共享和整合,从而实现更加全面的RPA自动化。
可以说,AIGC对于RPA行业来说是一项重要的技术进步,它将带来更高效、更智能、更全面的自动化流程,为企业带来更多的商业价值。
目前,在国内,诸如RPA行业的需求还有很多,而这一点也是国内AIGC能够最终崛起的重要参数之一。在一些人看来,AIGC由于有着天然的对To C的友好度,使得其在诸如SaaS等行业赋能场景颇多。“我们的SaaS相当于美国的1/7,在这1/7里大多数数字化需求又有80%在国营公司中,我认为AIGC是能够进一步推动这些企业进行数字化的”,一位投资者表示。
来源:金色财经