2024年5月14日,OpenAI发布了更新的大模型GPT-4o,并在ChatGPT中免费提供了更多的功能,这款新产品在文本、图像、音频和视频等多模态融合尝试方面展现出强大的能力,能够以这三者的任意组合进行输入和输出,交互方式更为多样和自然,且新模型性能更强,接口调用价格只有此前模型的一半。
同期,在2024年5月15日举行的2024 年 I/O 大会,Google宣布全面进入Gemini时代,会上连续发布、更新了十多款产品,包括AI助手Astra、文生图模型Imagen3、对标Sora的文生视频模型Veo,以及旗舰大模型Gemini,除此之外,Google也展示了在AI搜索领域的布局和创新以及其在智能手机操作系统的优化上的努力。
IDC以OpenAI和Google发布会为背景,分析了中国生成式AI市场值得关注的市场机会,旨在为技术供应商和行业用户提供参考。
趋势一:多模态大模型将在未来塑造 “多边形战士”应用
多模态人工智能模型将使用多种类型的数据进行训练,如文本、图像、视频、音频和代码等数据进行学习来创建新内容。未来技术一定是朝向多模态token输入、多模态token输出的形式发展。从模态来看,中国市场AI开发者开发的模型多为基于文本和图像等单模态模型,今年预计将会向多模态、音视频等生成式AI模型积极尝试,这一进展预计会优化在针对个人生产效率提升、生活办公的一些AI助手类应用,并提升此类应用的用户交互体验。
趋势二:为了加速大模型和生成式AI应用的落地,MaaS、AI Agent、App Builder等多种产品形态浮出水面
连接平台和应用侧的产品演变方向出现了多种形式,例如更普惠的模型即服务(MaaS)、更协同的AI 智能体(AI Agent)、更低门槛的应用开发工具(App Builder)等在市场中纷纷出现。这些产品的出现使得大模型、生成式AI更加易用,这将大大降低大模型、生成式AI技术的使用门槛,从而使得行业用户更加普惠地使用大模型、生成式AI技术,也能解决企业内部人才、算力、数据不足的挑战。
趋势三:生成式AI将在各个生产效率提升、业务职能和行业应用中无处不在
应用层创新成为产业发展驱动力——从应用场景来看生成式AI已经在各个领域得到探索,无论是像文案撰写和内容生成、在线会议总结还是OpenAI和Google此次“带火”的AI助手、搜索类应用,面向个人生产效率提升的应用场景的交互体验会逐步提升,另外无论是面向客服、营销等水平业务职能的场景还是行业特有场景的应用落地都将会是今年市场关注的重点。