最近几天的海外社媒被「吉卜力风格」的艺术图像席卷,用户在社交媒体上分享吉卜力艺术风的照片,被业内人士看作是一股吉卜力风的meme潮流。
有人生成并发布吉卜力画风的马斯克(Elon Musk)、特朗普(Donald Trump)、「魔戒」(The Lord of the Rings)等的图像和影片。OpenAI CEO阿尔特曼(Sam Altman)也把吉卜力画风的个人图像设为自己社交平台X的头像。
吉卜力风格是指由日本吉卜力工作室所代表的一种美学风格,具有温暖、奇幻和细腻的手绘质感,知名作品《千与千寻》、《龙猫》等电影都是吉卜力工作室的代表作品。
过去几天里,用户在社交媒体上疯狂分享这些细腻、柔和色调的图像。这都得益于3月25日OpenAI推出的ChatGPT-4o图像生成功能。
搜索数据显示,新模型上线后,“ChatGPT”这个关键词在 Google Trends 上短暂超过了“Google”本身。并在周一(3月30日)仅一小时内为ChatGPT带来了超过 100 万人注册。OpenAI的CEO阿尔特曼称GPT-4o为「有史以来最好的模型」、「这是有史以来,我们发表过最有趣、最酷的东西。」
不过新模型的推出和海量用户的涌入造成了ChatGPT的算力资源的紧张。
阿尔特曼在社交媒体中表示GPU正在融化。
这是因为 GPT-4o 的图像生成方式与以往的 AI 艺术工具截然不同,它使用了更强的计算能力。大多数图像生成器采用扩散模型(Diffusion Models),即从一团随机像素开始,不断调整直至形成一幅清晰的图像。
但 GPT-4o 采用的是自回归方法(Autoregressive Approach),它按像素顺序逐个预测,像处理文本推理一样。且 GPT-4o 不再调用独立的 DALL-E 文生图模型,而是利用GPT-4o的多模态能力在图像生成时更加精确地遵循指示、更精确地渲染图像上的文字,同时支持在多轮迭代优化图像时并保持角色形象一致。
这种方法可以带来更精准的细节和更好的文字渲染,但对 OpenAI 的 GPU 而言却正在「融化」。
简单来说,ChatGPT的图像生成和其它AI模型的生成是“画一幅油画”和“拼一幅马赛克”的区别。当用户每请求一张图片,都会触发多个 GPU 核心并行执行复杂的数学计算,消耗大量电力,并产生高温。如果长时间满负荷运行,硬件可能会遭到损害。
要想解决GPU算力资源消耗过大的问题,背靠微软、软银实力强大的OpenAI无需担心算力资源不足的问题。但如何将强大的GPU算力动态均衡供给OpenAI大模型,基于AI技术、区块链和隐私技术的去中心化算力云服务或是一种解决方案。
对Google、微软、AWS、英伟达等中心化算力巨头来说,算力资源的供给不是担忧。但如何动态均衡供给——例如24小时动态均衡供给大模型,会是当前需要考虑的问题。此前在ChatGPT推出市场不久,大多数AI大模型给出了用户在夜间可以不受限制的使用AI,或也是基于算力资源和性能的考虑。
去中心化算力云服务(如PowerVerse)能够解决不均衡供给、提供高性能算力、降低算力使用门槛和费用的问题,相信这会是不远的未来前沿科技所需的DePIN基础设施。