把一张图片喂给AI 500次会发生什么?小白也能会|正经玩
ChatGPT和Deepseek火了!可是你知道除了大语言模型之外,AI在图像领域其实有很多好玩的吗?把一张图片喂给AI 500次会发生什么呢?如果你想自己动手尝试一下的话那就看下去吧~
实验器材
电脑、所标杯
第一步:
第二步:
第三步:
第四步:
原理解说
AI绘画的核心技术是“扩散模型”。其工作原理分为两个阶段:首先,系统对一张原始图片逐步添加随机噪声,经过多轮迭代后,图片最终会变成完全无意义的静态噪点——这一步叫“前向扩散过程”。接着,神经网络通过大量学习训练,掌握如何从这团噪点中一步步去除噪声,逐步重建出清晰的图像——这一步叫“反向生成过程”。用户输入的文本描述(提示词)会被专门的文本编码模型转化为数学向量,这个向量会在图像重建过程中持续引导AI,确保最终生成的画面符合文字要求。
Deforum模型是基于上述扩散模型的动态视频生成技术。它的目标是将静态图像生成扩展为连贯的视频序列,就是大家最后看到的视频效果。其运作机制包含三个关键环节:1) 初始化设定:用户提供起始图像或由AI生成首帧画面,并通过参数控制其与后续变化的关联强度;2) 运动与内容控制:用户可精确设置镜头运动轨迹(如平移、缩放、旋转,我们此处把这些数值都设置为了0)、定义不同时间点的文本描述(就是不同帧的不同提示词),并调节帧与帧之间的噪声变化幅度来控制画面演变的剧烈程度;3) 时间连贯性保障:Deforum的核心在于它会将前一帧生成结果的关键数据(称为“潜变量”),经过预设的运动变换计算后,作为生成下一帧的起点,并在生成过程中参考这些历史数据。这种方法显著减少了帧与帧之间的跳跃或闪烁,努力维持场景元素、色调和构图的相对稳定性。