AI-Pick - 精选AI工具导航

导航首页 »  文章列表 »  工具评测

深度评测|xAI发布Grok Imagine Video 1.5正式版:25秒生成6秒720P视频,图生视频能力实测

2026-06-18    AI-Pick - 精选AI工具导航    已浏览2次


2026年6月17日,马斯克旗下xAI公司正式宣布Grok Imagine Video 1.5模型结束预览,全面上线。此前该模型于6月3日推出预览版,主打"静态图一键生成带同步音频的短视频"。经过两周的预览和迭代,正式版不仅在生成速度上大幅提升,在画质和音频同步方面也有显著进步。本文将带你全面了解这款新模型的实际表现。

一、核心参数一览

Grok Imagine Video 1.5的核心参数令人眼前一亮:

  • 输入:单张静态图片 + 文本提示词(描述镜头运动、节奏和氛围)
  • 输出:最高720p分辨率、6秒短视频
  • 生成速度:约25秒(从上传图片到输出视频)
  • 音频:支持生成同步音频(区别于纯视频生成)
  • 多镜头:支持多个镜头片段组合
  • 细节保留:在让画面动起来的同时,尽量保留原始图片的细节和光照

对比竞品:Sora 2生成相同画质视频约需60秒,Kling AI Pro约需40秒。Grok Imagine Video 1.5在速度上有明显优势。

二、画质与动态效果实测

我们在实际测试中使用了三张不同类型的图片进行测试:

场景一:自然风光照片
输入一张日落海滩照片,提示词"海浪缓缓涌动,云层缓慢飘移,夕阳余晖在水面闪烁"。输出结果中,水面波纹和云层运动非常自然,光影变化流畅,几乎看不出是AI生成的动态效果。这是Grok Imagine的重头戏——自然场景的动态化处理。

场景二:人物肖像
输入一张人物半身照,提示词"人物微微侧头,微笑,头发被风吹动"。输出让人满意:人物面部表情自然,头发飘动的物理效果真实,口型虽然没有说话但整体动态合理。不过在快速转头时会出现轻微的不连贯。

场景三:产品展示
输入一张电子产品照片,提示词"产品360度旋转展示,背景渐变光晕"。这一测试中,产品本身保持清晰稳定,旋转轨迹平滑,但产品边缘在旋转过程中有轻微的闪烁artifact。

总体而言,Grok Imagine Video 1.5在画质和动态自然度上达到了当前图生视频工具的一流水准,尤其在自然场景和人物微动态方面表现突出。

三、音频同步能力

Grok Imagine Video 1.5的一大亮点是支持生成同步音频。在测试中,我们输入了"海浪拍打沙滩,海鸥鸣叫"的提示词,生成的视频不仅画面中海浪在动,还同步生成了逼真的海浪声和环境音。不过音频的丰富度还有提升空间——目前生成的音频更偏向环境氛围音,而非精准音效匹配。

四、价格与可用性

Grok Imagine Video 1.5目前已通过xAI API正式上线。订阅Grok Super Tier的用户可以直接在Grok平台使用此功能。API价格方面,xAI采用了按秒计费模式,相比预览版有一定的价格调整。在Artificial Analysis的对比中,Grok Imagine Video 1.5的性价比处于行业中上水平。

五、使用建议

  • 社交媒体短视频:非常适合将静态照片转化为动态短视频,用于小红书、Instagram等平台
  • 产品展示:电商产品展示场景效果不错,但需要注意复杂背景下的边缘处理
  • 创意内容:艺术创作者可以用它快速将概念图转化为动态预览
  • 广告素材:生成动态广告素材时,建议使用简单背景以获得最佳效果

综合评分:⭐⭐⭐⭐(4/5)——速度领先,画质优秀,音频同步是差异化亮点,但在快速动态场景中仍有改进空间。

→ 立即体验Grok,收藏到 AI Pick 导航站