動画生成AIを「intel ARC B580」でどのくらい動かせるのか試してみた。

Ubuntu

非常に重たい動画生成AIですが、今回は「SkyReels」を使ってComfyUIで動かしてみます。
Ubuntuで動作させていますが、Windowsでも同様だと思います。

以前、ComfyUIの導入方法を記事にしているのでそちらもご覧ください。
intel ARC B580でComfyUIを動作させる(Ubuntu編)
intel ARC B580でComfyUIを動作させる(Windows編)

SkyReels導入の参考サイト
https://huggingface.co/Kijai/SkyReels-V1-Hunyuan_comfy

まずはワークフローからダウンロード。

次はモデルです。

ダウンロードしたモデルを(./ComfyUI/models/diffusion_models)にコピーします。
あとは、適当なところから必要なものをダウンロード。
とりあえず、これで動いています。

テキストエンコーダ( ./ComfyUI/models/text_encoders)
https://huggingface.co/calcuis/hunyuan-gguf/blob/main/clip_l.safetensors
https://huggingface.co/calcuis/hunyuan-gguf/blob/main/llava_llama3_fp8_scaled.safetensors

VAE( ./ComfyUI/models/vae)
https://huggingface.co/calcuis/hunyuan-gguf/blob/main/hunyuan_video_vae_bf16.safetensors

動画生成を試してみる

商用利用できそうなモデル「BlazingRealDrive」を使ってstable diffusionで画像を生成。

これをベースのイメージにして、SkyReelsでプロンプト「FPS-24, The girl is spinning around happily.」を使って4秒の動画生成。
起動オプションに「–novram」を付けてます。
モデルが25.6GBもあるので「–novram」を付けないとARC B580はすぐクラッシュします。

動画を生成中

外付けディスプレイ

相変わらずメインメモリの使用量すごいです。
グラフィックスカードの消費電力も200W近くまで上がっています。
あ、外付けディスプレイについてはここの記事を見てくださいね。

なんか無表情なんですよね・・・、お願い笑って。

自分はAI絵師ではないので詰めが甘く、動画の出来が良くないのは勘弁してください。
一度生成するのに36分もかかりますが、小さいモデルの方だと40分を超えてきます。

BattlemageのVRAM大容量、24GBくらい?いやもっと多くても良いんですよ。
Intelさんには新GPUを期待してます。

今回は以上です。

追記
モデルファイル等がVRAMに収まるとどのくらいスピードが上がるのか?
動画生成AIでもモデルファイルがVRAMに収まる場合は生成速度はどうなるのか?
こちらの記事で紹介しています。
モデルの進化とVRAMの増量。どちらにも期待したいですね。

コメント

タイトルとURLをコピーしました