Intel Extension for PyTorch「v2.6.10+xpu」登場

Ubuntu
スポンサーリンク

ちらっとこのページを見てみましたが、Windowsの方はインストールが簡単になったみたいですね。
condaを使わなくても良さそうです。試してませんけど。

condaは必要みたいです、ごめんなさい。

2025/3/16
チャレンジしてみましたが、「intel-ext-pt-gpu.dll」が見つからないと表示されてComfyUIが実行できませんね・・・。ChatGPTに相談してみたんですが、Intel oneAPI Base ToolkitとVisual Studioが必要かもしれないとのことでした。あるいはconda環境にdpcpp_cpp_rtをインストールするといけるかもみたいに言われましたが、ここまでくると面倒になってしまいます。そもそもIntel oneAPI Base ToolkitとVisual Studioをインストールするなら、今後の事を考えてソースからビルドする手順を覚えておいた方が確実な気がします。

一方、Linuxではまだビルドが必要みたいです(battlemageの話)。
というわけで、やっていきます。
とはいえ手順はこの記事とほとんど変わりません。

違いは

wget https://github.com/intel/intel-extension-for-pytorch/raw/v2.5.10%2Bxpu/scripts/compile_bundle.sh

の部分が

wget https://github.com/intel/intel-extension-for-pytorch/raw/v2.6.10%2Bxpu/scripts/compile_bundle.sh

に置き換わっていることくらいです。
但し2025/3/13日現在、自分の環境の問題かもしれませんがダウンロードしたインストールスクリプトの「compile_bundle.sh」の中の430行目あたりの

export PYTORCH_EXTRA_INSTALL_REQUIREMENTS="intel-cmplr-lib-rt==2025.0.2|intel-cmplr-lib-ur==2025.0.2|intel-cmplr-lic-rt==2025.0.2|intel-sycl-rt==2025.0.2|tcmlib==1.2.0|umf==0.9.1|intel-pti==0.10.0"

の部分の「2025.0.2」を「2025.0.4」に書き換えないと、ComfyUIの実行でコンフリクトエラーが発生しました。具体的には、

export PYTORCH_EXTRA_INSTALL_REQUIREMENTS="intel-cmplr-lib-rt==2025.0.4|intel-cmplr-lib-ur==2025.0.4|intel-cmplr-lic-rt==2025.0.4|intel-sycl-rt==2025.0.4|tcmlib==1.2.0|umf==0.9.1|intel-pti==0.10.0"

のように書き換えです。
「intel-cmplr-lib-rt」でテキストファイル内を検索するとみつかると思います。

その後

time bash compile_bundle.sh /opt/intel/oneapi/compiler/latest /opt/intel/oneapi/mkl/latest /opt/intel/oneapi/ccl/latest /opt/intel/oneapi/mpi/latest /opt/intel/oneapi/pti/latest lnl-m 2> >(tee -a error_log.txt >&2)

でビルド開始です。
timeはお好みで。

以前wanの動画生成をやったときとどのくらい速くなったかなぁと試してみました。

画像の生成はこちらの記事で。結構速かったです。

というわけで、新しいIPEXを試したお話でした。
今回は以上です。

一応自分の環境でビルドしたファイルを上げておきます。
https://mega.nz/folder/caFFEDZK#nJcGSV8A509V384gpx5kdg
python3.10の環境でビルドしたIPEXなので、A1111でもComfyUIでも使えると思います。
あ、でも動作保証はしません。

SPARKLE Intel Arc B580 グラフィックカードOC版 トリプルファン「TITAN」シリーズ ホワイトカラーモデル [ B580 TITAN Luna OC 12GB ]
SPARKLE Intel® Arc™ B580 TITAN OC グラフィックス カードは、Intel XeSS AI アップスケーリング、レイ トレーシング、8K メディア サポートによる高解像度のゲーム体験に加え、Intel AI P...
SPARKLE Intel Arc B580 グラフィックカードOC版 トリプルファン「TITAN」シリーズ [ B580 TITAN OC 12GB ]
SPARKLE Intel® Arc™ B580 TITAN OC グラフィックス カードは、Intel XeSS AI アップスケーリング、レイ トレーシング、8K メディア サポートによる高解像度のゲーム体験に加え、Intel AI P...
Intel Arc Bシリーズ Intel Arc B580 Limited Edition Graphics ビデオカード 国内正規代理店品
強力なメディアエンジン:IntelのリーディングXeツインマルチフォーマットトランスコーダー(MFX)を備えたメディアエンジンは、マルチメディア(ビデオ)のより高速で高品質な作成と再生をサポートするように設計されています。GPUには、AV1...

追記
これも自分の環境だけかもしれませんが、ComfyUI実行時に「ImportError: /home/test/miniconda3/bin/../lib/libstdc++.so.6: version `GLIBCXX_3.4.30′ not found」のようなエラーが出ました。

conda update libstdcxx-ng

でminicondaのパッケージを更新すると解決しましたが、

sudo apt update
sudo apt install g++-13

でも大丈夫みたいです。
もし、同じ問題が起きた場合思い出してください。

コメント

  1. 通りすがりのB580使用者 より:

    最近stable diffusion forge(windows環境)でB580(使用グラボはArc B580 Challenger 12GB OC)を使っていて、「明らかに通常版(A1111)で生成するより速い」と思ったので比較してみました。(pytorchは両方ともv2.5.10xpu)
    通常版(A1111 起動オプションは–opt-sdp-attention –opt-sdp-no-mem-attention –opt-channelslast)ではハローアスカ(10枚生成で起動)26.0s
    Forge版では20.6sと生成速度が3割近くも違いました(reforge版も試しましたが、Forge版とあまり変わりませんでした)。
    何故ここまで生成速度が違うのかは不明ですが(vramの総容量の関係?)、Arc B580でstable diffusionを動かす場合、特に拘りが無ければ(re)Forge版を導入したほうがよさそうです。
    ちなみにXLでも両方ためしてみたところ、A1111 とForgeでの生成速度の差はForge版の方が5-10%速い感じでした(XLのほうが差が少ない)。

    • toaru-ubuntu より:

      情報ありがとうございます!
      B580ってそんなに速くなったの?って思ったので、今自分もComfyUIにハローアスカのPNGをドラッグアンドドロップで10枚生成してみました。
      15.06秒だったです。
      あれ?設定間違えたかな?
      普通こんなに速くないですよね?
      もし、ComfyUIの環境をお持ちでしたら試してみてください。
      ちなみにちもろぐさんの「1024×1648:神里綾華(SDXL + LoRA + ControlNet)」ベンチもComfyUIで試してみたら、47秒くらいでした。
      ちょっと記事にしようかな、と思ってます。

タイトルとURLをコピーしました