Intel Extension for PyTorch「v2.6.10+xpu」登場

Ubuntu

2025.03.132025.03.22

ちらっとこのページを見てみましたが、Windowsの方はインストールが簡単になったみたいですね。
condaを使わなくても良さそうです。試してませんけど。
condaは必要みたいです、ごめんなさい。

2025/3/16
チャレンジしてみましたが、「intel-ext-pt-gpu.dll」が見つからないと表示されてComfyUIが実行できませんね・・・。ChatGPTに相談してみたんですが、Intel oneAPI Base ToolkitとVisual Studioが必要かもしれないとのことでした。あるいはconda環境にdpcpp_cpp_rtをインストールするといけるかもみたいに言われましたが、ここまでくると面倒になってしまいます。そもそもIntel oneAPI Base ToolkitとVisual Studioをインストールするなら、今後の事を考えてソースからビルドする手順を覚えておいた方が確実な気がします。

一方、Linuxではまだビルドが必要みたいです（battlemageの話）。
というわけで、やっていきます。
とはいえ手順はこの記事とほとんど変わりません。

違いは

wget https://github.com/intel/intel-extension-for-pytorch/raw/v2.5.10%2Bxpu/scripts/compile_bundle.sh

の部分が

wget https://github.com/intel/intel-extension-for-pytorch/raw/v2.6.10%2Bxpu/scripts/compile_bundle.sh

に置き換わっていることくらいです。
但し2025/3/13日現在、自分の環境の問題かもしれませんがダウンロードしたインストールスクリプトの「compile_bundle.sh」の中の430行目あたりの

export PYTORCH_EXTRA_INSTALL_REQUIREMENTS="intel-cmplr-lib-rt==2025.0.2|intel-cmplr-lib-ur==2025.0.2|intel-cmplr-lic-rt==2025.0.2|intel-sycl-rt==2025.0.2|tcmlib==1.2.0|umf==0.9.1|intel-pti==0.10.0"

の部分の「2025.0.2」を「2025.0.4」に書き換えないと、ComfyUIの実行でコンフリクトエラーが発生しました。具体的には、

export PYTORCH_EXTRA_INSTALL_REQUIREMENTS="intel-cmplr-lib-rt==2025.0.4|intel-cmplr-lib-ur==2025.0.4|intel-cmplr-lic-rt==2025.0.4|intel-sycl-rt==2025.0.4|tcmlib==1.2.0|umf==0.9.1|intel-pti==0.10.0"

のように書き換えです。
「intel-cmplr-lib-rt」でテキストファイル内を検索するとみつかると思います。

その後

time bash compile_bundle.sh /opt/intel/oneapi/compiler/latest /opt/intel/oneapi/mkl/latest /opt/intel/oneapi/ccl/latest /opt/intel/oneapi/mpi/latest /opt/intel/oneapi/pti/latest lnl-m 2> >(tee -a error_log.txt >&2)

でビルド開始です。
timeはお好みで。

以前wanの動画生成をやったときとどのくらい速くなったかなぁと試してみました。

画像の生成はこちらの記事で。結構速かったです。

というわけで、新しいIPEXを試したお話でした。
今回は以上です。

一応自分の環境でビルドしたファイルを上げておきます。
https://mega.nz/folder/caFFEDZK#nJcGSV8A509V384gpx5kdg
python3.10の環境でビルドしたIPEXなので、A1111でもComfyUIでも使えると思います。
あ、でも動作保証はしません。

SPARKLE Intel Arc B580 グラフィックカードOC版トリプルファン「TITAN」シリーズホワイトカラーモデル [ B580 TITAN Luna OC 12GB ]

SPARKLE Intel® Arc™ B580 TITAN OC グラフィックスカードは、Intel XeSS AI アップスケーリング、レイトレーシング、8K メディアサポートによる高解像度のゲーム体験に加え、Intel AI P...

SPARKLE Intel Arc B580 グラフィックカードOC版トリプルファン「TITAN」シリーズ [ B580 TITAN OC 12GB ]

Intel Arc Bシリーズ Intel Arc B580 Limited Edition Graphics ビデオカード国内正規代理店品

強力なメディアエンジン:IntelのリーディングXeツインマルチフォーマットトランスコーダー(MFX)を備えたメディアエンジンは、マルチメディア(ビデオ)のより高速で高品質な作成と再生をサポートするように設計されています。GPUには、AV1...

追記
これも自分の環境だけかもしれませんが、ComfyUI実行時に「ImportError: /home/test/miniconda3/bin/../lib/libstdc++.so.6: version `GLIBCXX_3.4.30′ not found」のようなエラーが出ました。

conda update libstdcxx-ng

でminicondaのパッケージを更新すると解決しましたが、

sudo apt update
sudo apt install g++-13

でも大丈夫みたいです。
もし、同じ問題が起きた場合思い出してください。

通りすがりのB580使用者より:

2025年3月15日 5:44 PM

最近stable diffusion forge(windows環境)でB580(使用グラボはArc B580 Challenger 12GB OC)を使っていて、「明らかに通常版(A1111)で生成するより速い」と思ったので比較してみました。(pytorchは両方ともv2.5.10xpu)
通常版(A1111 起動オプションは–opt-sdp-attention –opt-sdp-no-mem-attention –opt-channelslast)ではハローアスカ(10枚生成で起動)26.0s
Forge版では20.6sと生成速度が3割近くも違いました(reforge版も試しましたが、Forge版とあまり変わりませんでした)。
何故ここまで生成速度が違うのかは不明ですが(vramの総容量の関係?)、Arc B580でstable diffusionを動かす場合、特に拘りが無ければ(re)Forge版を導入したほうがよさそうです。
ちなみにXLでも両方ためしてみたところ、A1111 とForgeでの生成速度の差はForge版の方が5-10%速い感じでした(XLのほうが差が少ない)。

返信

toaru-ubuntu より:

2025年3月15日 7:22 PM

情報ありがとうございます！
B580ってそんなに速くなったの？って思ったので、今自分もComfyUIにハローアスカのPNGをドラッグアンドドロップで１０枚生成してみました。
15.06秒だったです。
あれ？設定間違えたかな？
普通こんなに速くないですよね？
もし、ComfyUIの環境をお持ちでしたら試してみてください。
ちなみにちもろぐさんの「1024×1648：神里綾華（SDXL + LoRA + ControlNet）」ベンチもComfyUIで試してみたら、４７秒くらいでした。
ちょっと記事にしようかな、と思ってます。

返信

通りすがりのB580使用者より:

2025年3月15日 5:44 PM

最近stable diffusion forge(windows環境)でB580(使用グラボはArc B580 Challenger 12GB OC)を使っていて、「明らかに通常版(A1111)で生成するより速い」と思ったので比較してみました。(pytorchは両方ともv2.5.10xpu)
通常版(A1111 起動オプションは–opt-sdp-attention –opt-sdp-no-mem-attention –opt-channelslast)ではハローアスカ(10枚生成で起動)26.0s
Forge版では20.6sと生成速度が3割近くも違いました(reforge版も試しましたが、Forge版とあまり変わりませんでした)。
何故ここまで生成速度が違うのかは不明ですが(vramの総容量の関係?)、Arc B580でstable diffusionを動かす場合、特に拘りが無ければ(re)Forge版を導入したほうがよさそうです。
ちなみにXLでも両方ためしてみたところ、A1111 とForgeでの生成速度の差はForge版の方が5-10%速い感じでした(XLのほうが差が少ない)。

返信
- toaru-ubuntu より:
  
  2025年3月15日 7:22 PM
  
  情報ありがとうございます！
  B580ってそんなに速くなったの？って思ったので、今自分もComfyUIにハローアスカのPNGをドラッグアンドドロップで１０枚生成してみました。
  15.06秒だったです。
  あれ？設定間違えたかな？
  普通こんなに速くないですよね？
  もし、ComfyUIの環境をお持ちでしたら試してみてください。
  ちなみにちもろぐさんの「1024×1648：神里綾華（SDXL + LoRA + ControlNet）」ベンチもComfyUIで試してみたら、４７秒くらいでした。
  ちょっと記事にしようかな、と思ってます。
  
  返信