ollamaのカスタム版、ollama-ipex-llmを動作させてみた(GPUで)(Ubuntu編)

Ubuntu
スポンサーリンク

先日、ollamaを使ってgtp-oss:120bを動作させてみました。
ですが、本家ollamaはまだIntel GPUに対応していません。
今回は、Intelが独自に開発している「ollama-ipex-llm」をUbuntuで動作させてみました。
これなら、ARCでも動作させられます。

GPUは・・・

今回はARC B570で動作確認しています。
諸事情がありまして、B580はすでに手放しています。

それではやってみましょう。

まずは、ドライバとoneAPIのインストール

ドライバ
https://dgpu-docs.intel.com/driver/client/overview.html#client-intel-package-repository-configuration

oneAPI
https://www.intel.com/content/www/us/en/developer/tools/oneapi/base-toolkit-download.html

最新版があるかもしれないので、できれば上記リンクからインストールしてください。
自分は、以下のようにしました。

ドライバは以下のスクリプト

#!/bin/bash

sudo apt-get update
sudo apt-get install -y software-properties-common
sudo add-apt-repository -y ppa:kobuk-team/intel-graphics
sudo apt-get install -y libze-intel-gpu1 libze1 intel-metrics-discovery intel-opencl-icd clinfo intel-gsc
sudo apt-get install -y intel-media-va-driver-non-free libmfx1 libmfx-gen1 libvpl2 libvpl-tools libva-glx2 va-driver-all vainfo
sudo apt-get install -y libze-dev intel-ocloc
sudo apt-get install -y libze-intel-gpu-raytracing

sudo usermod -aG render $USER
sudo usermod -aG video $USER

oneAPIは以下のスクリプト

#!/bin/bash

sudo apt update
sudo apt install -y gpg-agent wget

# download the key to system keyring
wget -O- https://apt.repos.intel.com/intel-gpg-keys/GPG-PUB-KEY-INTEL-SW-PRODUCTS.PUB \
| gpg --dearmor | sudo tee /usr/share/keyrings/oneapi-archive-keyring.gpg > /dev/null

# add signed entry to apt sources and configure the APT client to use Intel repository:
echo "deb [signed-by=/usr/share/keyrings/oneapi-archive-keyring.gpg] https://apt.repos.intel.com/oneapi all main" | sudo tee /etc/apt/sources.list.d/oneAPI.list

sudo apt update
sudo apt install intel-oneapi-base-toolkit

ollama-ipex-llmのダウンロード

Releases ?? ipex-llm/ipex-llm
Accelerate local LLM inference and finetuning (LLaMA, Mistral, ChatGLM, Qwen, DeepSeek, Mixtral, Gemma, Phi, MiniCPM, Qw...

上記のリンクから「ollama-ipex-llm-2.3.0b20250725-ubuntu.tgz」をダウンロードします。
ダウンロードしたら、解凍しましょう。

ちなみにバージョンは更新されるかもしれません。
気になる人は、「https://github.com/ipex-llm/ipex-llm」にてチェックしておくと良いでしょう。

ollama-ipex-llmの実行

解凍すると「ollama-ipex-llm-2.3.0b20250725-ubuntu」というフォルダが出来上がりますので、その中に入って、

./start-ollama.sh

で実行。

このようになったら、このターミナルとは別のターミナルを開いて、

ollama pull qwen3:8b 

と入力。今回は動作テストなので10GBのVRAMに収まるよう「qwen3:8b」をダウンロード。
ダウンロードが済んだら、

time ollama run qwen3:8b "動作テストします。適当に何か話してください。"

と入力。

とりあえず、ARC B570での動作確認がとれました。

ただ、このままでは大きなモデルの動作はできません。VRAMのオーバーフローでクラッシュしてしまうからです。
次の記事では、そのへんの対応を書きますね。

今回は以上です。

コメント

タイトルとURLをコピーしました