Amazonのアソシエイトとして、当ブログは適格販売により収入を得ています。
以前、こちらの記事でRyzen9 7900の内蔵GPUを使ってIrodori-TTSを動かす記事を書きました。
この時は動くには動いたのですが、生成された音声がノイズだったり、生成に時間がかかったり問題だらけでした。
今回Ryzen7 8700Gを使ってうまく生成できるようになったので記事にしますね。
uvのインストール

Irodori-TTS本家のリポジトリです。
uvで環境を構築しているようなので、こちらの記事を参考にuvをインストールしてください。
ffmpegをインストール
Irodori-TTSを動かすにはffmpegが必要です。
sudo apt install ffmpegでインストールするのが最も簡単です。
ROCmのインストール
同じくIrodori-TTS本家でROCm環境をインストールする方法がありますので、そちらを利用しようと思ったのですが、

そもそもRyzen7 8700G(Radeon 780M)のROCmの対応状況は若干怪しい部分があるので、ここは「TheRock」のプリビルド版を利用します。
# 必要なライブラリやツールをインストール
sudo apt audate
sudo apt install git cmake pkg-config build-essential python3.12-dev
# 警告が出ないよう以下をインストールします(しなくてもIrodori-TTSは動作します)
sudo apt install libnuma1 libnuma-dev
# Irodori-TTSをクローン
git clone https://github.com/Aratako/Irodori-TTS.git
cd Irodori-TTS
uv venv --python 3.12
source .venv/bin/activate
uv pip install --index-url https://rocm.nightlies.amd.com/whl-multi-arch/ "torch[device-gfx1103]" "torchvision[device-gfx1103]" torchaudio「gfx1103」を指定しているので、8000Gシリーズならどれでも大丈夫でしょう。
次にrequirements.txtのインストールですが、例によって「torch」「torchaudio」を除外します。
こうしないと、せっかくインストールしたROCm環境がcuda版で汚染上書きされてしまいます。

そうしたら、以下のコマンドを実行。
uv pip install -r requirements.txt
sudo usermod -a -G render $USER
sudo usermod -a -G video $USERコマンドを実行したあとは、システムを再起動しましょう。
再起動しない場合はCPU動作になってしまいます。
Irodori-TTSで音声を生成
公式のページにあるプロンプトを若干変更して利用してみます。
uv run --no-sync python infer.py \
--hf-checkpoint Aratako/Irodori-TTS-600M-v3-VoiceDesign \
--text "どうしてもっと早く教えてくれなかったの?私、ずっと待ってたのに。" \
--no-ref \
--caption "深く傷つき、今にも泣き出しそうな様子。声が震えており、悲痛なトーンで弱々しく話す。" \
--output-wav outputs/test_voice.wav

これは例によって「MIOpen」が動いちゃってるせいなので、「inference_runtime.py」を少し書き換えます。

import time
from collections.abc import Callable
from dataclasses import dataclass
from pathlib import Path
import torch
import torchaudio
#下の2行ほど追加してください
torch.backends.cudnn.enabled = False
torch.backends.cudnn.benchmark = False
# これで、AMD(ROCm)環境でのMIOpenのバグを防ぎ、安全な計算を強制する
from safetensors import safe_open
from safetensors.torch import load_file as load_safetensors_file「torch.backends.cudnn.enabled = False
torch.backends.cudnn.benchmark = False」
の2行を書き加えることで、MIOpenは動かなくなります。

出来上がった音声です。
以前のようにノイズではありません。
ちゃんと生成されています。
最後に
Gemma-4やQwen3.6を高速で利用したくてグラフィックスカードを物色していたんですが、最近は軒並み高額化してしまってますね。
これらを追い求めていると、予算が青天井になってしまうので、しばらくはAPUで妥協することにしました。
Arcにしたかったのですが、Intelは強力なGPUを内蔵したCPUを、デスクトップ版で出してくれそうにないですね。
モバイルの市場の方が大きいので仕方がないです。
今回は以上です。

今回使った8700Gです。
が、付属クーラーがstealthの方ですね。
spireの方はちょっと値段が高めです。

こちらは8600G。
コスパはこちらの方が抜群に良いです。
ただIrodori-TTSは、自分でテストしてないので動作保証できません。

8500G。
8600Gと同様、こちらも未テスト。
動くとは思うんですが・・・。


コメント