Irodori-TTSをRyzen7 8700Gで動かす(Ubuntu編)

Ubuntu
スポンサーリンク

Amazonのアソシエイトとして、当ブログは適格販売により収入を得ています。

以前、こちらの記事でRyzen9 7900の内蔵GPUを使ってIrodori-TTSを動かす記事を書きました。
この時は動くには動いたのですが、生成された音声がノイズだったり、生成に時間がかかったり問題だらけでした。

今回Ryzen7 8700Gを使ってうまく生成できるようになったので記事にしますね。

uvのインストール

GitHub – Aratako/Irodori-TTS: A Flow Matching-based Text-to-Speech Model with Emoji-driven Style Control
A Flow Matching-based Text-to-Speech Model with Emoji-driven Style Control – Aratako/Irodori-TTS

Irodori-TTS本家のリポジトリです。
uvで環境を構築しているようなので、こちらの記事を参考にuvをインストールしてください。

ffmpegをインストール

Irodori-TTSを動かすにはffmpegが必要です。

sudo apt install ffmpeg

でインストールするのが最も簡単です。

ROCmのインストール

同じくIrodori-TTS本家でROCm環境をインストールする方法がありますので、そちらを利用しようと思ったのですが、


そもそもRyzen7 8700G(Radeon 780M)のROCmの対応状況は若干怪しい部分があるので、ここは「TheRock」のプリビルド版を利用します。

# 必要なライブラリやツールをインストール
sudo apt audate
sudo apt install git cmake pkg-config build-essential python3.12-dev

# 警告が出ないよう以下をインストールします(しなくてもIrodori-TTSは動作します)
sudo apt install libnuma1 libnuma-dev

# Irodori-TTSをクローン
git clone https://github.com/Aratako/Irodori-TTS.git
cd Irodori-TTS

uv venv --python 3.12
source .venv/bin/activate

uv pip install --index-url https://rocm.nightlies.amd.com/whl-multi-arch/ "torch[device-gfx1103]" "torchvision[device-gfx1103]" torchaudio

「gfx1103」を指定しているので、8000Gシリーズならどれでも大丈夫でしょう。

次にrequirements.txtのインストールですが、例によって「torch」「torchaudio」を除外します。
こうしないと、せっかくインストールしたROCm環境がcuda版で汚染上書きされてしまいます。

そうしたら、以下のコマンドを実行。

uv pip install -r requirements.txt

sudo usermod -a -G render $USER
sudo usermod -a -G video $USER

コマンドを実行したあとは、システムを再起動しましょう。
再起動しない場合はCPU動作になってしまいます。

Irodori-TTSで音声を生成

公式のページにあるプロンプトを若干変更して利用してみます。

uv run --no-sync python infer.py \
  --hf-checkpoint Aratako/Irodori-TTS-600M-v3-VoiceDesign \
  --text "どうしてもっと早く教えてくれなかったの?私、ずっと待ってたのに。" \
  --no-ref \
  --caption "深く傷つき、今にも泣き出しそうな様子。声が震えており、悲痛なトーンで弱々しく話す。" \
  --output-wav outputs/test_voice.wav

これは例によって「MIOpen」が動いちゃってるせいなので、「inference_runtime.py」を少し書き換えます。

import time
from collections.abc import Callable
from dataclasses import dataclass
from pathlib import Path

import torch
import torchaudio

#下の2行ほど追加してください
torch.backends.cudnn.enabled = False
torch.backends.cudnn.benchmark = False
# これで、AMD(ROCm)環境でのMIOpenのバグを防ぎ、安全な計算を強制する

from safetensors import safe_open
from safetensors.torch import load_file as load_safetensors_file

「torch.backends.cudnn.enabled = False
torch.backends.cudnn.benchmark = False」
の2行を書き加えることで、MIOpenは動かなくなります。

出来上がった音声です。
以前のようにノイズではありません。
ちゃんと生成されています。

最後に

Gemma-4やQwen3.6を高速で利用したくてグラフィックスカードを物色していたんですが、最近は軒並み高額化してしまってますね。
これらを追い求めていると、予算が青天井になってしまうので、しばらくはAPUで妥協することにしました。

Arcにしたかったのですが、Intelは強力なGPUを内蔵したCPUを、デスクトップ版で出してくれそうにないですね。
モバイルの市場の方が大きいので仕方がないです。

今回は以上です。


Amazon | AMD CPU Ryzen 7 8700G BOX With Wraith Stealth Cooler 100-100001236SBX CP1676 | AMD | CPU 通販
AMD CPU Ryzen 7 8700G BOX With Wraith Stealth Cooler 100-100001236SBX CP1676がCPUストアでいつでもお買い得。当日お急ぎ便対象商品は、当日お届け可能です。アマゾン配...

今回使った8700Gです。
が、付属クーラーがstealthの方ですね。
spireの方はちょっと値段が高めです。

AMD Ryzen 5 8600G CPU Wraith Stealth Cooler付属 AM5ソケット
【Amazon.co.jp限定】 AMD CPU Ryzen 5 8600G, with Wraith Stealth Cooler AM5 4.3GHz 6コア / 12スレッド 22MB 65W 正規代理店品 100-100001237...

こちらは8600G。
コスパはこちらの方が抜群に良いです。
ただIrodori-TTSは、自分でテストしてないので動作保証できません。

Amazon | 【Amazon.co.jp限定】 AMD CPU Ryzen 5 8500G, with Wraith Stealth Cooler AM5 3.5GHz 6コア / 12スレッド 22MB 65W 正規代理店品 100-100000931BOX/EW-1Y | AMD | CPU 通販
【Amazon.co.jp限定】 AMD CPU Ryzen 5 8500G, with Wraith Stealth Cooler AM5 3.5GHz 6コア / 12スレッド 22MB 65W 正規代理店品 100-100000931...

8500G。
8600Gと同様、こちらも未テスト。
動くとは思うんですが・・・。

コメント

タイトルとURLをコピーしました