名古屋出身ソフトウェアエンジニアのブログ

DiffBIR: プリキュア StyleGAN の出力を修正してみる

公開:
更新:

DiffBIR は、拡散過程に基づく画像復元モデルです。 Stable Diffusion の重みを利用しているようです。

XPixelGroup/DiffBIR: Official codes of DiffBIR: Towards Blind Image Restoration with Generative Diffusion Prior
Official codes of DiffBIR: Towards Blind Image Restoration with Generative Diffusion Prior - XPixelGroup/DiffBIR: Official codes of DiffBIR: Towards Blind Image Restoration with Generative Diffusio...

Gradio のインターフェースがついているので、すぐに雑に試すことができます。

Gradio による UI

Gradio による UI

今回はこれを、過去に自作した プリキュア StyleGAN のポストプロセスとして使用してみました。

GitHub - curegit/precure-stylegan-ada: Yet another StyleGAN 2.0 implementation using Chainer with Adaptive Discriminator Augmentationto to synthesize specific Precure (Cure Beauty) images
Yet another StyleGAN 2.0 implementation using Chainer with Adaptive Discriminator Augmentationto to synthesize specific Precure (Cure Beauty) images - GitHub

Gradio の画面で画像をアップロードし、Run を押すと処理されます。Number Of Samples の数だけバリエーションが生成されます。

以下が実行例です。

入力出力例
InputOutput

復元後の右側の画像では、左に比べて高周波成分が捏造され、よりシャープになりました。

生成モデルであるため強い復元が可能ですが、意図しない修正結果(人間目線で自然でない)になる場合もあります。

プリキュア StyleGAN についても、いずれ紹介したいと思います。