#
#

深層学習に関連した研究

CGANの
不均衡データに対する効率的学習

Deep Learning related Research

Efficient Learning in Unbalanced Dataset for
cGAN

私たちは、バランスのとれたデータセットから高品質の画像を生成するため、条件付きGANs(CGANs)に関連する研究を探求しています。 しかし、実世界のデータセットはしばしば不均衡であり、条件付き画像合成の課題となっています。本研究では、このような課題を理解し、解決することを目的としています。 まず、最先端のCGANとリサンプリングおよび微分補強技術を統合した新しいベースラインモデルを確立することから始めます。 我々の分析により、異なるクラスの属性が混在することで生じるクラスの混乱が、最適でない画像合成の主な原因であることが明らかになりました。 この問題に対処するため、スタイルに依存する特徴とスタイルに依存しない特徴を分離する、データの偏りを軽減するように設計されたGAN(SandGAN)を提案しています。 SandGANは、各クラスに対してノイズとクラス埋め込みデータを適応的に組み合わせる学習可能なセレクタ層と、ソースとスタイルミックスクラス間の潜在空間距離を調整する補助的なコントラスト損失が特徴です。 これらの技術により、クラス内の多様性を維持しながら、歪みの重みを最適化し、画質を向上させることができます。 CIFAR-10、TinyImageNet、CUB-200などの不均衡なデータセットを用いた実験により、SandGANがデータの偏りから生じるクラスの混乱を効果的に軽減し、既存手法に比べて高い精度の生成が確認できました。

We are exploring research related to Conditional Generative Adversarial Networks (CGANs), which excel at generating high-quality images from balanced datasets. However, real-world datasets are often imbalanced, posing challenges for conditional image synthesis. Our study aims to understand and address these challenges. We begin by establishing a new baseline model that integrates cutting-edge CGANs with resampling and differentiable augmentation techniques. Our analysis reveals that class confusion, which results from mixing attributes of different classes, is the primary cause of suboptimal image synthesis. To tackle this issue, we introduce the Style-Mix Assisted Noise Distortion GAN (SandGAN), designed to mitigate data bias by separating style-dependent and style-independent features. SandGAN features a learnable selector layer that adaptively combines noise and class-embedding data for each class, and an auxiliary contrastive loss that regulates latent space distances between sources and style-mix classes. These innovations help optimize distortion weights and enhance image quality while maintaining intra-class diversity. Our experiments on imbalanced datasets such as CIFAR-10, TinyImageNet, and CUB-200 show that SandGAN effectively reduces class confusion arising from data bias and achieves state-of-the-art performance.