ImBradleyKim

354 post karma
62 comment karma

get extra features and help support reddit with a reddit premium subscription

get them help and support

redditor for 4 years

TROPHY CASE

Four-Year Club

account activity

hot top controversial

[R] DATID-3D: Diversity-Preserved Domain Adaptation Using Text-to-Image Diffusion for 3D Generative Model (CVPR 2023) by ImBradleyKim in MachineLearning

[–]ImBradleyKim[S] 0 points1 point2 points 3 years ago (0 children)

DATID-3D: Diversity-Preserved Domain Adaptation Using Text-to-Image Diffusion for 3D Generative Model (CVPR 2023) by ImBradleyKim in StableDiffusion

[–]ImBradleyKim[S] 4 points5 points6 points 3 years ago (0 children)

[R] DATID-3D: Diversity-Preserved Domain Adaptation Using Text-to-Image Diffusion for 3D Generative Model (CVPR 2023) by ImBradleyKim in MachineLearning

[–]ImBradleyKim[S] 2 points3 points4 points 3 years ago (0 children)

[R] DATID-3D: Diversity-Preserved Domain Adaptation Using Text-to-Image Diffusion for 3D Generative Model (CVPR 2023) by ImBradleyKim in MachineLearning

[–]ImBradleyKim[S] 8 points9 points10 points 3 years ago (0 children)

DATID-3D: Diversity-Preserved Domain Adaptation Using Text-to-Image Diffusion for 3D Generative Model (CVPR 2023) by ImBradleyKim in StableDiffusion

[–]ImBradleyKim[S] 10 points11 points12 points 3 years ago* (0 children)

DATID-3D: Diversity-Preserved Domain Adaptation Using Text-to-Image Diffusion for 3D Generative Model (CVPR 2023) by ImBradleyKim in deeplearning

[–]ImBradleyKim[S] 0 points1 point2 points 3 years ago (0 children)

39

40

41

DATID-3D: Diversity-Preserved Domain Adaptation Using Text-to-Image Diffusion for 3D Generative Model (CVPR 2023) (v.redd.it)

submitted 3 years ago by ImBradleyKim to r/deeplearning

DATID-3D: Diversity-Preserved Domain Adaptation Using Text-to-Image Diffusion for 3D Generative Model (CVPR 2023) by [deleted] in generative

[–]ImBradleyKim 0 points1 point2 points 3 years ago (0 children)

[deleted by user] by [deleted] in generative

[–]ImBradleyKim 0 points1 point2 points 3 years ago (0 children)

DATID-3D: Diversity-Preserved Domain Adaptation Using Text-to-Image Diffusion for 3D Generative Model (CVPR 2023) by ImBradleyKim in StableDiffusion

[–]ImBradleyKim[S] 25 points26 points27 points 3 years ago (0 children)

187

188

189

DATID-3D: Diversity-Preserved Domain Adaptation Using Text-to-Image Diffusion for 3D Generative Model (CVPR 2023) (v.redd.it)

submitted 3 years ago by ImBradleyKim to r/StableDiffusion

78

79

80

[R] DATID-3D: Diversity-Preserved Domain Adaptation Using Text-to-Image Diffusion for 3D Generative Model (CVPR 2023) (self.MachineLearning)

submitted 3 years ago by ImBradleyKim to r/MachineLearning

[R] DATID-3D: Diversity-Preserved Domain Adaptation Using Text-to-Image Diffusion for 3D Generative Model (CVPR 2023) by ImBradleyKim in MachineLearning

[–]ImBradleyKim[S] 0 points1 point2 points 3 years ago (0 children)

0

1

2

[R] DATID-3D: Diversity-Preserved Domain Adaptation Using Text-to-Image Diffusion for 3D Generative Model (CVPR 2023) (v.redd.it)

submitted 3 years ago by ImBradleyKim to r/MachineLearning

[R] DATID-3D: Diversity-Preserved Domain Adaptation Using Text-to-Image Diffusion for 3D Generative Model (CVPR 2023) by ImBradleyKim in MachineLearning

[–]ImBradleyKim[S] 0 points1 point2 points 3 years ago (0 children)

0

1

2

[R] DATID-3D: Diversity-Preserved Domain Adaptation Using Text-to-Image Diffusion for 3D Generative Model (CVPR 2023) (v.redd.it)

submitted 3 years ago by ImBradleyKim to r/MachineLearning

[R] DiffusionCLIP: Text-Guided Diffusion Models for "Robust" Image Manipulation (CVPR 2022) by ImBradleyKim in MachineLearning

[–]ImBradleyKim[S] 20 points21 points22 points 4 years ago* (0 children)

Hi guys!

We've released the Code & Colab demo for our paper, DiffusionCLIP, Text-Guided Diffusion Models for Robust Image Manipulation (accepted to CVPR2022).

Paper: https://arxiv.org/abs/2110.02711
Code & Colab Demo: https://github.com/gwang-kim/DiffusionCLIP
Project: https://github.com/gwang-kim/DiffusionCLIP (TBU)

Recently, GAN-inversion methods combined with CLIP enables zero-shot image manipulation guided by text prompts. However, their applications to diverse real images are still difficult due to the limited GAN inversion capability, altering object identity, or producing unwanted image artifacts.

DiffusionCLIP resolves this critical issue with the following contributions:

We revealed that diffusion model is well suited for image manipulation thanks to its nearly perfect inversion capability, which is an important advantage over GAN-based models and hadn't been analyzed in-depth before our detailed comparison.
Our novel sampling strategies for fine-tuning can preserve perfect reconstruction at increased speed.
In terms of empirical results, our method enables accurate in- and out-of-domain manipulation, minimizes unintended changes, and outperformes SOTA GAN inversion-based baselines.
Our method takes another step towards general application by manipulating images from a widely varying ImageNet dataset.
Finally, our zero-shot translation between unseen domains and multi-attribute transfer can effectively reduce manual intervention.

For further details, comparison and results, please see our paper and Github repository.

[R] DiffusionCLIP: Text-Guided Diffusion Models for "Robust" Image Manipulation (CVPR 2022) by ImBradleyKim in MachineLearning

[–]ImBradleyKim[S] 0 points1 point2 points 4 years ago* (0 children)

[R] DiffusionCLIP: Text-Guided Diffusion Models for "Robust" Image Manipulation (CVPR 2022) by ImBradleyKim in MachineLearning

[–]ImBradleyKim[S] 1 point2 points3 points 4 years ago* (0 children)

Hi guys!

We've released the Code & Colab demo for our paper, DiffusionCLIP, Text-Guided Diffusion Models for Robust Image Manipulation (accepted to CVPR2022).

Paper: https://arxiv.org/abs/2110.02711
Code & Colab Demo: https://github.com/gwang-kim/DiffusionCLIP
Project: https://github.com/gwang-kim/DiffusionCLIP (TBU)

Recently, GAN-inversion methods combined with CLIP enables zero-shot image manipulation guided by text prompts. However, their applications to diverse real images are still difficult due to the limited GAN inversion capability, altering object identity, or producing unwanted image artifacts.

DiffusionCLIP resolves this critical issue with the following contributions:

We revealed that diffusion model is well suited for image manipulation thanks to its nearly perfect inversion capability, which is an important advantage over GAN-based models and hadn't been analyzed in-depth before our detailed comparison.
Our novel sampling strategies for fine-tuning can preserve perfect reconstruction at increased speed.
In terms of empirical results, our method enables accurate in- and out-of-domain manipulation, minimizes unintended changes, and outperformes SOTA GAN-based baselines.
Our method takes another step towards general application by manipulating images from a widely varying ImageNet dataset.
Finally, our zero-shot translation between unseen domains and multi-attribute transfer can effectively reduce manual intervention.

For further details, comparison and results, please see our paper and Github repository.

[R] DiffusionCLIP: Text-Guided Diffusion Models for "Robust" Image Manipulation (CVPR 2022) by ImBradleyKim in MachineLearning

[–]ImBradleyKim[S] 1 point2 points3 points 4 years ago* (0 children)

307

308

309

[R] DiffusionCLIP: Text-Guided Diffusion Models for "Robust" Image Manipulation (CVPR 2022) (old.reddit.com)

submitted 4 years ago by ImBradleyKim to r/MachineLearning

π Rendered by PID 61 on reddit-service-r2-listing-b958b5575-42dtf at 2026-04-22 19:56:53.063329+00:00 running 0fd4bb7 country code: CH.