11.14.3.4 Text to Image, Layout to Image, Image Based Rendering

Chapter Contents (Back)
Image Based Rendering. Stereo Image Based Rendering. Synthesis. Layout to Image. Image Synthesis. Text to Image.
See also Diffusion for Text to Image Generation.
See also Vision Transformers for Image Generation and Image Synthesis.
See also Adversarial Networks for Image Synthesis, Image Generation.

Zhang, J.[Ji], Mei, K.Z.[Kui-Zhi], Zheng, Y.[Yu], Fan, J.P.[Jian-Ping],
Exploiting Mid-Level Semantics for Large-Scale Complex Video Classification,
MultMed(21), No. 10, October 2019, pp. 2518-2530.
IEEE DOI 1910
feature extraction, image classification, image motion analysis, image representation, large-scale video classification BibRef

Zhang, J.[Ji], Mei, K.Z.[Kui-Zhi], Wang, X., Zheng, Y.[Yu], Fan, J.P.[Jian-Ping],
From Text to Video: Exploiting Mid-Level Semantics for Large-Scale Video Classification,
ICPR18(1695-1700)
IEEE DOI 1812
Semantics, Task analysis, Visualization, Streaming media, Detectors, Encoding, Bridges BibRef

Peng, Y.X.[Yu-Xin], Qi, J.W.[Jin-Wei],
Show and Tell in the Loop: Cross-Modal Circular Correlation Learning,
MultMed(21), No. 6, June 2019, pp. 1538-1550.
IEEE DOI 1906
Correlation, Bridges, Logic gates, Semantics, Task analysis, Cognition, Feeds, Circular correlation learning, cross-modal retrieval, text-to-image synthesis BibRef

Zhang, X.W.[Xin-Wei], Wang, J.[Jin], Lu, G.D.[Guo-Dong], Zhang, X.S.[Xu-Sheng],
Pattern understanding and synthesis based on layout tree descriptor,
VC(36), No. 6, June 2020, pp. 1141-1155.
WWW Link. 2005
BibRef

Baraheem, S.S.[Samah S.], Nguyen, T.V.[Tam V.],
Text-to-image via mask anchor points,
PRL(133), 2020, pp. 25-32.
Elsevier DOI 2005
Text-to-image, Mask dataset, Image synthesis, Anchor points BibRef

Chen, Q.[Qi], Wu, Q.[Qi], Chen, J.[Jian], Wu, Q.Y.[Qing-Yao], van den Hengel, A.J.[Anton J.], Tan, M.K.[Ming-Kui],
Scripted Video Generation With a Bottom-Up Generative Adversarial Network,
IP(29), 2020, pp. 7454-7467.
IEEE DOI 2007
Generative adversarial networks, video generation, semantic alignment, temporal coherence BibRef

Yang, M.[Min], Liu, J.H.[Jun-Hao], Shen, Y.[Ying], Zhao, Z.[Zhou], Chen, X.J.[Xiao-Jun], Wu, Q.Y.[Qing-Yao], Li, C.M.[Cheng-Ming],
An Ensemble of Generation- and Retrieval-Based Image Captioning With Dual Generator Generative Adversarial Network,
IP(29), 2020, pp. 9627-9640.
IEEE DOI 2011
Generators, Decoding, Generative adversarial networks, Training, Computational modeling, Task analysis, Image captioning, adversarial learning BibRef

Yuan, M., Peng, Y.,
CKD: Cross-Task Knowledge Distillation for Text-to-Image Synthesis,
MultMed(22), No. 8, August 2020, pp. 1955-1968.
IEEE DOI 2007
Semantics, Visualization, Task analysis, Image synthesis, Generative adversarial networks, Neural networks, image semantic understanding BibRef

Osahor, U., Kazemi, H., Dabouei, A., Nasrabadi, N.,
Quality Guided Sketch-to-Photo Image Synthesis,
Biometrics20(3575-3584)
IEEE DOI 2008
Pattern recognition BibRef

Zhao, B.[Bo], Yin, W.D.[Wei-Dong], Meng, L.L.[Li-Li], Sigal, L.[Leonid],
Layout2image: Image Generation from Layout,
IJCV(128), No. 10-11, November 2020, pp. 2418-2435.
Springer DOI 2009
BibRef
Earlier: A1, A3, A2, A4:
Image Generation From Layout,
CVPR19(8576-8585).
IEEE DOI 2002
BibRef

Sheng, L.[Lu], Pan, J.T.[Jun-Ting], Guo, J.M.[Jia-Ming], Shao, J.[Jing], Loy, C.C.[Chen Change],
High-Quality Video Generation from Static Structural Annotations,
IJCV(128), No. 10-11, November 2020, pp. 2552-2569.
Springer DOI 2009
BibRef

Li, K.[Ke], Peng, S.C.[Shi-Chong], Zhang, T.H.[Tian-Hao], Malik, J.[Jitendra],
Multimodal Image Synthesis with Conditional Implicit Maximum Likelihood Estimation,
IJCV(128), No. 10-11, November 2020, pp. 2607-2628.
Springer DOI 2009
BibRef
Earlier: A1, A3, A4, Only:
Diverse Image Synthesis From Semantic Layouts via Conditional IMLE,
ICCV19(4219-4228)
IEEE DOI 2004
image representation, image segmentation, learning (artificial intelligence), Probabilistic logic BibRef

Arora, H.[Himanshu], Mishra, S.[Saurabh], Peng, S.C.[Shi-Chong], Li, K.[Ke], Mahdavi-Amiri, A.[Ali],
Multimodal Shape Completion via Implicit Maximum Likelihood Estimation,
DLGC22(2957-2966)
IEEE DOI 2210
Point cloud compression, Maximum likelihood estimation, Shape, Conferences, Pattern recognition BibRef

Gao, L.L.[Lian-Li], Chen, D.Y.[Dai-Yuan], Zhao, Z.[Zhou], Shao, J.[Jie], Shen, H.T.[Heng Tao],
Lightweight dynamic conditional GAN with pyramid attention for text-to-image synthesis,
PR(110), 2021, pp. 107384.
Elsevier DOI 2011
Text-to-image synthesis, Conditional generative adversarial network (CGAN), Pyramid attentive fusion BibRef

Dong, Y.L.[Yan-Long], Zhang, Y.[Ying], Ma, L.[Lin], Wang, Z.[Zhi], Luo, J.B.[Jie-Bo],
Unsupervised text-to-image synthesis,
PR(110), 2021, pp. 107573.
Elsevier DOI 2011
Text-to-image synthesis, Generative adversarial network (GAN), Unsupervised training BibRef

Yuan, M., Peng, Y.,
Bridge-GAN: Interpretable Representation Learning for Text-to-Image Synthesis,
CirSysVideo(30), No. 11, November 2020, pp. 4258-4268.
IEEE DOI 2011
Visualization, Mutual information, Image synthesis, Task analysis, Training, Bridge circuits, Semantics, Text-to-image synthesis, Bridge-GAN BibRef

Li, R.F.[Rui-Fan], Wang, N.[Ning], Feng, F.X.[Fang-Xiang], Zhang, G.W.[Guang-Wei], Wang, X.J.[Xiao-Jie],
Exploring Global and Local Linguistic Representations for Text-to-Image Synthesis,
MultMed(22), No. 12, December 2020, pp. 3075-3087.
IEEE DOI 2011
Task analysis, Linguistics, Generators, Generative adversarial networks, Training, Correlation, cross-modal BibRef

Li, C.Y.[Chun-Ye], Kong, L.Y.[Li-Ya], Zhou, Z.P.[Zhi-Ping],
Improved-StoryGAN for sequential images visualization,
JVCIR(73), 2020, pp. 102956.
Elsevier DOI 2012
Story visualization, Weighted Activation Degree (WAD), Dilated Convolution, Gated Convolution BibRef

Tan, H., Liu, X., Liu, M., Yin, B., Li, X.,
KT-GAN: Knowledge-Transfer Generative Adversarial Network for Text-to-Image Synthesis,
IP(30), 2021, pp. 1275-1290.
IEEE DOI 2012
Task analysis, Semantics, Generators, Generative adversarial networks, Knowledge engineering, alternate attention-transfer mechanism BibRef

Wang, M.[Min], Lang, C.Y.[Cong-Yan], Feng, S.H.[Song-He], Wang, T.[Tao], Jin, Y.[Yi], Li, Y.D.[Yi-Dong],
Text to photo-realistic image synthesis via chained deep recurrent generative adversarial network,
JVCIR(74), 2021, pp. 102955.
Elsevier DOI 2101
Text-to-image synthesis, Logic relationships, Computational bottlenecks, Parameters sharing BibRef

Yang, Y., Wang, L., Xie, D., Deng, C., Tao, D.,
Multi-Sentence Auxiliary Adversarial Networks for Fine-Grained Text-to-Image Synthesis,
IP(30), 2021, pp. 2798-2809.
IEEE DOI 2102
Semantics, Task analysis, Visualization, Training, Generative adversarial networks, Correlation, Birds, negative sample learning BibRef

Elu, A.[Aitzol], Azkune, G.[Gorka], de Lacalle, O.L.[Oier Lopez], Arganda-Carreras, I.[Ignacio], Soroa, A.[Aitor], Agirre, E.[Eneko],
Inferring spatial relations from textual descriptions of images,
PR(113), 2021, pp. 107847.
Elsevier DOI 2103
Text-to-image synthesis, Natural language understanding, Spatial relations, Deep learning BibRef

Hu, T.[Tao], Long, C.J.[Cheng-Jiang], Xiao, C.X.[Chun-Xia],
A Novel Visual Representation on Text Using Diverse Conditional GAN for Visual Recognition,
IP(30), 2021, pp. 3499-3512.
IEEE DOI 2103
Use text from social media to train image recognition. Visualization, Feature extraction, Image recognition, Text recognition, Generators, visual recognition BibRef

Yang, C.Y.[Ce-Yuan], Shen, Y.J.[Yu-Jun], Zhou, B.L.[Bo-Lei],
Semantic Hierarchy Emerges in Deep Generative Representations for Scene Synthesis,
IJCV(129), No. 5, May 2021, pp. 1451-1466.
Springer DOI 2105
BibRef

Qi, Z.J.[Zhong-Jian], Fan, C.G.[Chao-Gang], Xu, L.F.[Liang-Feng], Li, X.K.[Xin-Ke], Zhan, S.[Shu],
MRP-GAN: Multi-resolution parallel generative adversarial networks for text-to-image synthesis,
PRL(147), 2021, pp. 1-7.
Elsevier DOI 2106
Text-to-image synthesize, Generative adversarial networks, Image generation BibRef

Li, Z.[Zeyu], Deng, C.[Cheng], Yang, E.K.[Er-Kun], Tao, D.C.[Da-Cheng],
Staged Sketch-to-Image Synthesis via Semi-Supervised Generative Adversarial Networks,
MultMed(23), 2021, pp. 2694-2705.
IEEE DOI 2109
Generative adversarial networks, Image generation, Training, Image edge detection, Task analysis, sketch BibRef

Rafique, M.U.[Muhammad Usman], Zhang, Y.[Yu], Brodie, B.[Benjamin], Jacobs, N.[Nathan],
Unifying Guided and Unguided Outdoor Image Synthesis,
NTIRE21(776-785)
IEEE DOI 2109
Training, Image synthesis, Impedance matching, Layout, Benchmark testing, Probabilistic logic BibRef

Wang, M.[Min], Lang, C.Y.[Cong-Yan], Liang, L.Q.[Li-Qian], Lyu, G.[Gengyu], Feng, S.H.[Song-He], Wang, T.[Tao],
Class-Balanced Text to Image Synthesis With Attentive Generative Adversarial Network,
MultMedMag(28), No. 3, July 2021, pp. 21-31.
IEEE DOI 2109
Generative adversarial networks, Training data, Semantics, Text processing, Image synthesis, generative adversarial network, rebalance BibRef

Li, A.[Ailin], Zhao, L.[Lei], Zuo, Z.W.[Zhi-Wen], Wang, Z.Z.[Zhi-Zhong], Chen, H.B.[Hai-Bo], Lu, D.M.[Dong-Ming], Xing, W.[Wei],
Diversified text-to-image generation via deep mutual information estimation,
CVIU(211), 2021, pp. 103259.
Elsevier DOI 2110
Generative Adversarial Nets (GANs), Text-to-image generation, Mutual Information BibRef

Wu, F.X.[Fu-Xiang], Cheng, J.[Jun], Wang, X.C.[Xin-Chao], Wang, L.[Lei], Tao, D.P.[Da-Peng],
Image Hallucination From Attribute Pairs,
Cyber(52), No. 1, January 2022, pp. 568-581.
IEEE DOI 2201
Semantics, Visualization, Generators, Syntactics, Training, Natural language processing, text-to-image synthesis BibRef

Hinz, T.[Tobias], Heinrich, S.[Stefan], Wermter, S.[Stefan],
Semantic Object Accuracy for Generative Text-to-Image Synthesis,
PAMI(44), No. 3, March 2022, pp. 1552-1565.
IEEE DOI 2202
Layout, Semantics, Measurement, Generators, Image resolution, Image quality, Text-to-image synthesis, generative models BibRef

Tan, H.C.[Hong-Chen], Liu, X.P.[Xiu-Ping], Yin, B.C.[Bao-Cai], Li, X.[Xin],
Cross-Modal Semantic Matching Generative Adversarial Networks for Text-to-Image Synthesis,
MultMed(24), 2022, pp. 832-845.
IEEE DOI 2202
Semantics, Task analysis, Generative adversarial networks, Generators, Feature extraction, Visualization, text _CNNs BibRef

Feng, F.X.[Fang-Xiang], Niu, T.R.[Tian-Rui], Li, R.F.[Rui-Fan], Wang, X.J.[Xiao-Jie],
Modality Disentangled Discriminator for Text-to-Image Synthesis,
MultMed(24), No. 2022, pp. 2112-2124.
IEEE DOI 2204
Task analysis, Correlation, Image synthesis, Image reconstruction, Generative adversarial networks, Image representation, multi-modal disentangled representation learning BibRef

Tan, Y.X.[Yong Xuan], Lee, C.P.[Chin Poo], Neo, M.[Mai], Lim, K.M.[Kian Ming],
Text-to-image synthesis with self-supervised learning,
PRL(157), 2022, pp. 119-126.
Elsevier DOI 2205
Text-to-image-synthesis, Generative adversarial network, Self-supervised learning BibRef

Tan, Y.X.[Yong Xuan], Lee, C.P.[Chin Poo], Neo, M.[Mai], Lim, K.M.[Kian Ming], Lim, J.Y.[Jit Yan],
Text-to-image synthesis with self-supervised bi-stage generative adversarial network,
PRL(169), 2023, pp. 43-49.
Elsevier DOI 2305
Text-to-image-synthesis, Generative adversarial network, Self-supervised learning, GAN BibRef

Quan, F.[Fengnan], Lang, B.[Bo], Liu, Y.X.[Yan-Xi],
ARRPNGAN: Text-to-image GAN with attention regularization and region proposal networks,
SP:IC(106), 2022, pp. 116728.
Elsevier DOI 2206
Text-to-image synthesis, Generative adversarial network, Attention model, Region proposal network BibRef

Wang, H.X.[Hong-Xia], Ke, H.[Hao], Liu, C.[Chun],
An embedded method: Improve the relevance of text and face image with enhanced face attributes,
SP:IC(108), 2022, pp. 116815.
Elsevier DOI 2209
Generative adversarial networks, Text-to-image face image generation, Face synthesis, Visual attributes BibRef

Peng, J.[Jun], Zhou, Y.[Yiyi], Sun, X.S.[Xiao-Shuai], Cao, L.J.[Liu-Juan], Wu, Y.J.[Yong-Jian], Huang, F.Y.[Fei-Yue], Ji, R.R.[Rong-Rong],
Knowledge-Driven Generative Adversarial Network for Text-to-Image Synthesis,
MultMed(24), 2022, pp. 4356-4366.
IEEE DOI 2210
Visualization, Generative adversarial networks, Task analysis, Semantics, Measurement, Image synthesis, Feature extraction, pseudo turing test BibRef

Mazaheri, A.[Amir], Shah, M.[Mubarak],
Video Generation from Text Employing Latent Path Construction for Temporal Modeling,
ICPR22(5010-5016)
IEEE DOI 2212
Interpolation, Visualization, Natural languages, Stacking, Machine learning BibRef

Gu, J.J.[Jin-Jing], Wang, H.[Hanli], Fan, R.C.[Rui-Chao],
Coherent Visual Storytelling via Parallel Top-Down Visual and Topic Attention,
CirSysVideo(33), No. 1, January 2023, pp. 257-268.
IEEE DOI 2301
Visualization, Decoding, Neural networks, Coherence, Task analysis, Image sequences, Feature extraction, Visual storytelling, phrase beam search BibRef

Sener, F.[Fadime], Saraf, R.[Rishabh], Yao, A.[Angela],
Transferring Knowledge From Text to Video: Zero-Shot Anticipation for Procedural Actions,
PAMI(45), No. 6, June 2023, pp. 7836-7852.
IEEE DOI 2305
Visualization, Robots, Data models, Task analysis, Predictive models, Natural languages, Text recognition, Deep learning, video analysis BibRef

Li, T.P.[Teng-Peng], Wang, H.[Hanli], He, B.[Bin], Chen, C.W.[Chang Wen],
Knowledge-Enriched Attention Network With Group-Wise Semantic for Visual Storytelling,
PAMI(45), No. 7, July 2023, pp. 8634-8645.
IEEE DOI 2306
Visualization, Semantics, Feature extraction, Decoding, Streaming media, GSM, Technological innovation, Encoder-decoder, visual storytelling BibRef

Gao, L.[Lin], Sun, J.M.[Jia-Mu], Mo, K.[Kaichun], Lai, Y.K.[Yu-Kun], Guibas, L.J.[Leonidas J.], Yang, J.[Jie],
SceneHGN: Hierarchical Graph Networks for 3D Indoor Scene Generation With Fine-Grained Geometry,
PAMI(45), No. 7, July 2023, pp. 8902-8919.
IEEE DOI 2306
Geometry, Layout, Shape, Solid modeling, Neural networks, Interpolation, 3D indoor scene synthesis, deep generative model, variational autoencoder BibRef

Hou, X.X.[Xian-Xu], Zhang, X.K.[Xiao-Kang], Li, Y.D.[Yu-Dong], Shen, L.L.[Lin-Lin],
TextFace: Text-to-Style Mapping Based Face Generation and Manipulation,
MultMed(25), 2023, pp. 3409-3419.
IEEE DOI 2309
BibRef

Liu, S.Y.[Si-Ying], Dragotti, P.L.[Pier Luigi],
Sensing Diversity and Sparsity Models for Event Generation and Video Reconstruction from Events,
PAMI(45), No. 10, October 2023, pp. 12444-12458.
IEEE DOI 2310
Event to video. BibRef

Tan, Z.R.[Zhao-Rui], Yang, X.[Xi], Ye, Z.H.[Zi-Han], Wang, Q.[Qiufeng], Yan, Y.[Yuyao], Nguyen, A.[Anh], Huang, K.[Kaizhu],
Semantic Similarity Distance: Towards better text-image consistency metric in text-to-image generation,
PR(144), 2023, pp. 109883.
Elsevier DOI 2310
Text-to-image, Image generation, Generative adversarial networks, Semantic consistency BibRef

Cheng, Q.R.[Qing-Rong], Wen, K.Y.[Ke-Yu], Gu, X.D.[Xiao-Dong],
Vision-Language Matching for Text-to-Image Synthesis via Generative Adversarial Networks,
MultMed(25), 2023, pp. 7062-7075.
IEEE DOI 2311
BibRef

Gao, L.L.[Lian-Li], Zhao, Q.[Qike], Zhu, J.C.[Jun-Chen], Su, S.[Sitong], Cheng, L.[Lechao], Zhao, L.[Lei],
From External to Internal: Structuring Image for Text-to-Image Attributes Manipulation,
MultMed(25), 2023, pp. 7248-7261.
IEEE DOI Code:
WWW Link. 2311
BibRef

Sun, M.Z.[Ming-Zhen], Wang, W.N.[Wei-Ning], Zhu, X.X.[Xin-Xin], Liu, J.[Jing],
Reparameterizing and dynamically quantizing image features for image generation,
PR(146), 2024, pp. 109962.
Elsevier DOI 2311
Vector quantization, Variational auto-encoder, Unconditional image generation, Text-to-image generation, Autoregressive generation BibRef

Liu, Z.Z.[Zheng-Zhe], Dai, P.[Peng], Li, R.[Ruihui], Qi, X.J.[Xiao-Juan], Fu, C.W.[Chi-Wing],
DreamStone: Image as a Stepping Stone for Text-Guided 3D Shape Generation,
PAMI(45), No. 12, December 2023, pp. 14385-14403.
IEEE DOI 2311
BibRef

Tang, Z.M.[Zheng-Mi], Miyazaki, T.[Tomo], Omachi, S.[Shinichiro],
A Scene-Text Synthesis Engine Achieved Through Learning From Decomposed Real-World Data,
IP(32), 2023, pp. 5837-5851.
IEEE DOI Code:
WWW Link. 2311
BibRef

Xu, Y.H.[Yong-Hao], Yu, W.[Weikang], Ghamisi, P.[Pedram], Kopp, M.[Michael], Hochreiter, S.[Sepp],
Txt2Img-MHN: Remote Sensing Image Generation From Text Using Modern Hopfield Networks,
IP(32), 2023, pp. 5737-5750.
IEEE DOI Code:
WWW Link. 2311
BibRef

Tan, H.C.[Hong-Chen], Yin, B.C.[Bao-Cai], Wei, K.[Kun], Liu, X.P.[Xiu-Ping], Li, X.[Xin],
ALR-GAN: Adaptive Layout Refinement for Text-to-Image Synthesis,
MultMed(25), 2023, pp. 8620-8631.
IEEE DOI 2312
BibRef

Liang, J.D.[Jia-Dong], Pei, W.J.[Wen-Jie], Lu, F.[Feng],
Layout-Bridging Text-to-Image Synthesis,
CirSysVideo(33), No. 12, December 2023, pp. 7438-7451.
IEEE DOI 2312
BibRef

Kuang, Y.[Yi], Ma, F.[Fei], Li, F.F.[Fang-Fang], Liu, Y.B.[Ying-Bing], Zhang, F.[Fan],
Semantic-Layout-Guided Image Synthesis for High-Quality Synthetic-Aperature Radar Detection Sample Generation,
RS(15), No. 24, 2023, pp. 5654.
DOI Link 2401
BibRef

Liu, A.A.[An-An], Sun, Z.F.[Ze-Fang], Xu, N.[Ning], Kang, R.B.[Rong-Bao], Cao, J.[Jinbo], Yang, F.[Fan], Qin, W.J.[Wei-Jun], Zhang, S.Y.[Shen-Yuan], Zhang, J.Q.[Jia-Qi], Li, X.[Xuanya],
Prior knowledge guided text to image generation,
PRL(177), 2024, pp. 89-95.
Elsevier DOI 2401
Text-to-image synthesis, Generative Adversarial Networks, Knowledge Guided GAN BibRef

Köksal, A.[Ali], Ak, K.E.[Kenan E.], Sun, Y.[Ying], Rajan, D.[Deepu], Lim, J.H.[Joo Hwee],
Controllable Video Generation With Text-Based Instructions,
MultMed(26), 2024, pp. 190-201.
IEEE DOI 2401
BibRef

Liu, J.W.[Jia-Wei], Wang, W.N.[Wei-Ning], Chen, S.[Sihan], Zhu, X.X.[Xin-Xin], Liu, J.[Jing],
Sounding Video Generator: A Unified Framework for Text-Guided Sounding Video Generation,
MultMed(26), 2024, pp. 141-153.
IEEE DOI 2401
BibRef

Ye, S.[Senmao], Wang, H.[Huan], Tan, M.K.[Ming-Kui], Liu, F.[Fei],
Recurrent Affine Transformation for Text-to-Image Synthesis,
MultMed(26), 2024, pp. 462-473.
IEEE DOI 2402
Generators, Visualization, Fuses, Computational modeling, Generative adversarial networks, Training, Task analysis, spatial attention BibRef

Yuan, B.[Bowen], Sheng, Y.F.[Ye-Fei], Bao, B.K.[Bing-Kun], Chen, Y.P.P.[Yi-Ping Phoebe], Xu, C.S.[Chang-Sheng],
Semantic Distance Adversarial Learning for Text-to-Image Synthesis,
MultMed(26), 2024, pp. 1255-1266.
IEEE DOI 2402
Semantics, Generators, Training, Adversarial machine learning, Feature extraction, Generative adversarial networks, Birds, cycle consistency BibRef

Zhou, H.P.[Hua-Ping], Wu, T.[Tao], Ye, S.[Senmao], Qin, X.[Xinru], Sun, K.[Kelei],
Enhancing fine-detail image synthesis from text descriptions by text aggregation and connection fusion module,
SP:IC(122), 2024, pp. 117099.
Elsevier DOI 2402
Generative adversarial network, Semantic consistency, Spatial attention, Text-to-image generation, Single-stage network BibRef

Hu, Y.[Yaosi], Luo, C.[Chong], Chen, Z.Z.[Zhen-Zhong],
A Benchmark for Controllable Text -Image-to-Video Generation,
MultMed(26), 2024, pp. 1706-1719.
IEEE DOI 2402
Task analysis, Measurement, Generators, Uncertainty, Visualization, Dynamics, Benchmark testing, Video generation, text-image-to-video, multimodal-conditioned generation BibRef

Han, G.[Guang], Lin, M.[Min], Li, Z.Y.[Zi-Yang], Zhao, H.T.[Hai-Tao], Kwong, S.[Sam],
Text-to-Image Person Re-Identification Based on Multimodal Graph Convolutional Network,
MultMed(26), 2024, pp. 6025-6036.
IEEE DOI 2404
Feature extraction, Task analysis, Visualization, Semantics, Graph neural networks, Data mining, graph convolutional network BibRef

Lee, S.[Seoyoung], Lee, J.[Joonseok],
PoseDiff: Pose-conditioned Multimodal Diffusion Model for Unbounded Scene Synthesis from Sparse Inputs,
WACV24(5005-5015)
IEEE DOI 2404
Image color analysis, Computational modeling, Scalability, Cameras, Tuning, Faces, Algorithms, Generative models for image, video, 3D, etc., Vision + language and/or other modalities BibRef

Yuan, X.[Xin], Baek, J.[Jinoo], Xu, K.[Keyang], Tov, O.[Omer], Fei, H.L.[Hong-Liang],
Inflation with Diffusion: Efficient Temporal Adaptation for Text-to-Video Super-Resolution,
VAQuality24(489-496)
IEEE DOI 2404
Adaptation models, Visualization, Computational modeling, Superresolution, Computer architecture BibRef

Kim, T.[Taehoon], Kang, C.[ChanHee], Park, J.[JaeHyuk], Jeong, D.[Daun], Yang, C.[ChangHee], Kang, S.J.[Suk-Ju], Kong, K.[Kyeongbo],
Human Motion Aware Text-to-Video Generation with Explicit Camera Control,
WACV24(5069-5078)
IEEE DOI Code:
WWW Link. 2404
Knowledge engineering, Codes, Punching, Cameras, Algorithms, Generative models for image, video, 3D, etc., Algorithms, Biometrics, Vision + language and/or other modalities BibRef

Ganz, R.[Roy], Elad, M.[Michael],
CLIPAG: Towards Generator-Free Text-to-Image Generation,
WACV24(3831-3841)
IEEE DOI 2404
Computational modeling, Semantics, Computer architecture, Generators, Task analysis, Image classification, Algorithms, Vision + language and/or other modalities BibRef

Park, S.[Seongbeom], Moon, S.H.[Su-Hong], Park, S.H.[Seung-Hyun], Kim, J.[Jinkyu],
Localization and Manipulation of Immoral Visual Cues for Safe Text-to-Image Generation,
WACV24(4663-4672)
IEEE DOI 2404
Location awareness, Ethics, Visualization, Analytical models, Image recognition, Computational modeling, Algorithms, Explainable, Vision + language and/or other modalities BibRef

Wang, H.[Hai], Xiang, X.Y.[Xiao-Yu], Fan, Y.C.[Yu-Chen], Xue, J.H.[Jing-Hao],
Customizing 360-Degree Panoramas through Text-to-Image Diffusion Models,
WACV24(4921-4931)
IEEE DOI Code:
WWW Link. 2404
Geometry, Codes, Noise reduction, Games, Task analysis, Algorithms, Generative models for image, video, 3D, etc., Algorithms, image and video synthesis BibRef

Ahmed, Y.A.[Yeruru Asrar], Mittal, A.[Anurag],
Unsupervised Co-generation of Foreground-Background Segmentation from Text-to-Image Synthesis,
WACV24(5046-5057)
IEEE DOI 2404
Training, Image segmentation, Visualization, Computational modeling, Training data, Computer architecture, Vision + language and/or other modalities BibRef

Jeanneret, G.[Guillaume], Simon, L.[Loïc], Jurie, F.[Frédéric],
Text-to-Image Models for Counterfactual Explanations: A Black-Box Approach,
WACV24(4745-4755)
IEEE DOI 2404
Analytical models, Codes, Computational modeling, Closed box, Computer architecture, Algorithms, Explainable, fair, accountable, Vision + language and/or other modalities BibRef

Grimal, P.[Paul], Borgne, H.L.[Hervé Le], Ferret, O.[Olivier], Tourille, J.[Julien],
TIAM - A Metric for Evaluating Alignment in Text-to-Image Generation,
WACV24(2878-2887)
IEEE DOI 2404
Measurement, Image quality, Image color analysis, Rendering (computer graphics), Colored noise, Algorithms, Vision + language and/or other modalities BibRef

Qin, C.[Can], Yu, N.[Ning], Xing, C.[Chen], Zhang, S.[Shu], Chen, Z.[Zeyuan], Ermon, S.[Stefano], Fu, Y.[Yun], Xiong, C.M.[Cai-Ming], Xu, R.[Ran],
GlueGen: Plug and Play Multi-Modal Encoders for X-to-Image Generation,
ICCV23(23028-23039)
IEEE DOI 2401
BibRef

Bahmani, S.[Sherwin], Park, J.J.[Jeong Joon], Paschalidou, D.[Despoina], Yan, X.G.[Xing-Guang], Wetzstein, G.[Gordon], Guibas, L.J.[Leonidas J.], Tagliasacchi, A.[Andrea],
CC3D: Layout-Conditioned Generation of Compositional 3D Scenes,
ICCV23(7137-7147)
IEEE DOI 2401
BibRef

Lee, T.[Taegyeong], Kang, J.[Jeonghun], Kim, H.[Hyeonyu], Kim, T.[Taehwan],
Generating Realistic Images from In-the-wild Sounds,
ICCV23(7126-7136)
IEEE DOI 2401
BibRef

Ye-Bin, M.[Moon], Kim, J.[Jisoo], Kim, H.Y.[Hong-Yeob], Son, K.[Kilho], Oh, T.H.[Tae-Hyun],
TextManiA: Enriching Visual Feature by Text-driven Manifold Augmentation,
ICCV23(2526-2537)
IEEE DOI 2401
BibRef

Ma, Y.W.[Yi-Wei], Wang, H.[Haowei], Zhang, X.Q.[Xiao-Qing], Jiang, G.[Guannan], Sun, X.S.[Xiao-Shuai], Zhuang, W.L.[Wei-Lin], Ji, J.Y.[Jia-Yi], Ji, R.R.[Rong-Rong],
X-Mesh: Towards Fast and Accurate Text-driven 3D Stylization via Dynamic Textual Guidance,
ICCV23(2737-2748)
IEEE DOI Code:
WWW Link. 2401
BibRef

Lin, J.W.[Jia-Wei], Guo, J.Q.[Jia-Qi], Sun, S.Z.[Shi-Zhao], Xu, W.J.[Wei-Jiang], Liu, T.[Ting], Lou, J.G.[Jian-Guang], Zhang, D.M.[Dong-Mei],
A Parse-Then-Place Approach for Generating Graphic Layouts from Textual Descriptions,
ICCV23(23565-23574)
IEEE DOI 2401
BibRef

Lorraine, J.[Jonathan], Xie, K.[Kevin], Zeng, X.H.[Xiao-Hui], Lin, C.H.[Chen-Hsuan], Takikawa, T.[Towaki], Sharp, N.[Nicholas], Lin, T.Y.[Tsung-Yi], Liu, M.Y.[Ming-Yu], Fidler, S.[Sanja], Lucas, J.[James],
ATT3D: Amortized Text-to-3D Object Synthesis,
ICCV23(17900-17910)
IEEE DOI 2401
BibRef

Chen, R.[Rui], Chen, Y.W.[Yong-Wei], Jiao, N.X.[Ning-Xin], Jia, K.[Kui],
Fantasia3D: Disentangling Geometry and Appearance for High-quality Text-to-3D Content Creation,
ICCV23(22189-22199)
IEEE DOI Code:
WWW Link. 2401
BibRef

Amaduzzi, A.[Andrea], Lisanti, G.[Giuseppe], Salti, S.[Samuele], di Stefano, L.[Luigi],
Looking at Words and Points with Attention: A Benchmark for Text-to-Shape Coherence,
AI3DCC23(2860-2869)
IEEE DOI Code:
WWW Link. 2401
BibRef

Raj, A.[Amit], Kaza, S.[Srinivas], Poole, B.[Ben], Niemeyer, M.[Michael], Ruiz, N.[Nataniel], Mildenhall, B.[Ben], Zada, S.[Shiran], Aberman, K.[Kfir], Rubinstein, M.[Michael], Barron, J.[Jonathan], Li, Y.Z.[Yuan-Zhen], Jampani, V.[Varun],
DreamBooth3D: Subject-Driven Text-to-3D Generation,
ICCV23(2349-2359)
IEEE DOI Code:
WWW Link. 2401
BibRef

Liu, N.[Nan], Du, Y.L.[Yi-Lun], Li, S.[Shuang], Tenenbaum, J.B.[Joshua B.], Torralba, A.[Antonio],
Unsupervised Compositional Concepts Discovery with Text-to-Image Generative Models,
ICCV23(2085-2095)
IEEE DOI 2401
BibRef

Wu, X.S.[Xiao-Shi], Sun, K.Q.[Ke-Qiang], Zhu, F.[Feng], Zhao, R.[Rui], Li, H.S.[Hong-Sheng],
Human Preference Score: Better Aligning Text-to-image Models with Human Preference,
ICCV23(2096-2105)
IEEE DOI Code:
WWW Link. 2401
BibRef

Le, T.V.[Thanh Van], Phung, H.[Hao], Nguyen, T.H.[Thuan Hoang], Dao, Q.[Quan], Tran, N.N.[Ngoc N.], Tran, A.[Anh],
Anti-DreamBooth: Protecting users from personalized text-to-image synthesis,
ICCV23(2116-2127)
IEEE DOI Code:
WWW Link. 2401
BibRef

Agarwal, A.[Aishwarya], Karanam, S.[Srikrishna], Joseph, K.J., Saxena, A.[Apoorv], Goswami, K.[Koustava], Srinivasan, B.V.[Balaji Vasan],
A-STAR: Test-time Attention Segregation and Retention for Text-to-image Synthesis,
ICCV23(2283-2293)
IEEE DOI 2401
BibRef

Cho, J.[Jaemin], Zala, A.[Abhay], Bansal, M.[Mohit],
DALL-EVAL: Probing the Reasoning Skills and Social Biases of Text-to-Image Generation Models,
ICCV23(3020-3031)
IEEE DOI 2401
BibRef

Zhang, C.[Cheng], Chen, X.[Xuanbai], Chai, S.Q.[Si-Qi], Wu, C.H.[Chen Henry], Lagun, D.[Dmitry], Beeler, T.[Thabo], de la Torre, F.[Fernando],
ITI-Gen: Inclusive Text-to-Image Generation,
ICCV23(3946-3957)
IEEE DOI 2401
BibRef

Struppek, L.[Lukas], Hintersdorf, D.[Dominik], Kersting, K.[Kristian],
Rickrolling the Artist: Injecting Backdoors into Text Encoders for Text-to-Image Synthesis,
ICCV23(4561-4573)
IEEE DOI Code:
WWW Link. 2401
BibRef

Basu, A.[Abhipsa], Babu, R.V.[R. Venkatesh], Pruthi, D.[Danish],
Inspecting the Geographical Representativeness of Images from Text-to-Image Models,
ICCV23(5113-5124)
IEEE DOI 2401
BibRef

Wang, S.Y.[Sheng-Yu], Efros, A.A.[Alexei A.], Zhu, J.Y.[Jun-Yan], Zhang, R.[Richard],
Evaluating Data Attribution for Text-to-Image Models,
ICCV23(7158-7169)
IEEE DOI 2401
BibRef

Park, M.H.[Min-Ho], Yun, J.[Jooyeol], Choi, S.[Seunghwan], Choo, J.[Jaegul],
Learning to Generate Semantic Layouts for Higher Text-Image Correspondence in Text-to-Image Synthesis,
ICCV23(7557-7566)
IEEE DOI Code:
WWW Link. 2401
BibRef

Höllein, L.[Lukas], Cao, A.[Ang], Owens, A.[Andrew], Johnson, J.[Justin], Nießner, M.[Matthias],
Text2Room: Extracting Textured 3D Meshes from 2D Text-to-Image Models,
ICCV23(7875-7886)
IEEE DOI 2401
BibRef

Wei, Y.X.[Yu-Xiang], Zhang, Y.[Yabo], Ji, Z.L.[Zhi-Long], Bai, J.F.[Jin-Feng], Zhang, L.[Lei], Zuo, W.M.[Wang-Meng],
ELITE: Encoding Visual Concepts into Textual Embeddings for Customized Text-to-Image Generation,
ICCV23(15897-15907)
IEEE DOI Code:
WWW Link. 2401
BibRef

Bakr, E.M.[Eslam Mohamed], Sun, P.Z.[Peng-Zhan], Shen, X.Q.[Xiao-Qian], Khan, F.F.[Faizan Farooq], Li, L.E.[Li Erran], Elhoseiny, M.[Mohamed],
HRS-Bench: Holistic, Reliable and Scalable Benchmark for Text-to-Image Models,
ICCV23(19984-19996)
IEEE DOI Code:
WWW Link. 2401
BibRef

Lee, J.[Jaewoong], Jang, S.[Sangwon], Jo, J.[Jaehyeong], Yoon, J.[Jaehong], Kim, Y.J.[Yun-Ji], Kim, J.H.[Jin-Hwa], Ha, J.W.[Jung-Woo], Hwang, S.J.[Sung Ju],
Text-Conditioned Sampling Framework for Text-to-Image Generation with Masked Generative Models,
ICCV23(23195-23205)
IEEE DOI 2401
BibRef

Hou, X.[Xia], Sun, M.[Meng], Song, W.F.[Wen-Feng],
Tell Your Story: Text-Driven Face Video Synthesis with High Diversity via Adversarial Learning,
ICIP23(515-519)
IEEE DOI Code:
WWW Link. 2312
BibRef

Zhang, Z.Q.[Zhi-Qiang], Xu, J.Y.[Jia-Yao], Morita, R.[Ryugo], Yu, W.X.[Wen-Xin], Zhou, J.J.[Jin-Jia],
Dynamic Unilateral Dual Learning for Text to Image Synthesis,
ICIP23(1130-1134)
IEEE DOI 2312
BibRef

Mao, J.F.[Jia-Feng], Wang, X.T.[Xue-Ting],
Training-Free Location-Aware Text-to-Image Synthesis,
ICIP23(995-999)
IEEE DOI 2312
BibRef

Chen, W.J.[Wen-Jie], Ni, Z.K.[Zhang-Kai], Wang, H.L.[Han-Li],
Structure-Aware Generative Adversarial Network for Text-to-Image Generation,
ICIP23(2075-2079)
IEEE DOI 2312
BibRef

Morita, R.[Ryugo], Zhang, Z.Q.[Zhi-Qiang], Zhou, J.J.[Jin-Jia],
BATINeT: Background-Aware Text to Image Synthesis and Manipulation Network,
ICIP23(765-769)
IEEE DOI 2312
BibRef

Yang, S.S.[Shu-Sheng], Ge, Y.X.[Yi-Xiao], Yi, K.[Kun], Li, D.[Dian], Shan, Y.[Ying], Qie, X.[Xiaohu], Wang, X.G.[Xing-Gang],
RILS: Masked Visual Reconstruction in Language Semantic Space,
CVPR23(23304-23314)
IEEE DOI 2309
BibRef

Wei, J.C.[Jia-Cheng], Wang, H.[Hao], Feng, J.S.[Jia-Shi], Lin, G.S.[Guo-Sheng], Yap, K.H.[Kim-Hui],
TAPS3D: Text-Guided 3D Textured Shape Generation from Pseudo Supervision,
CVPR23(16805-16815)
IEEE DOI 2309
BibRef

Zeng, Y.[Yu], Lin, Z.[Zhe], Zhang, J.M.[Jian-Ming], Liu, Q.[Qing], Collomosse, J.[John], Kuen, J.[Jason], Patel, V.M.[Vishal M.],
SceneComposer: Any-Level Semantic Image Synthesis,
CVPR23(22468-22478)
IEEE DOI 2309
BibRef

Lin, J.[Junfan], Chang, J.L.[Jian-Long], Liu, L.B.[Ling-Bo], Li, G.B.[Guan-Bin], Lin, L.[Liang], Tian, Q.[Qi], Chen, C.W.[Chang Wen],
Being Comes from Not-Being: Open-Vocabulary Text-to-Motion Generation with Wordless Training,
CVPR23(23222-23231)
IEEE DOI 2309
BibRef

Yang, Z.Y.[Zheng-Yuan], Wang, J.F.[Jian-Feng], Gan, Z.[Zhe], Li, L.J.[Lin-Jie], Lin, K.[Kevin], Wu, C.[Chenfei], Duan, N.[Nan], Liu, Z.C.[Zi-Cheng], Liu, C.[Ce], Zeng, M.[Michael], Wang, L.J.[Li-Juan],
ReCo: Region-Controlled Text-to-Image Generation,
CVPR23(14246-14255)
IEEE DOI 2309
BibRef

Otani, M.[Mayu], Togashi, R.[Riku], Sawai, Y.[Yu], Ishigami, R.[Ryosuke], Nakashima, Y.[Yuta], Rahtu, E.[Esa], Heikkilä, J.[Janne], Satoh, S.[Shin'ichi],
Toward Verifiable and Reproducible Human Evaluation for Text-to-Image Generation,
CVPR23(14277-14286)
IEEE DOI 2309
BibRef

Liu, H.[Han], Wu, Y.H.[Yu-Hao], Zhai, S.[Shixuan], Yuan, B.[Bo], Zhang, N.[Ning],
RIATIG: Reliable and Imperceptible Adversarial Text-to-Image Generation with Natural Prompts,
CVPR23(20585-20594)
IEEE DOI 2309
BibRef

Kang, M.[Minguk], Zhu, J.Y.[Jun-Yan], Zhang, R.[Richard], Park, J.[Jaesik], Shechtman, E.[Eli], Paris, S.[Sylvain], Park, T.[Taesung],
Scaling up GANs for Text-to-Image Synthesis,
CVPR23(10124-10134)
IEEE DOI 2309
BibRef

Careil, M.[Marlène], Verbeek, J.[Jakob], Lathuilière, S.[Stéphane],
Few-shot Semantic Image Synthesis with Class Affinity Transfer,
CVPR23(23611-23620)
IEEE DOI 2309
BibRef

Kang, M.S.[Min-Soo], Lee, D.[Doyup], Kim, J.[Jiseob], Kim, S.[Saehoon], Han, B.H.[Bo-Hyung],
Variational Distribution Learning for Unsupervised Text-to-Image Generation,
CVPR23(23380-23389)
IEEE DOI 2309
BibRef

Sung-Bin, K.[Kim], Senocak, A.[Arda], Ha, H.W.[Hyun-Woo], Owens, A.[Andrew], Oh, T.H.[Tae-Hyun],
Sound to Visual Scene Generation by Audio-to-Visual Latent Alignment,
CVPR23(6430-6440)
IEEE DOI 2309
BibRef

Cong, Y.[Yuren], Yi, J.H.[Jin-Hui], Rosenhahn, B.[Bodo], Yang, M.Y.[Michael Ying],
SSGVS: Semantic Scene Graph-to-Video Synthesis,
MULA23(2555-2565)
IEEE DOI 2309
BibRef

Zhang, S.[Sixian], Song, X.H.[Xin-Hang], Li, W.J.[Wei-Jie], Bai, Y.B.[Yu-Bing], Yu, X.[Xinyao], Jiang, S.Q.[Shu-Qiang],
Layout-based Causal Inference for Object Navigation,
CVPR23(10792-10802)
IEEE DOI 2309
BibRef

Hsu, H.Y.[Hsiao-Yuan], He, X.T.[Xiang-Teng], Peng, Y.X.[Yu-Xin], Kong, H.[Hao], Zhang, Q.[Qing],
PosterLayout: A New Benchmark and Approach for Content-Aware Visual-Textual Presentation Layout,
CVPR23(6018-6026)
IEEE DOI 2309
BibRef

Xue, H.[Han], Huang, Z.W.[Zhi-Wu], Sun, Q.[Qianru], Song, L.[Li], Zhang, W.J.[Wen-Jun],
Freestyle Layout-to-Image Synthesis,
CVPR23(14256-14266)
IEEE DOI 2309
BibRef

Jiang, Z.Y.[Zhao-Yun], Guo, J.Q.[Jia-Qi], Sun, S.Z.[Shi-Zhao], Deng, H.Y.[Hua-Yu], Wu, Z.K.[Zhong-Kai], Mijovic, V.[Vuksan], Yang, Z.J.J.[Zi-Jiang James], Lou, J.G.[Jian-Guang], Zhang, D.M.[Dong-Mei],
LayoutFormer++: Conditional Graphic Layout Generation via Constraint Serialization and Decoding Space Restriction,
CVPR23(18403-18412)
IEEE DOI 2309
BibRef

Akula, A.R.[Arjun R.], Driscoll, B.[Brendan], Narayana, P.[Pradyumna], Changpinyo, S.[Soravit], Jia, Z.W.[Zhi-Wei], Damle, S.[Suyash], Pruthi, G.[Garima], Basu, S.[Sugato], Guibas, L.J.[Leonidas J.], Freeman, W.T.[William T.], Li, Y.Z.[Yuan-Zhen], Jampani, V.[Varun],
MetaCLUE: Towards Comprehensive Visual Metaphors Research,
CVPR23(23201-23211)
IEEE DOI 2309
BibRef

Lin, C.H.[Chen-Hsuan], Gao, J.[Jun], Tang, L.[Luming], Takikawa, T.[Towaki], Zeng, X.H.[Xiao-Hui], Huang, X.[Xun], Kreis, K.[Karsten], Fidler, S.[Sanja], Liu, M.Y.[Ming-Yu], Lin, T.Y.[Tsung-Yi],
Magic3D: High-Resolution Text-to-3D Content Creation,
CVPR23(300-309)
IEEE DOI 2309
BibRef

Hwang, I.[Inwoo], Kim, H.[Hyeonwoo], Kim, Y.M.[Young Min],
Text2Scene: Text-driven Indoor Scene Stylization with Part-Aware Details,
CVPR23(1890-1899)
IEEE DOI 2309
BibRef

Li, Y.H.[Yu-Heng], Liu, H.T.[Hao-Tian], Wu, Q.Y.[Qing-Yang], Mu, F.Z.[Fang-Zhou], Yang, J.W.[Jian-Wei], Gao, J.F.[Jian-Feng], Li, C.Y.[Chun-Yuan], Lee, Y.J.[Yong Jae],
GLIGEN: Open-Set Grounded Text-to-Image Generation,
CVPR23(22511-22521)
IEEE DOI 2309
BibRef

Lai, B.[Borun], Ma, L.H.[Li-Hong], Tian, J.[Jing],
Gated Cross Word-visual Attention-driven Generative Adversarial Networks for Text-to-image Synthesis,
ACCV22(VII:88-100).
Springer DOI 2307
BibRef

Wang, Z.W.[Zhi-Wei], Yang, J.[Jing], Cui, J.J.[Jia-Jun], Liu, J.W.[Jia-Wei], Wang, J.H.[Jia-Hao],
DAC-GAN: Dual Auxiliary Consistency Generative Adversarial Network for Text-to-Image Generation,
ACCV22(VII:3-19).
Springer DOI 2307
BibRef

Liang, M.L.[Ming-Liang], Liu, Z.[Zhuoran], Larson, M.[Martha],
Textual Concept Expansion with Commonsense Knowledge to Improve Dual-Stream Image-Text Matching,
MMMod23(I: 421-433).
Springer DOI 2304
Text as input, output concepts BibRef

Loeschcke, S.[Sebastian], Belongie, S.[Serge], Benaim, S.[Sagie],
Text-driven Stylization of Video Objects,
CVEU22(594-609).
Springer DOI 2304
BibRef

Zhou, L.L.[Long-Long], Wu, X.J.[Xiao-Jun], Xu, T.Y.[Tian-Yang],
COMIM-GAN: Improved Text-to-Image Generation via Condition Optimization and Mutual Information Maximization,
MMMod23(I: 385-396).
Springer DOI 2304
BibRef

Lee, H.[Hanbit], Kim, Y.[Youna], Lee, S.G.[Sang-Goo],
Multi-scale Contrastive Learning for Complex Scene Generation,
WACV23(764-774)
IEEE DOI 2302
Semantics, Generative adversarial networks, Generators, Data models, Task analysis, image and video synthesis BibRef

Kim, J.Y.[Jih-Yun], Jeong, S.H.[Seong-Hun], Kong, K.[Kyeongbo], Kang, S.J.[Suk-Ju],
An Unified Framework for Language Guided Image Completion,
WACV23(2567-2577)
IEEE DOI 2302
Training, Visualization, Image synthesis, Computational modeling, Natural languages, Complexity theory, Vision + language and/or other modalities BibRef

Liao, W.T.[Wen-Tong], Hu, K.[Kai], Yang, M.Y.[Michael Ying], Rosenhahn, B.[Bodo],
Text to Image Generation with Semantic-Spatial Aware GAN,
CVPR22(18166-18175)
IEEE DOI 2210
Visualization, Image recognition, Image synthesis, Fuses, Computational modeling, Semantics, Vision+language BibRef

He, S.[Sen], Liao, W.T.[Wen-Tong], Yang, M.Y.[Michael Ying], Yang, Y.X.[Yong-Xin], Song, Y.Z.[Yi-Zhe], Rosenhahn, B.[Bodo], Xiang, T.[Tao],
Context-Aware Layout to Image Generation with Enhanced Object Appearance,
CVPR21(15044-15053)
IEEE DOI 2111
Visualization, Image synthesis, Computational modeling, Layout, Benchmark testing, Inspection, Generators BibRef

Wang, Z.K.[Ze-Kang], Liu, L.[Li], Zhang, H.X.[Hua-Xiang], Ma, Y.[Yue], Cui, H.L.[Huai-Lei], Chen, Y.[Yuan], Kong, H.R.[Hao-Ran],
Generative Adversarial Networks Based on Dynamic Word-Level Update for Text-to-Image Synthesis,
ICIVC22(641-647)
IEEE DOI 2301
Training, Image synthesis, Semantics, Benchmark testing, Generative adversarial networks, Visual effects, Generators, hierarchical image generation BibRef

Li, H.[Hui], Yuan, X.C.[Xu-Chang],
Image Generation Method of Bird Text Based on Improved StackGAN,
ICIVC22(805-811)
IEEE DOI 2301
Training, Image synthesis, Convolution, Computational modeling, Semantics, Birds, Cultural differences, Text to image, StackGAN, Residual structure BibRef

Liu, X.[Xian], Xu, Y.H.[Ying-Hao], Wu, Q.Y.[Qian-Yi], Zhou, H.[Hang], Wu, W.[Wayne], Zhou, B.[Bolei],
Semantic-Aware Implicit Neural Audio-Driven Video Portrait Generation,
ECCV22(XXXVII:106-125).
Springer DOI 2211
BibRef

Li, B.[Bowen],
Word-Level Fine-Grained Story Visualization,
ECCV22(XXXVI:347-362).
Springer DOI 2211
BibRef

Tan, R.[Reuben], Plummer, B.A.[Bryan A.], Saenko, K.[Kate], Lewis, J.P., Sud, A.[Avneesh], Leung, T.[Thomas],
NewsStories: Illustrating Articles with Visual Summaries,
ECCV22(XXXVI:644-661).
Springer DOI 2211
BibRef

Roy, P.[Prasun], Ghosh, S.[Subhankar], Bhattacharya, S.[Saumik], Pal, U.[Umapada], Blumenstein, M.[Michael],
TIPS: Text-Induced Pose Synthesis,
ECCV22(XXXVIII:161-178).
Springer DOI 2211
BibRef

Shi, Z.F.[Zi-Fan], Shen, Y.J.[Yu-Jun], Zhu, J.P.[Jia-Peng], Yeung, D.Y.[Dit-Yan], Chen, Q.F.[Qi-Feng],
3D-Aware Indoor Scene Synthesis with Depth Priors,
ECCV22(XVI:406-422).
Springer DOI 2211
BibRef

Lee, S.H.[Seung Hyun], Oh, G.[Gyeongrok], Byeon, W.[Wonmin], Kim, C.[Chanyoung], Ryoo, W.J.[Won Jeong], Yoon, S.H.[Sang Ho], Cho, H.[Hyunjun], Bae, J.Y.[Jih-Yun], Kim, J.[Jinkyu], Kim, S.[Sangpil],
Sound-Guided Semantic Video Generation,
ECCV22(XVII:34-50).
Springer DOI 2211
BibRef

Yan, K.[Kun], Ji, L.[Lei], Wu, C.F.[Chen-Fei], Bao, J.M.[Jian-Min], Zhou, M.[Ming], Duan, N.[Nan], Ma, S.[Shuai],
Trace Controlled Text to Image Generation,
ECCV22(XXXVI:59-75).
Springer DOI 2211
BibRef

Dinh, T.M.[Tan M.], Nguyen, R.[Rang], Hua, B.S.[Binh-Son],
TISE: Bag of Metrics for Text-to-Image Synthesis Evaluation,
ECCV22(XXXVI:594-609).
Springer DOI 2211
BibRef

Zhang, J.H.[Jia-Hui], Zhan, F.N.[Fang-Neng], Theobalt, C.[Christian], Lu, S.J.[Shi-Jian],
Regularized Vector Quantization for Tokenized Image Synthesis,
CVPR23(18467-18476)
IEEE DOI 2309
BibRef

Zhan, F.N.[Fang-Neng], Zhang, J.H.[Jia-Hui], Yu, Y.C.[Ying-Chen], Wu, R.L.[Rong-Liang], Lu, S.J.[Shi-Jian],
Modulated Contrast for Versatile Image Synthesis,
CVPR22(18259-18269)
IEEE DOI 2210
Photography, Visualization, Codes, Image synthesis, Force, Performance gain, Image and video synthesis and generation, Computational photography BibRef

Qiao, X.T.[Xiao-Tian], Hancke, G.P.[Gerhard P.], Lau, R.W.H.[Rynson W.H.],
Learning Object Context for Novel-view Scene Layout Generation,
CVPR22(16969-16978)
IEEE DOI 2210
Computational modeling, Layout, Semantics, Predictive models, Cameras, Probabilistic logic, Scene analysis and understanding, Image and video synthesis and generation BibRef

Ntavelis, E.[Evangelos], Shahbazi, M.[Mohamad], Kastanis, I.[Iason], Timofte, R.[Radu], Danelljan, M.[Martin], Van Gool, L.J.[Luc J.],
Arbitrary-Scale Image Synthesis,
CVPR22(11523-11532)
IEEE DOI 2210
Training, Image coding, Image synthesis, Pipelines, Generative adversarial networks, Encoding, Image and video synthesis and generation BibRef

Georgopoulos, M.[Markos], Oldfield, J.[James], Chrysos, G.G.[Grigorios G.], Panagakis, Y.[Yannis],
Cluster-guided Image Synthesis with Unconditional Models,
CVPR22(11533-11542)
IEEE DOI 2210
Hair, Maximum likelihood estimation, Image synthesis, Semantics, Process control, Generative adversarial networks, Generators, Explainable computer vision BibRef

Wei, Y.X.[Yu-Xiang], Ji, Z.L.[Zhi-Long], Wu, X.H.[Xiao-He], Bai, J.F.[Jin-Feng], Zhang, L.[Lei], Zuo, W.M.[Wang-Meng],
Inferring and Leveraging Parts from Object Shape for Improving Semantic Image Synthesis,
CVPR23(11248-11258)
IEEE DOI 2309
BibRef

Lv, Z.Y.[Zheng-Yao], Li, X.M.[Xiao-Ming], Niu, Z.X.[Zhen-Xing], Cao, B.[Bing], Zuo, W.M.[Wang-Meng],
Semantic-shape Adaptive Feature Modulation for Semantic Image Synthesis,
CVPR22(11204-11213)
IEEE DOI 2210
Adaptation models, Codes, Shape, Image synthesis, Convolution, Semantics, Image and video synthesis and generation BibRef

Shi, Y.P.[Yu-Peng], Liu, X.[Xiao], Wei, Y.X.[Yu-Xiang], Wu, Z.Q.[Zhong-Qin], Zuo, W.M.[Wang-Meng],
Retrieval-based Spatially Adaptive Normalization for Semantic Image Synthesis,
CVPR22(11214-11223)
IEEE DOI 2210
Training, Visualization, Image synthesis, Shape, Navigation, Semantics, Wheels, Image and video synthesis and generation BibRef

Shim, S.H.[Sang-Heon], Hyun, S.[Sangeek], Bae, D.H.[Dae-Hyun], Heo, J.P.[Jae-Pil],
Local Attention Pyramid for Scene Image Generation,
CVPR22(7764-7772)
IEEE DOI 2210
Measurement, Deep learning, Visualization, Image segmentation, Image analysis, Image synthesis, Scene analysis and understanding BibRef

Wang, B.[Bo], Wu, T.[Tao], Zhu, M.[Minfeng], Du, P.[Peng],
Interactive Image Synthesis with Panoptic Layout Generation,
CVPR22(7773-7782)
IEEE DOI 2210
Visualization, Image synthesis, Shape, Perturbation methods, Layout, Semantics, Genomics, Image and video synthesis and generation BibRef

Yang, Z.P.[Zuo-Peng], Liu, D.Q.[Da-Qing], Wang, C.Y.[Chao-Yue], Yang, J.[Jie], Tao, D.C.[Da-Cheng],
Modeling Image Composition for Complex Scene Generation,
CVPR22(7754-7763)
IEEE DOI 2210
Training, Measurement, Visualization, Image coding, Layout, Genomics, Predictive models, Image and video synthesis and generation BibRef

Jeong, J.[Jaebong], Jo, J.[Janghun], Cho, S.[Sunghyun], Park, J.[Jaesik],
3D Scene Painting via Semantic Image Synthesis,
CVPR22(2252-2262)
IEEE DOI 2210
Training, Solid modeling, Image color analysis, Image synthesis, Machine vision, Semantics, Vision applications and systems, Vision + graphics BibRef

Aldausari, N.[Nuha], Sowmya, A.[Arcot], Marcus, N.[Nadine], Mohammadi, G.[Gelareh],
Cascaded Siamese Self-supervised Audio to Video GAN,
MULA22(4690-4699)
IEEE DOI 2210
Solid modeling, Correlation, Computational modeling, Pattern recognition BibRef

Tao, M.[Ming], Tang, H.[Hao], Wu, F.[Fei], Jing, X.Y.[Xiao-Yuan], Bao, B.K.[Bing-Kun], Xu, C.S.[Chang-Sheng],
DF-GAN: A Simple and Effective Baseline for Text-to-Image Synthesis,
CVPR22(16494-16504)
IEEE DOI 2210
Visualization, Codes, Semantics, Generative adversarial networks, Generators, Vision+language, Image and video synthesis and generation BibRef

Zhou, Y.F.[Yu-Fan], Zhang, R.[Ruiyi], Chen, C.Y.[Chang-You], Li, C.Y.[Chun-Yuan], Tensmeyer, C.[Chris], Yu, T.[Tong], Gu, J.X.[Jiu-Xiang], Xu, J.H.[Jin-Hui], Sun, T.[Tong],
Towards Language-Free Training for Text-to-Image Generation,
CVPR22(17886-17896)
IEEE DOI 2210
Training, Image synthesis, Semantics, Training data, Tail, Data collection, Data models, Vision+language, Image and video synthesis and generation BibRef

Li, Z.H.[Zhi-Heng], Min, M.R.[Martin Renqiang], Li, K.[Kai], Xu, C.L.[Chen-Liang],
StyleT2I: Toward Compositional and High-Fidelity Text-to-Image Synthesis,
CVPR22(18176-18186)
IEEE DOI 2210
Measurement, Ethics, Image synthesis, Computational modeling, Semantics, Robustness, Image and video synthesis and generation, Vision+language BibRef

Sanghi, A.[Aditya], Chu, H.[Hang], Lambourne, J.G.[Joseph G.], Wang, Y.[Ye], Cheng, C.Y.[Chin-Yi], Fumero, M.[Marco], Malekshan, K.R.[Kamal Rahimi],
CLIP-Forge: Towards Zero-Shot Text-to-Shape Generation,
CVPR22(18582-18592)
IEEE DOI 2210
Training, Point cloud compression, Shape, Semantics, Natural languages, Vision + graphics, Vision+language BibRef

Jain, A.[Ajay], Mildenhall, B.[Ben], Barron, J.T.[Jonathan T.], Abbeel, P.[Pieter], Poole, B.[Ben],
Zero-Shot Text-Guided Object Generation with Dream Fields,
CVPR22(857-866)
IEEE DOI 2210
Geometry, Visualization, Solid modeling, Image color analysis, Shape, Deep learning architectures and techniques, Vision applications and systems BibRef

Bazazian, D.[Dena], Calway, A.[Andrew], Damen, D.[Dima],
Dual-Domain Image Synthesis using Segmentation-Guided GAN,
NTIRE22(506-515)
IEEE DOI 2210
Hair, Training, Image segmentation, Codes, Semantics, Nose, Mouth BibRef

Yang, Y.Y.[Yu-Yan], Ni, X.[Xin], Hao, Y.B.[Yan-Bin], Liu, C.Y.[Chen-Yu], Wang, W.S.[Wen-Shan], Liu, Y.F.[Yi-Feng], Xi, H.Y.[Hai-Yong],
MF-GAN: Multi-conditional Fusion Generative Adversarial Network for Text-to-Image Synthesis,
MMMod22(I:41-53).
Springer DOI 2203
Best paper section BibRef

Wang, Y.[Yi], Qi, L.[Lu], Chen, Y.C.[Ying-Cong], Zhang, X.Y.[Xiang-Yu], Jia, J.Y.[Jia-Ya],
Image Synthesis via Semantic Composition,
ICCV21(13729-13738)
IEEE DOI 2203
Correlation, Image synthesis, Convolution, Semantics, Layout, Benchmark testing, Image and video synthesis, Neural generative models BibRef

Dhamo, H.[Helisa], Manhardt, F.[Fabian], Navab, N.[Nassir], Tombari, F.[Federico],
Graph-to-3D: End-to-End Generation and Manipulation of 3D Scenes Using Scene Graphs,
ICCV21(16332-16341)
IEEE DOI 2203
Point cloud compression, Visualization, Solid modeling, Shape, Semantics, Scene analysis and understanding, BibRef

Li, Z.J.[Ze-Jian], Wu, J.Y.[Jing-Yu], Koh, I.[Immanuel], Tang, Y.C.[Yong-Chuan], Sun, L.Y.[Ling-Yun],
Image Synthesis from Layout with Locality-Aware Mask Adaption,
ICCV21(13799-13808)
IEEE DOI 2203
Adaptation models, Visualization, Image segmentation, Image synthesis, Computational modeling, Layout, Neural generative models BibRef

Qi, Y.G.[Yong-Gang], Su, G.Y.[Guo-Yao], Chowdhury, P.N.[Pinaki Nath], Li, M.K.[Ming-Kang], Song, Y.Z.[Yi-Zhe],
SketchLattice: Latticed Representation for Sketch Manipulation,
ICCV21(933-941)
IEEE DOI 2203
Image quality, Limiting, Computational modeling, Lattices, Task analysis, Vision + other modalities, Vision applications and systems BibRef

Yang, L.[Lan], Pang, K.Y.[Kai-Yue], Zhang, H.G.[Hong-Gang], Song, Y.Z.[Yi-Zhe],
SketchAA: Abstract Representation for Abstract Sketches,
ICCV21(10077-10086)
IEEE DOI 2203
Visualization, Image recognition, Codes, Computational modeling, Image retrieval, Rendering (computer graphics), Vision applications and systems BibRef

Canfes, Z.[Zehranaz], Atasoy, M.F.[M. Furkan], Dirik, A.[Alara], Yanardag, P.[Pinar],
Text and Image Guided 3D Avatar Generation and Manipulation,
WACV23(4410-4420)
IEEE DOI 2302
Solid modeling, Shape, Avatars, Source coding, Pipelines, Process control, Algorithms: 3D computer vision, Biometrics, face, body pose BibRef

Kocasari, U.[Umut], Dirik, A.[Alara], Tiftikci, M.[Mert], Yanardag, P.[Pinar],
StyleMC: Multi-Channel Based Fast Text-Guided Image Generation and Manipulation,
WACV22(3441-3450)
IEEE DOI 2202
Training, Hair, Codes, Image synthesis, Image color analysis, Semantics, Deep Learning BibRef

Xiang, X.Y.[Xiao-Yu], Liu, D.[Ding], Yang, X.[Xiao], Zhu, Y.H.[Yi-Heng], Shen, X.H.[Xiao-Hui], Allebach, J.P.[Jan P.],
Adversarial Open Domain Adaptation for Sketch-to-Photo Synthesis,
WACV22(944-954)
IEEE DOI 2202
Training, Image color analysis, Training data, Distortion, Generators, Optimization, Image and Video Synthesis BibRef

Ivgi, M.[Maor], Benny, Y.[Yaniv], Ben-David, A.[Avichai], Berant, J.[Jonathan], Wolf, L.B.[Lior B.],
Scene Graph To Image Generation with Contextualized Object Layout Refinement,
ICIP21(2428-2432)
IEEE DOI 2201
Image synthesis, Layout, Predictive models, Task analysis, Context modeling, Image Synthesis, Scene Graph, GAN BibRef

Jeon, E.[Eunyeong], Kim, K.[Kunhee], Kim, D.J.[Dai-Jin],
FA-GAN: Feature-Aware GAN for Text to Image Synthesis,
ICIP21(2443-2447)
IEEE DOI 2201
Image synthesis, Natural languages, Generative adversarial networks, Feature extraction, Generators, Feature-Aware GAN BibRef

Zhang, Z.Q.[Zhi-Qiang], Yu, W.X.[Wen-Xin], Jiang, N.[Ning], Zhou, J.J.[Jin-Jia],
Text To Image Synthesis With Erudite Generative Adversarial Networks,
ICIP21(2438-2442)
IEEE DOI 2201
Image synthesis, Generative adversarial networks, Data models, Task analysis, Text-to-Image Synthesis, Generative Adversarial Networks BibRef

Yuan, S.Z.[Shao-Zu], Dai, A.[Aijun], Yan, Z.L.[Zhi-Ling], Guo, Z.[Zehua], Liu, R.X.[Rui-Xue], Chen, M.[Meng],
SketchBird: Learning to Generate Bird Sketches from Text,
SHE21(2443-2452)
IEEE DOI 2112
Fuses, Shape, Error analysis, Image edge detection, Computational modeling BibRef

Berardi, G.[Gianluca], Salti, S.[Samuele], di Stefano, L.[Luigi],
SketchyDepth: from Scene Sketches to RGB-D Images,
SHE21(2414-2423)
IEEE DOI 2112
Training, Geometry, Image synthesis, Annotations, Conferences BibRef

Lu, X.P.[Xiao-Peng], Ng, L.[Lynnette], Fernandez, J.[Jared], Zhu, H.[Hao],
CIGLI: Conditional Image Generation from Language & Image,
CLVL21(3127-3131)
IEEE DOI 2112
Codes, Image synthesis, Computational modeling, Semantics, Cognition BibRef

Dorkenwald, M.[Michael], Milbich, T.[Timo], Blattmann, A.[Andreas], Rombach, R.[Robin], Derpanis, K.G.[Konstantinos G.], Ommer, B.[Björn],
Stochastic Image-to-Video Synthesis using cINNs,
CVPR21(3741-3752)
IEEE DOI 2111
Neural networks, Stochastic processes, Process control, Predictive models, Probabilistic logic, Pattern recognition BibRef

Zhang, H.[Han], Koh, J.Y.[Jing Yu], Baldridge, J.[Jason], Lee, H.L.[Hong-Lak], Yang, Y.F.[Yin-Fei],
Cross-Modal Contrastive Learning for Text-to-Image Generation,
CVPR21(833-842)
IEEE DOI 2111
Image quality, Image synthesis, Computational modeling, Impedance matching, Semantics, Natural languages, Generative adversarial networks BibRef

Koh, J.Y.[Jing Yu], Baldridge, J.[Jason], Lee, H.L.[Hong-Lak], Yang, Y.F.[Yin-Fei],
Text-to-Image Generation Grounded by Fine-Grained User Attention,
WACV21(237-246)
IEEE DOI 2106
Measurement, Image segmentation, Visualization, Grounding, Natural languages BibRef

Long, J.[Jia], Lu, H.T.[Hong-Tao],
Multi-level Gate Feature Aggregation with Spatially Adaptive Batch-instance Normalization for Semantic Image Synthesis,
MMMod21(I:378-390).
Springer DOI 2106
BibRef

Yan, J.W.[Jia-Wei], Lin, C.S.[Ci-Siang], Yang, F.E.[Fu-En], Li, Y.J.[Yu-Jhe], Wang, Y.C.A.F.[Yu-Chi-Ang Frank],
Semantics-Guided Representation Learning with Applications to Visual Synthesis,
ICPR21(7181-7187)
IEEE DOI 2105
Visualization, Interpolation, Computational modeling, Semantics, Data visualization, Semantic interpolation BibRef

Tang, S.C.[Shi-Chang], Zhou, X.[Xu], He, X.M.[Xu-Ming], Ma, Y.[Yi],
Disentangled Representation Learning for Controllable Image Synthesis: An Information-Theoretic Perspective,
ICPR21(10042-10049)
IEEE DOI 2105
Training, Image synthesis, Image color analysis, Mutual information BibRef

Ji, Z.Y.[Zhong-Yi], Wang, W.M.[Wen-Min], Chen, B.Y.[Bao-Yang], Han, X.[Xiao],
Text-to-Image Generation via Semi-Supervised Training,
VCIP20(265-268)
IEEE DOI 2102
image classification, learning (artificial intelligence), text analysis, visual databases, text-to-image generation, Pseudo Feature BibRef

Devaranjan, J.[Jeevan], Kar, A.[Amlan], Fidler, S.[Sanja],
Meta-SIM2: Unsupervised Learning of Scene Structure for Synthetic Data Generation,
ECCV20(XVII:715-733).
Springer DOI 2011

WWW Link. BibRef

Song, Y.Z.[Yun-Zhu], Tam, Z.R.[Zhi Rui], Chen, H.J.[Hung-Jen], Lu, H.H.[Huiao-Han], Shuai, H.H.[Hong-Han],
Character-preserving Coherent Story Visualization,
ECCV20(XVII:18-33).
Springer DOI 2011
BibRef

Achituve, I.[Idan], Maron, H.[Haggai], Chechik, G.[Gal],
Self-Supervised Learning for Domain Adaptation on Point Clouds,
WACV21(123-133)
IEEE DOI 2106
Phase change materials, Training, Task analysis BibRef

Herzig, R.[Roei], Bar, A.[Amir], Xu, H.J.[Hui-Juan], Chechik, G.[Gal], Darrell, T.J.[Trevor J.], Globerson, A.[Amir],
Learning Canonical Representations for Scene Graph to Image Generation,
ECCV20(XXVI:210-227).
Springer DOI 2011
BibRef

Zheng, H.T.[Hai-Tian], Liao, H.[Haofu], Chen, L.[Lele], Xiong, W.[Wei], Chen, T.L.[Tian-Lang], Luo, J.B.[Jie-Bo],
Example-guided Image Synthesis Using Masked Spatial-channel Attention and Self-supervision,
ECCV20(XIV:422-439).
Springer DOI 2011
BibRef

Mallya, A.[Arun], Wang, T.C.[Ting-Chun], Sapra, K.[Karan], Liu, M.Y.[Ming-Yu],
World-Consistent Video-to-Video Synthesis,
ECCV20(VIII:359-378).
Springer DOI 2011
BibRef

Vo, D.M.[Duc Minh], Sugimoto, A.[Akihiro],
Visual-relation Conscious Image Generation from Structured-text,
ECCV20(XXVIII:290-306).
Springer DOI 2011
BibRef

Burns, A.[Andrea], Kim, D.H.[Dong-Hyun], Wijaya, D.[Derry], Saenko, K.[Kate], Plummer, B.A.[Bryan A.],
Learning to Scale Multilingual Representations for Vision-Language Tasks,
ECCV20(IV:197-213).
Springer DOI 2011
BibRef

Liang, J.D.[Jia-Dong], Pei, W.J.[Wen-Jie], Lu, F.[Feng],
Cpgan: Content-parsing Generative Adversarial Networks for Text-to-image Synthesis,
ECCV20(IV:491-508).
Springer DOI 2011
BibRef

Nawhal, M.[Megha], Zhai, M.Y.[Meng-Yao], Lehrmann, A.[Andreas], Sigal, L.[Leonid], Mori, G.[Greg],
Generating Videos of Zero-shot Compositions of Actions and Objects,
ECCV20(XII: 382-401).
Springer DOI 2010
BibRef

Huang, H.P.[Hsin-Ping], Tseng, H.Y.[Hung-Yu], Lee, H.Y.[Hsin-Ying], Huang, J.B.[Jia-Bin],
Semantic View Synthesis,
ECCV20(XII: 592-608).
Springer DOI 2010
BibRef

Zhu, Z.[Zhen], Xu, Z.L.[Zhi-Liang], You, A.S.[An-Sheng], Bai, X.[Xiang],
Semantically Multi-Modal Image Synthesis,
CVPR20(5466-5475)
IEEE DOI 2008
Semantics, Task analysis, Convolutional codes, Image generation, Decoding, Generators, Controllability BibRef

Luo, A., Zhang, Z., Wu, J., Tenenbaum, J.B.,
End-to-End Optimization of Scene Layout,
CVPR20(3753-3762)
IEEE DOI 2008
Layout, Semantics, Decoding, Rendering (computer graphics), Solid modeling, Training BibRef

Gao, C., Liu, Q., Xu, Q., Wang, L., Liu, J., Zou, C.,
SketchyCOCO: Image Generation From Freehand Scene Sketches,
CVPR20(5173-5182)
IEEE DOI 2008
Image edge detection, Image generation, Training, Data models, Semantics, Image segmentation BibRef

Chen, Q., Wu, Q., Tang, R., Wang, Y., Wang, S., Tan, M.,
Intelligent Home 3D: Automatic 3D-House Design From Linguistic Descriptions Only,
CVPR20(12622-12631)
IEEE DOI 2008
Layout, Buildings, Linguistics, Task analysis, Solid modeling BibRef

Liu, C., Mao, Z., Zhang, T., Xie, H., Wang, B., Zhang, Y.,
Graph Structured Network for Image-Text Matching,
CVPR20(10918-10927)
IEEE DOI 2008
Visualization, Dogs, Semantics, Sparse matrices, Image edge detection, Learning systems, Feature extraction BibRef

Sarafianos, N., Xu, X., Kakadiaris, I.,
Adversarial Representation Learning for Text-to-Image Matching,
ICCV19(5813-5823)
IEEE DOI 2004
image matching, image representation, learning (artificial intelligence), Adversarial representation, Distance measurement BibRef

Tan, F.[Fuwen], Feng, S.[Song], Ordonez, V.[Vicente],
Text2Scene: Generating Compositional Scenes From Textual Descriptions,
CVPR19(6703-6712).
IEEE DOI 2002
BibRef

Yin, G.J.[Guo-Jun], Liu, B.[Bin], Sheng, L.[Lu], Yu, N.H.[Neng-Hai], Wang, X.G.[Xiao-Gang], Shao, J.[Jing],
Semantics Disentangling for Text-To-Image Generation,
CVPR19(2322-2331).
IEEE DOI 2002
BibRef

Li, W.B.[Wen-Bo], Zhang, P.C.[Peng-Chuan], Zhang, L.[Lei], Huang, Q.Y.[Qiu-Yuan], He, X.D.[Xiao-Dong], Lyu, S.W.[Si-Wei], Gao, J.F.[Jian-Feng],
Object-Driven Text-To-Image Synthesis via Adversarial Training,
CVPR19(12166-12174).
IEEE DOI 2002
BibRef

Talavera, A., Tan, D.S., Azcarraga, A., Hua, K.,
Layout and Context Understanding for Image Synthesis with Scene Graphs,
ICIP19(1905-1909)
IEEE DOI 1910
Generative Models, Text-to-Image Synthesis, Scene Graphs BibRef

Joseph, K.J., Pal, A.[Arghya], Rajanala, S.[Sailaja], Balasubramanian, V.N.[Vineeth N.],
C4Synth: Cross-Caption Cycle-Consistent Text-to-Image Synthesis,
WACV19(358-366)
IEEE DOI 1904
image capture, image processing, virtual reality, visual databases, image editing, virtual reality, plausible image, Data models BibRef

Zhang, Z., Xie, Y., Yang, L.,
Photographic Text-to-Image Synthesis with a Hierarchically-Nested Adversarial Network,
CVPR18(6199-6208)
IEEE DOI 1812
Generators, Training, Image resolution, Task analysis, Semantics, Measurement BibRef

Qi, X., Chen, Q., Jia, J.Y.[Jia-Ya], Koltun, V.,
Semi-Parametric Image Synthesis,
CVPR18(8808-8816)
IEEE DOI 1812
Image segmentation, Semantics, Layout, Training, Image generation, Image color analysis, Pipelines BibRef

Hong, S.H.[Seung-Hoon], Yang, D.D.[Ding-Dong], Choi, J.[Jongwook], Lee, H.L.[Hong-Lak],
Inferring Semantic Layout for Hierarchical Text-to-Image Synthesis,
CVPR18(7986-7994)
IEEE DOI 1812
Layout, Generators, Semantics, Shape, Image generation, Task analysis BibRef

Sah, S., Peri, D., Shringi, A., Zhang, C., Dominguez, M., Savakis, A., Ptucha, R.,
Semantically Invariant Text-to-Image Generation,
ICIP18(3783-3787)
IEEE DOI 1809
Measurement, Image generation, Generators, Image quality, Detectors, Visualization, Cost function BibRef

Kong, C.[Chen], Lin, D.[Dahua], Bansal, M.[Mohit], Urtasun, R.[Raquel], Fidler, S.[Sanja],
What Are You Talking About? Text-to-Image Coreference,
CVPR14(3558-3565)
IEEE DOI 1409
3D object detection; Text and images; scene understanding BibRef

Chapter on 3-D Object Description and Computation Techniques, Surfaces, Deformable, View Generation, Video Conferencing continues in
Diffusion for Text to Image Generation .

Last update:Apr 27, 2024 at 11:46:35