Synteza treści wizualnych, które spełniają potrzeby użytkowników, często wymaga elastycznej i precyzyjnej kontroli pozy, kształtu, ekspresji i układu generowanych obiektów. Istniejące podejścia uzyskują kontrolę nad generatywnymi sieciami przeciwstawnymi (GAN) poprzez ręcznie adnotowane dane treningowe lub wcześniejszy model 3D, którym często brakuje elastyczności, precyzji i o