Modèles d'IA générative pour la création d’images simples

Ce projet a été attribué.

Encadrants

  • P. Bianchi, C. Laclau
  • Emails: pascal.bianchi@telecom-paris.fr
  • Bureaux: 5C52

Nombre d'étudiant par instance du projet:

  • Minimum: 4
  • Maximum: 4

Nombre d'instances du projet :

1

Sigles des UE couvertes et/ou Mots-clés :

MDI104

Description du projet :

Les modèles d'intelligence artificielle générative sont des outils puissants capables de produire des contenus nouveaux, comme des images, à partir de données d'entraînement et parfois d'instructions textuelles.

Objectif : Ce projet vise à développer une compréhension pratique des modèles d'intelligence artificielle générative en programmant et entraînant deux types de modèles (GANs et diffusion models) pour créer des images simples à partir de prompts textuels.

Description des étapes du projet :

1. **Revue de l’état de l’art** : Les élèves analyseront les concepts clés des GANs (Generative Adversarial Networks) et des diffusion models, ainsi que les cas d’utilisation actuels pour comprendre leurs avantages et limitations respectifs.

2. **Développement des modèles** : Deux méthodes seront programmées et entraînées sur un jeu de données simple (formes géométriques ou scènes abstraites). Les élèves implémenteront un GAN et un modèle de diffusion, en explorant les paramétrages et ajustements pour optimiser la qualité des images générées.

3. **Utilisation de prompts** : Une interface sera développée pour permettre la génération d’images basée sur des descriptions textuelles. Les élèves compareront les résultats obtenus avec chaque méthode et analyseront leur pertinence.

**Livrables :** Code source des modèles, rapport d’analyse des performances et des résultats, exemples d’images générées, retour sur l’expérience utilisateur.

*NB : Cette proposition a été elle-même générée par une IA générative.*

Objectifs du projet :

Ce projet vise à développer une compréhension pratique des modèles d'intelligence artificielle générative en programmant et entraînant deux types de modèles (GANs et diffusion models) pour créer des images simples à partir de prompts textuels.

Logiciels requis:

None

Références bibliographiques:

A réaliser par les étudiants.