Intelligence Artificielle et Photographie de Paysage

Exemples de variations image to image sur stable diffusion à partir de mes photos
Mars 2023

Les I.A sont en train de prendre une part importante dans les processus créatifs et d'arriver massivement dans nos vies depuis le début 2023, que ce soit sous forme de texte généré (Chat GPT) ou sous forme de création d'images à partir de textes ou d'images référentes (MidJourney, Stable Diffusion, Dall-E). Elles sont également au cœur de débats complexes à propos du travail des concept artist et illustrateurs de tous styles, des droits d'auteur, du plagiat, etc.. Je ne m'exprimerai pas vraiment sur ces points ; Hormis le fait que, pour un photographe de paysage qui veut documenter le réel, il n'y a pas beaucoup d'impact car les I.A sont essentiellement douées pour l'aspect purement inventé ( interpolé à partir de concepts, il en sort des résultats étonnants et potentiellement beaux ) , mais ne peuvent pas représenter le réel. On ne peut pas demander à une I.A une photo réaliste du Mont-Blanc où on verrait des détails témoignant d'une réalité bien tangible. Par contre c'est effectivement un peu plus problématique et donc inquiétant lorsque le travail du photographe est plus abstrait et interprété, plus détaché du réel en quelque sorte, comme le mien peut parfois l'être. Par exemples des détails ou textures ou des sommets non reconnaissables avec une prédominance de l'ambiance inspiré des grands peintres. Ce genre de choses sont maintenant créés en quelques minutes et relativement facilement par les I.A. Voila encore une raison qui me fait chercher dans mon travail un équilibre difficile à trouver entre réalisme et surréalisme, qui témoignerait d'une réalité bien existante tout en étant suffisamment interprété et habité d'un regard personnel pour en suggérer davantage.

J'ai voulu tester par moi même pour comprendre les enjeux, et comment cela pourrait être un nouvel outil créatif, ou pas. J'ai testé le text to image de Midjourney, plutot bluffant, mais qui semble toujours teinté d'un certain style reconnaissable. Ce qui m'a surtout intéressé et que je vais vous partager ici, c'est le module image to image, dans stable diffusion. Cela m'a permis de voir naître des variations à partir de mes photos :


L'image de base pour les essais, est une photo assemblée à partir de 60 images verticales pour un rendu final de 220 Mega pixels. C'est la "corne de Chamois" à Sixt Fer à Cheval , massif du Haut-Giffre, France. Dans une image déjà bien dramatique.



Attention ici il y a déjà eu de nombreuses heures de recherches et de tâtonnement pour arriver à ces résultats. L'intention de base est une variation de mon image dans une version plus proche de la peinture, inspirée par des peintres comme Albert Bierstadt, David Caspar Friedrich ou encore Alexandre Calame. Les images sont générées avec Stable diffusion en local sur ma machine, depuis l'installation A1111 WebUI qui nécessite une machine puissante pour sortir des résultats à la hauteur. J'ai généré des scripts pour avoir un panel de propositions à partir d'un prompt, et de nombreuses variables à pouvoir modifier comme le sampling method, le seed aléatoire ou bien conservé, le sampling steps, le CFG Scale et le très important denoising strenght qui permet par exemple de conserver plus ou moins de rapport avec l'image originale. Le prompt (la phrase sur laquelle il va s'appuyer pour générer la variation) est ici : A powerfull and ethereal mountain with dark mood, waterfall, a painting by albert bierstadt, alexandre calame and david caspar friedrich. highly detailed scenery. Il y a également l'apport d'un negative prompt, le tout avec un Denoising strenght encore bien proche de l'image originale ( 0.2 ). Les images intéressantes sont ensuite Upscalées (une taille augmentée car les tailles de bases sont très petites et ça reste un des principales défauts actuellement, le manque de définition et de détail sur l'image finale, rien à voir avec mon image référente qui à une résolution énorme dans laquelle on peut se perdre). Ayant toujours été fasciné par ces peintres et n'ayant pas les aptitudes pour le peindre moi même, j'ai trouvé intéressant (voir un peu addictif) de générer ces images. Bien sur je peux comprendre également le coté agaçant ou provoquant que de réussir ces rendus avec du "bricolage" informatique plutôt que l'aptitude initiale de savoir peindre. Il n'en reste pas moins qu'il faut "choisir" et donc définir quels résultats seront beaux et prenant, donc les décisions de recul sur la beauté restent également présentes et peuvent s'inclure dans le débat.


Ici le denoising strenght est plus elevé ( autour de 0.7 ) avec des variations de Seed. J'ai été impressionné de voir la densité et la puissances de ces images même si il y a parfois des choses bizarres ou incohérentes qui se présentent.



tre-cime-di-lavadero-blanc
Un autre exemple intéressant et très différent avec les Tre cime di Lavadero Dolomites - Italie - 2018


J'ai adoré l'aspect pastel et crayonné plus doux que l'intelligence artificielle m'a générée. Celle du centre montre davantage de détails qui se calent sur le prompt où j'ai cette fois-ci inclus le style de William Turner, qui m'inspire également beaucoup. J'ai aussi parlé du "Chateau dans le ciel" faisant écho à Myazaki. Le Denoising est de 0.288






Pour conclure, je ne sais pas exactement quoi faire ni penser de ces images générées par I.A, ça ne changera pas grand chose au fait que je préfère aller dehors pour capturer une certaine réalité et raconter l'histoire des images. Cela dit j'ai trouvé l'expérience intéressante et enrichissante, prometteuse peut être mais aussi inquiétante dans un certain sens. à voir ce que l'avenir nous réserve et comment continuer à pouvoir s'exprimer et se différencier dans son processus créatif.

Merci de m'avoir lu !