ein paar erste ergebnisse mit stable diffusion (die tatsächlichen eingaben waren in englisch und etwas länger)

"laptop auf ölgemälde von 1520"
das zweite bild ist cool, weil es den bildschirm des laptops als triptychon (dreiteiliges aufklappbares gemälde) darstellt.

"tier, das kreuzung aus huhn und hase ist"
der kopf ist zwar nur aus hase und der körper nur aus huhn, aber die detailtiefe gleicht das wieder aus.

"foto von lady diana in royaler badebekleidung einen royalen hut tragend reitet am strand auf einem elefanten"
da finde ich eigentlich den elefantenhut auf dem vieren bild am besten. da hat die maschinelle halluzination super funktioniert. auch interessant ist, daß der bikini in bild drei immer noch aus rauschen besteht, weil die berechnung der bilder ja immer mit reinem rauschen anfängt.

"maus mit wolf genen"
süß.

"sexy roboter in metropolis, sehr futuristische umgebung"
dabei hat mich der bladerunner artige hintergrund des vierten bildes am meisten überrascht.

"kermit der frosch macht zuhause seine steuererkärung und raucht ne zigarette"
drei dinge zusammen auf einem bild haben zu wollen, macht es schwierig. wenn eins toll ist, fehlen meist ein bis zwei andere..

"100-jähriger mann fährt achterbahn in disneyland und genießt sein leben"
hier hat das datenmodell eindeutig eine stärke.

"das kind von miss piggy und kermit dem frosch spielt mit einem ball"
die anteile von grünem frosch und rosa schwein unterschiedlich kombiniert oder komplett verschmolzen.

"schnappschuß einer kreuzung aus huhn und kaninchen in einem hellen wald"
das dritte bild finde ich fast perfekt.

"foto eines heißluftballons, der 2085 zwischen futuristischen wolkenkratzern fliegt"
die software kann also auch einfach mal so komplette städte erzeugen.

weitere beispiele