Der Ara ist eine Latino und Chef in den Baumwipfeln des lateinamerikanischen Urwaldes.
Das Motiv oben ist Weltklasse und exzellenter Beweis für die These, das beste Foto macht man mit der Kamera, die man dabei hat, oder gar keines. Ich hatte eine Kamera dabei, aber das Foto ist verunglückt. Verwackelt und unscharf. Kann man ja auch sehr gut erkennen.
Da lag die Idee nahe, dieses Motiv dem Stable Diffusion zum Fraß vorzuwerfen und mal zu schauen, ob es das besser kann. Easy Diffusion und Automatic1111 mußte ihr Können beweisen und versagten bei 8 Modellen mehr oder weniger. Der Ertrag an vorführbarem Bildmaterial hält sich in Grenzen.
Kein Rechenvorgang kommt an das Original an, obwohl das als Vorlage vorgegeben wurde.
Oben links kann man erkennen, wie die AI das Bild ein Einzelteile zerlegt und systematisiert, um daraus dann phantasivoll neue Aras zu kreieren. Diesen Rechenvorgang hatte ich abgebrochen, soweit war die Rechnerei aber schon vorangeschritten.
Wenn ich mich recht entsinne, stand Rotkopf-Ara als Besschreibung der Art auf dem Erklärbären. Der ist aber ausgestorben, also muß es ein Scharlach-Ara (Scarlet Macaw) sein, denn der kommt dem Erscheinungsbild dann am nächsten.
Die besten Ergebnisse lieferte das Modell JuggernautXL_X, alle anderen sind auf Tiere nur spärlich trainiert worden.
Zum letzten Foto, ich glaube mich zu erinnern, daß es von ICBINP ("I Can't Believe It's Not Photography") gerendert wurde. Das wurde mit hühner- und eulenartigen trainiert und liefert die Aras in dieser Ausformung, also ein Ergebnis, das ich gar nicht haben wollte.
Für alle andern Modellen müßte ich erst suchen, ob es kleine Loras gibt, mit denen die Modelle auf Tierbilder umgewidmet werden können. Oder gleich ein Tiermodell suchen, das ausschließlich mit Bildmaterial aus dem Tierreich oder gar Federvieh trainiert wurde.