Spieglein, Spieglein an der Wand, wer ist der beste KI-Bildgenerator im Land? Diese Frage ist gar nicht so einfach zu beantworten. Wir haben in den letzten Wochen eine wahre Flut von neuen Modellen gesehen. Flux, Mystic, Phoenix, wie sie alle heißen. Ich habe eine unheilige Menge an Geld ausgegeben, um alle diese Pro-Version zu testen, damit ihr das nicht machen müsst. Und ich stelle euch die Ergebnisse in diesem Video vor. Let's go! dieses video ist bewusst gerichtet an einsteiger fortgeschrittene und vielleicht auch profis die einfach online tools benutzen wollen um bilder zu generieren und hier vor der frage stehen was ist eigentlich das beste modell für mich und mein anwendungsfall aber dieses video wird glaube ich lang länger am längsten sein und deshalb ist es wichtig dass wir ein bisschen die spielregeln dieses Videos besprechen und ich euch erkläre, wie ihr hier am besten durchnavigiert. Am allerwichtigsten in der Videobeschreibung findet ihr die Timestamps zu den unterschiedlichen Kapiteln. Ich werde alle Tools nacheinander durchsprechen und euch so die Vorteile und Nachteile der User Interfaces erklären. Und am Ende dieses Videos werde ich nochmal ein Ranking machen, welches Tool mir persönlich für welchen Einsatzzweck am besten gefällt. und ich werde euch alle Ergebnisse und Bilder, die ich hier generiert habe, in einem Figma-Board zur Verfügung stellen, damit ihr es euch auch persönlich angucken könnt. Außerdem findet ihr Links zu jedem der getesteten Tools natürlich auch in der Videodescription. Ganz in der Nähe der Videobeschreibung findet ihr auch den Like und Subscribe-Button. Klickt die bitte auch beide. Jetzt geht es aber wirklich los. Mit Journey nach wie vor der König bzw. die Königin der KI-Bildbearbeitungsprogramme, Besonders seitdem wir in den letzten Wochen den Rollout von dem neuen Webinterface gesehen haben. Jetzt müssen wir nicht mehr in den Discord-Server gehen und dort in Privatnachrichten Bilder hin und her generieren. Das ist das beste und aufgeräumteste Interface, das wir haben. Das lädt vor allem wirklich dazu ein, Kreativität frei fließen zu lassen. Es beginnt mit What will you imagine? Und das lädt uns eben ein, freitextmäßig reinzugehen und zu sagen, was will ich erzeugen. Es gibt ein paar Einstellungsmöglichkeiten, die jetzt schon mal die User Experience einsteigerfreundlicher machen, als das vorher war. Im Discord-Server gab es wirklich gar keine Prompting-Guidelines oder Anleitungen, Settings, die man einstellen konnte, um sein Bild zu erstellen. Und auf eine Einstellung möchte ich euch hier einmal hinweisen. Das ist die Stylization-Einstellung, die wir hier sehen. Die ist super, super, super wichtig, um fotorealistische Inhalte zu erstellen. Das kann Midjourney nämlich auch, aber nur wenn ihr das wirklich irgendwo zwischen 500 und 1000 einstellt, dann bekommt ihr fotorealistische Ergebnisse. Ansonsten bewegt sich Midjourney eher so im künstlerischen Bereich. Das ist aber auch der Nachteil, den ich an Midjourney sehe. Die Plattform ist super, um der Kreativität freien Lauf zu lassen, einfach mal verschiedene Bilder zu prompten. Aber wenn ich ein Newbie bin und keine Ahnung von den Settings habe, kommen dabei auch ziemlich wirre Sachen raus. Es geht in alle möglichen Richtungen. Aber das ist natürlich auch der Stil und die Freiheit, die wir von Midjourney gewohnt sind. Deswegen weiß ich gar nicht, ob das was ist, was wir kritisieren dürfen. Das sind so ein paar Bilder, die ich mit Midjourney generiert habe. Fotorealistisches Bild eines älteren römischen Kriegers mit grauen Haaren vor dem Kolosseum. Die Prompts findet ihr natürlich später auch im Figma-File. Dann könnt ihr die Bilder auch selber nachstellen. Mir gefällt das sehr gut. Ich gucke jetzt hier einmal den Fotorealismus an. Und was wir hier sehen ist, auch Midjourney kann Fotorealismus. In den letzten Wochen haben wir ziemlich viel Hype erlebt um Flux, aber auch die anderen Modelle mit Journey und auch Sable Diffusion können Fotorealismus, das sollten wir da nicht vergessen. Und das ist ein weiteres Bild, das ich mit Journey generiert habe. Ich werde hier immer vergleichen zwischen Fotorealismus und Comic-Style. Und im Comic-Style hat mit Journey hier eher etwas generiert, was so in die Richtung Oil-Painting geht, gefällt mir persönlich aber sehr gut. Freepig ist das nächste Tool, das ich vorstelle und der ein oder andere von euch kennt das vielleicht noch als Bildquelle für Stockmaterial und so weiter. Die haben aber auch einen Image Generator integriert und da haben sie gleich zwei Modelle zur Auswahl, beziehungsweise verschiedene Modelle, aber hauptsächlich Flux und ihr eigenes neues Modell Mystic. Wenn ihr auf der Webseite freepig.com seid, könnt ihr oben auf Tools und AI Image Generator klicken und kommt dann in den Editor. Der hat den Vorteil, dass auch eine Free-Variante verfügbar ist. Das heißt, ihr könnt euch einfach anmelden mit eurer E-Mail-Adresse und das Tool einmal durchtesten. Der Nachteil ist, ihr habt nicht Zugriff dann auf alle Modelle, die verfügbar sind. Ich klicke hier einmal rein, damit ihr seht, welche das sind. Flux schnell, beziehungsweise hier heißt es Fast, Beta, ein speziell auf Realismus angepasstes Flux-Modell. Classic Fast, das ist das Legacy-Modell, also die alte Variante, die hier verfügbar war und das neue Mystic. Und im Editor sehen wir hier bei FreePick, das ist das Besondere, sehr viele Einstellungsmöglichkeiten. Also sehr gut Anfänger geeignet, nimmt uns wirklich an die Hand. Zum einen können wir hier die Größe einstellen. Wir haben aber auch eine Stilauswahl. Und was ich hier wirklich gut finde, wir kriegen direkt eine Vorschau, was dieser Stil bedeutet. Ich kann außerdem Farbeinstellungen, also Lichteinstellungen vornehmen. Ich kann Kamerasettings einstellen und auch nochmal dezidiert Lichtsettings setzen. Und dann kann ich in die Generierung einsteigen. Das hier sind die Bilder, die ich generiert habe im Comic-Style. und den finde ich bei Freepik wirklich auch hervorragend. Also das Besondere bei Freepik ist, ihr habt Zugriff auf zwei leistungsstarke Modelle, beziehungsweise sogar drei. Einmal auf Flux Dev, einmal auf Flux Fotorealismus und auf Mystic, wo ihr auch Fotorealismus abbilden könnt. Das hier ist jetzt ein Bild erzeugt mit dem Mystic-Modell, Einstellung Fotorealismus und das ist wirklich geil. Diese ganze Person, die Hände sehen für mich auch okay aus. Ich versuche einmal rein zu zoomen, entschuldigt bitte. Ja, hier am Schild gibt es vielleicht eine Kleinigkeit, wie der das Schild hält, aber ansonsten die Haare top, das Gesicht top, ist für mich auf jeden Fall ein Top-Bild. Und dann ist das Coole hier an der Seite, dass es uns als Bildgenerator zur Verfügung steht. Wir könnten jetzt hier entweder das Bild nochmal neu generieren lassen, wir können eine Bereichretusche vornehmen, wir können das Bild vergrößern und erweitern oder wir können auch ein Upscaling vornehmen. Aber die Bildqualität passt auch so. Dieses Bild hat zum Beispiel eine Auflösung von 1536 x 2688 Pixeln. Wahnsinnig groß, hoch aufgelöst, kann man wirklich so stehen lassen. Ich zeige euch zwei Bilder, die ich mit Flux Realism auf Repick erstellt habe. Der Prompt ist immer derselbe. Wir sehen hier die Flux Realism Einstellung und dann wird Style automatisch Foto gewählt. Das Modell kann gar nichts anderes und das haut auch nochmal richtig rein. Gesicht top detailliert, Haare und die Personen auch in einem super Setting, hier wieder vor dem halb eingestürzten Kolosseum im Hintergrund. Lighting ist auch super stark, wirklich eine schöne, dramatische Szene. Und der einzige Nachteil, den ich jetzt an Freepick irgendwie so auf den ersten Blick sehe, ist, dass es mir ein bisschen teuer vorkommt. Ich habe heute mein Premium-Abo abgeschlossen, habe jetzt noch 5800 Tokens left und ich habe schon das Gefühl, in Flux Realism oder halt in Mystic Fotorealistisch frisst es die Credits wirklich schnell weg. Und ein weiterer Nachteil von Freepick ist natürlich auch, dass es sich um ein Out-of-the-Box-Produkt handelt. Also ihr habt hier einen Service, da müsst ihr nicht viele Einstellungen vornehmen. Das funktioniert von alleine, aber ihr könnt natürlich zum Beispiel auch Flux im Fotorealismus nicht auf euren KI-Avatar trainieren, wie das funktioniert. Und wenn ihr daran Interesse habt, blende ich euch oben einmal einen Link zu einem anderen Video von mir ein. Da habe ich schon mal gezeigt, wie das funktioniert. Ideogram 2 ist das nächste Tool, das wir uns anschauen. Hier sehen wir schon das Interface. Ideogram 2 ist erst ein paar Wochen alt, wurde kurz nach Flux 1 gelauncht und hat denselben Schwerpunkt, dass man eben sagt, das kann sehr, sehr gut Text in Bilder integrieren. Das sehen wir hier auch schon im Beispiel. Text in Bilder zu generieren ist definitiv immer noch eine der schwierigsten Sachen, die KI-Bildgenerierungstools leisten können sollen. Ideogram 2 und Flux sind hier definitiv führend, auch wenn wir in den Beispielen, die wir dargestellt bekommen, auch immer wieder kleine Fehler finden. Da muss man einfach ein bisschen rum experimentieren und die Texte am besten nicht zu kompliziert machen. Was mir bei Ideogram 2 direkt aufgefallen ist und ich weiß nicht, ob es mir gefallen hat oder nicht, ist, dass es irgendwie so ein Hybrid ist aus Midjourney und Freepig. Und deswegen habe ich es euch auch in dieser Reihenfolge gezeigt, weil zum einen finde ich hier oben eine Bildzeile, die mich zum Eingeben meines Prompt einlädt, so wie das auch bei Midjourney ist. und wo Midjourney sagt, what will you imagine, das ist so ein bisschen fantasievoller, copy-pasted Ideogram so ein bisschen und sagt, what will you create, klicke ich auf das Promteingabefeld, öffnet sich dieses und ich finde hier Einstellungsmöglichkeiten, die ich auch von der neuen Web-Oberfläche von Midjourney kenne oder wie wir eben in Freepig gesehen haben. Wir haben ebenfalls wie in Freepig die Möglichkeit eines Magic Prompts, also einer KI-gestützten Promterstellung. Wir können die Bildgrößen einstellen. Außerdem könnt ihr ein Modell auswählen, zwar ist natürlich das Neueste und ihr könnt auch eine Color Palette auswählen. Was ich ein bisschen komisch finde, sind die Stileinstellungen, die ich hier unten vornehmen kann. Also A, warum befindet sich dieses Menü hier am unteren Rand und nicht in der Menüleiste am rechten Rand. Und B, sind mir die Einstellungsmöglichkeiten ein bisschen zu grob und undifferenziert. Zum Beispiel bedeutet Anime nur Anime oder bedeutet Anime auch Comic oder befindet sich Comic-Stil hinter Design. Das sagt mir irgendwie nicht so viel und wir sehen hier auch keine Beispiele, muss man sich dann ausprobieren. Wir schauen uns einfach mal an, was ich mit Ideogram 2 erstellt habe und da sehen wir hier zum einen den fotorealistischen Entwurf. Das finde ich auch sehr gut, also in sich eine stimmige Bildkomposition auf allen diesen Bildern, finde ich. Es erinnert mich so ein bisschen eher an so ein H&M Model. Ich weiß nicht genau, ob jetzt ältere römische Krieger tatsächlich so laissez-faire irgendwie in der Gegend rumstanden und wie ein Model in die Ferne blicken. Ich habe hier versucht, dann nochmal so einen Comic-Stil zu machen und das wurde dann eben hier der besagte Anime-Stil. Also das kann das Modell wirklich gut und ich finde auch die Szenerie für die Animes ist sehr gut getroffen. Hier finden wir jetzt nochmal Comic-Beispiele, die ich mit Ideogramm 2 erstellt habe, die sich nicht im Anime-Style befinden. Und insgesamt passen die so von Gesichtern, Händen, Proportionen, Füßen für mich. Einzig bei diesem Bild finde ich hier Fehler in den Händen, finde ich aber zu vernachlässigen. Zum einen, weil uns Ideogram 2 einfach immer vier Bilder zur Auswahl gibt. Und da muss man eben gucken, auf welchem alles passt und auf welchem Fehler sich eingeschlichen haben. Zum anderen könnte ich jetzt dieses Bild hier auch nochmal neu generieren lassen und habe hier zum Beispiel auch ein Seed. Wenn ich sage, ich will genau dieses Setting nochmal, dann lasse ich es mit dem Seed nochmal neu generieren und hoffentlich ist der Fehler dann raus. Wenn mir das Bild gefällt, habe ich auch hier die Möglichkeit, das nochmal abzuscalen und dann zu exportieren und für das zu verwenden, für das ich es verwenden will. Schaut euch diese wunderhübsche Webseite an. Die sieht wirklich einladend aus, um hier loszulegen. Und wenn ich auf Launch App klicke und mich registriere, komme ich dann auch ins Dashboard. Leonardo ist auf jeden Fall eins der professionellsten Tools, um Bilder zu generieren. Es hat eine Lernkurve, man muss sich ein bisschen reinfuchsen. Es stehen eine Menge Modelle zur Verfügung, mit denen man dann auch Bilder generieren kann. Es erinnert mich von der Komplexität, was hier möglich ist. Wirklich so ein bisschen an Stable Diffusion oder lokal installierte Flux-Modelle. Aber gleichzeitig hat Leonardo auch einfach eine gute Verpackung für den Endverbraucher. Es sieht gut aus, es fühlt sich gut an. Ich habe einfache Einstellungen, die ich vornehmen kann, aber ich habe auch das Gefühl, Da wartet noch so viel mehr auf mich, wenn ich mir die Mühe mache, in dieses Tool mich einzuarbeiten. Aber das muss man, glaube ich, auch. So ganz out of the box funktioniert es dann doch nicht, veröffentlichungsfähige Bilder zu kriegen. Das hängt aber häufig vor allem damit zusammen, welches Modell man benutzt. Wenn ich im linken Rand auf Image klicke, komme ich auch schon rein und da ist Phoenix als Preset ausgewählt. Fange ich einfach mal oben an, die Einstellung ein bisschen vorzustellen. Können wir einmal einstellen, ob wir unseren Prompt verbessern wollen. Das ist ein Feature, das haben wir jetzt schon bei Freepik gesehen, wir haben es bei Ideogram gesehen. Das ist wirklich sehr hilfreich, weil die Ergebnisse in der KI-Bildgenerierung wirklich vom Prompt abhängen. Das ist eine der schwersten Sachen, um hier gute Ergebnisse zu erzielen. Ich lasse mal einfach Automatic. Dann haben wir Styles, die wir auswählen können. Und hier bin ich schon fast überfordert, was hier alles möglich ist und wie sich das dann eben auch mit dem Modell ergänzt. Weil das Modell kann ja grundsätzlich schon mal ein paar Styles vorgeben. Und am unteren Rand haben wir dann auch nochmal Advanced Settings, die sich auf das Modell beziehen. Ich kann zum Beispiel hier bei Leonardo Phoenix keine Fotorealismus auswählen, weil sich das einfach mit dem Modell beißt. Und außerdem kann ich einstellen, hier zum Beispiel noch ein Negative Prompt einzugeben. Das kennt man ja auch von Stable Diffusion Flux oder anderen Sachen, wo man einfach nochmal sagen will, ich will keine schlechten Hände, keine schlechten Gesichter, keine Fake Eyes, kein CGI, um schon mal gewisse Dinge auszuschließen. oder ich habe einen Nudity Filter, will keine Not-Safe-for-Works-Sachen erstellt werden und so weiter. Und dann gehe ich auch schon auf die Ergebnisse ein, die ich hier mit Leonardo erzeugt habe. Das ist einmal hier die realistische Darstellung, obwohl ich jetzt das Phoenix-Modell gewählt habe. Und das heißt, fotorealistisch kann es nicht. Ich finde es insgesamt ansprechend. Wir haben so einen kleinen Bokeh-Effekt. Lighting gefällt mir gut. Aber das Gesicht ist so ein bisschen enttäuschend. Insgesamt sieht das Setting gut aus, auch wenn es natürlich erkennbar KI generiert ist. Ich glaube, es ist einfach ein Tool, das super viel kann. Wir haben super viele Einstellungsmöglichkeiten auch bei den Presets und da muss man ein bisschen Einarbeitung machen. Was für Style kann jetzt dieses Modell Phoenix gut? Was kann es schlecht? Für welchen Stil verwende ich lieber ein anderes Preset oder ein anderes Modell? Ich kann zum Beispiel hier hingehen und kann sagen, ich will Portrait Perfekt auswählen und bekomme hier nochmal ganz andere Bilder von einer anderen Qualität. Und das kann dann mit Top Stable Diffusion oder Top Flux Modellen oder sonst irgendwas wirklich mitteilen. Das ist fotorealistisch und das ist gut. Aber wenn ihr Bock habt auf ein mächtiges Tool, das euch wirklich einlädt, viele Einstellungen, verschiedene Modelle auszuprobieren, dann ist Leonardo was, was ihr euch angucken solltet. Das bedeutet aber nicht, dass Leonardo der Gewinner dieses Rankings ist. Das löse ich erst am Ende auf. Kommen wir zu Adobe Firefly. Ein Tool, wo ich noch nicht weiß, ist das Fisch, ist das Fleisch, mag ich das oder nicht. Das Gute an Firefly ist, dass es sich in die Adobe Online Suite integriert. Das heißt, da bekommt ihr für ein Abo, was um die 10 Euro kostet, Zugriff auf mehrere Tools. Da findet ihr dann auch Tools, um Online-Podcasts aufzunehmen oder eure Audioqualität zu verbessern. Oder auch einen Bildgenerator, der ziemlich stark an Canva.com erinnert. Aber dann habt ihr eben nicht ein einzelnes Canva.com Abo, sondern ein Adobe Abo für 10 Euro und habt eben Zugriff auf viele, viele, viele Funktionen. Haaa, trotzdem habe ich so eine Sache bei Adobe Firefly festgestellt. Und zwar hat es unseren römischen Krieger zu einer Omi gemacht. Das finde ich ja jetzt gar nicht schlimm und auch irgendwie sehr unterhaltsam, aber es ist einfach ein Nachteil am Tool, wenn Prompts so unpräzise umgesetzt werden. Aber alle anderen Tools hatten kein Problem damit zu interpretieren, dass der römische Krieger vermutlich männlich sein wird. Abgesehen davon habe ich Probleme mit der Bildqualität. Hier wurde jetzt Fotorealismus versucht umzusetzen, Das Kolosseum sieht total künstlich aus. Der Fußboden, der ist jetzt hier in dem Bildausschnitt nicht so wirklich erkenntlich, aber der ist total generisch. Und die Person an sich, das Gesicht ist verschwommen, die Augen passen nicht, die sehen nicht gut aus. Und bei den Händen bin ich mir auch nicht so sicher, wie viele Finger da genau dran sind. Und auch im Comic-Stil passen die Bilder nur auf den ersten Blick. Wir sehen hier das Kolosseum, das Detail, mit dem es zerstört ist, passt. Aber wenn ich dann reinklicke, sehe ich zu dieser grundlegend guten Bildkomposition und Farbgebung finde ich alles klasse. Aber das Gesicht passt nicht. Die Texturen auf der Haut sind komisch. Die Finger und Fußzähnen haben wir zu viele. Also da fällt das Tool durch. Und jetzt schauen wir uns mal Flux und Stable Diffusion an. Aber Markus, du hast doch gesagt, du gehst nicht auf lokale Installationen ein und du zeigst nur Tools, mit denen Online- und Schnellbilder generiert werden sollen. Stimmt. Und deswegen zeige ich euch jetzt die Webseite fel.ai, auf der ihr Zugriff auf Flux und Stable Diffusion Modelle bekommt, um zum Beispiel hyperrealistische KI-Bilder zu generieren. Und nochmal ein Hinweis vorab, ich gehe hier in diesem Video nicht darauf ein, wie ihr einen persönlichen KI-Avatar mit eurem Foto trainieren könnt, um euch quasi hyperrealistisch in anderen Bildern darzustellen. Dazu habe ich jetzt hier oben nochmal eine Card eingeblendet, auf der ihr zu einem anderen Video von mir auf meinem Kanal kommt, wo ich das Thema speziell behandle. Steigen wir ein. Fall.ai ist die Domain. Link findet ihr wie immer in der Videobeschreibung. Und die Webseite ist wirklich ein absoluter Tipp, um Zugriff auf alle möglichen Bildgenerierungsmodelle zu finden. Der Login ist ein bisschen schwierig. Ihr braucht zuerst einen GitHub-Account. Geht also einmal auf github.com, registriert euch für einen kostenfreien Account. Dann geht ihr auf Fall.ai, klickt auf Registrieren mit GitHub-Account, loggt euch mit dem Single Sign-On ein und schon seid ihr drin. Dauert zwei Minuten extra, hat ein paar extra Schritte mehr, macht aber gar nichts, dafür werdet ihr belohnt. Großen Vorteile von Fall.ai liegen darin, dass es wirklich sehr kostengünstig Bilder generiert. Ja, ihr habt hier keine Free-Variante, aber ihr bekommt wirklich Zugriff auf absolute Profi-Modelle mit Profi-Einstellungsmöglichkeiten zu einem sehr, sehr schmalen Kurs. Und ihr habt kein unfaires Abo-Modell, wo ihr monatlich direkt ein Abo abschließen müsst, nur weil ihr mal 10 Bilder generieren wollt, sondern ihr ladet 5 Euro, 10 Euro hoch und generiert dann Bilder, so wie ihr das wollt. Und das Guthaben bleibt erhalten und verfällt auch nicht am Ende des Monats. Wirklich faires Konzept. Und auf der Homepage sehen wir dann eben auch die ganzen Modelle. Ich scrolle da einmal runter. Da sehen wir, dass wir hier zum Beispiel auch auf den Modell Zugriff haben namens AuraFlow. LoraFlow, wir sehen Flux 1, die Developer-Variante. Wir haben auch Flux 1 schnell. Wir sehen sogar so ein Flux Realism Lora-Modell. Das ist sicher was Ähnliches, wie wir es bei Freepick gesehen haben mit dem Realismus-Modell. Das heißt hier schon einmal eine Weiterentwicklung von Flux. Flux ist ja genauso wie Stable Diffusion ein Open Source-Modell. Das heißt, die können genommen werden und auf der Basis kann man dann die Modelle nochmal verfeinern für gewisse Anwendungsfälle. und auch natürlich, wenn ich hier weiter runtergehe, sehen wir hier Stable Diffusion Version 3, wir sehen Stable Diffusion XL, Stable Diffusion with Lora und so sieht das dann aus, wenn wir zum Beispiel mit Flux einstaff Bilder generieren. Wir haben hier eine Eingabemaske, die erinnert eben mehr an Automatic 1111, mit dem man zum Beispiel bei Stable Diffusion dann lokal auf seinem Rechner Bilder generieren kann. Prinzipiell ganz einfach, hier oben kann man seinen Prompt eingeben und das reicht auch schon. Die restlichen Settings könnt ihr einfach auf Default lassen, habe ich hier in diesem Beispiel gemacht, um dann eben auch dieses Bild zu erzeugen. Und das kann natürlich ganz toll Fotorealismus. Dafür wurde ja auch Flux sehr gelobt, als es auf den Markt kam. Wenn ihr ein bisschen mehr spielen wollt, könnt ihr hier die CFG von 3.5 auch mal auf 6 stellen und gucken, was das mit dem Bild macht. Die Kosten halten sich, wie gesagt, in Grenzen auf dieser Seite. Your request will cost 2,5 Cent pro Megapixel, das heißt für 1 Dollar kann ich 40 Bilder generieren. finde ich fair. Unterscheidet sich hier, dass die Schnellvariante weniger Credits kostet. Also für einen Dollar kann ich hier das Modell 333 mal laufen lassen. Und hier ist nochmal ein Beispiel. Hier habe ich dann auch andere Modelle angewendet. Zum Beispiel Flux Realism Lora. Das heißt, ein Modell, das schon auch mit einer Lora darauf trainiert wurde, Realismus darzustellen. Und das ist halt auch nochmal der Hammer. Ich mache das Bild mal groß. Das ist wirklich ein echter Mensch, der vor dem Kolosseum steht. Das ist jetzt nicht so wirklich künstlerisch, wie es dann vielleicht von der Komposition anders ist, aber das sieht aus wie ein echtes Foto. Und dann habe ich hier auch nochmal testweise ein paar Stable Diffusion Modelle ausprobiert. Hier ist Stable Diffusion with Lora. Da muss ich sagen, das Ergebnis ist nicht so wirklich überzeugend. Sieht auch so, wie die zwei Männer da stehen, halbwegs realistisch aus. Aber so vom Licht und von der Hauttextur und der Haartextur passt das für mich nicht, um jetzt mit dem aktuellen State of VR zu überzeugen. Aber bei Stable Diffusion ist es eben so, dass es sehr viele spezialisierte Modelle gibt und auch spezialisierte Workflows und Settings gibt, die man dann in lokalen Installationen machen kann. Das ist ein extra Thema für sich. Das Beispiel hier soll jetzt nicht zeigen, Stable Diffusion kann Fotorealismus schlechter als Flux oder andere Tools. Kann es definitiv. Auch Stable Diffusion ist heutzutage noch in der Lage, überzeugenden Fotorealismus darzustellen, der vielleicht sogar besser ist als bei Flux. Aber das kommt dann eben auf individuelle Checkpoints, Workflows und so weiter an, Thema für sich. Und hier habe ich mich einfach nochmal als Modelliser dargestellt. Das sind dann so schöne Spielereien, die man mit den Modellen machen kann, die man auf Fall.ai findet. Hier zum Beispiel OmniZero. Und deswegen wollte ich euch die Webseite Fall.ai einfach zeigen, wenn ihr so ein bisschen tiefer in die Sache einsteigen wollt und sagt, Leonardo ist mir irgendwie schon so Endkonsumenten mäßig, gibt mir nicht genug Freiheiten, dann schaut mal auf Fall.ai vorbei. Da findet ihr Entwicklermöglichkeiten mit den Modellen, die verfügbar sind. Das ist ein ganz guter Hybrid zwischen ich bin noch nicht ganz angekommen bei der lokalen Installation, weil mir das zu kompliziert ist oder weil ich die Rechenleistung nicht habe. Aber trotzdem habe ich schon mehr Sachen zur Verfügung, als ich in so einem Online-Tool habe. Krog findet ihr auf x.com. Früher Twitter hat Flux schnell per API angebunden, ist aber eher so ein bisschen ein Gimmick. Ich habe hier auch mal unseren Prompt eingeführt. Ihr seht das Ergebnis. Sieht sauber aus, sieht gut aus. Gar kein Problem, tolles Bild. Im Hintergrund sehen wir das Colosseum mit einem Bokeh-Effekt, damit uns nicht auffällt, dass hier ein paar Details fehlen oder ein bisschen unsauber sind. Die Person sieht toll aus, gut ausgeleuchtet, guter Gesichtsausdruck. Das haben wir heute im Vergleich auch schon schlechter gesehen. Hände sehen okay aus, man sieht die Finger nicht komplett, da hat sich das Tool gut gerettet. Was für ein Problem habe ich mit Krog? Das Problem bei Crock ist, dass es nur Zugriff auf Flux schnell hat und ich habe keinerlei Möglichkeiten, mit diesem Bild zu arbeiten. Ich kann es nicht größer machen von der Pixel-Auflösung, ich kann es nicht abscalen, ich kann es nicht retuschieren, ich kann es nicht verändern. Es ist einfach nur ein Bild in der Auflösung 1024x768. Das ist cool, um Flux mal einfach schnell auszuprobieren, wenn man einen Twitter Premium Account hat, was glaube ich nicht so viele von euch haben. Aber es rechtfertigt jetzt nicht, sich bei Crock anzumelden. Das nächste Tool, das ich vorstellen will, ist Playground.com, eine Webseite, bei der ich erst nicht wusste, ob es Fisch oder Fleisch ist. Ich habe ein paar Anläufe gebraucht, um mich im Playground einzuarbeiten. Die Webseite sieht aus wie eine Mischung aus Midjourney, Spreadshirt und Canva.com. Und dass hier ein guter Bildgenerator dahinter steckt, habe ich am Anfang überhaupt nicht begriffen, weil auf den ersten Blick denke ich, ich kann Produkt-Mockups machen, T-Shirts designen, Stickers erstellen und Social Media Posts. Alles ein bisschen weird, aber wir gehen mal Schritt für Schritt durch. Ich fange direkt damit an, euch eine Sache zu zeigen, die mich bei Playground direkt begeistert hat. Und das ist, dass man mit Prompt ganz einfach Bilder verändern kann. So kann ich zum Beispiel mit nur einem Prompt aus dieser Katze einen Hund machen. Es finden sich dann auf Playground noch zahlreiche Möglichkeiten, Produkt-Mockups zu erstellen. Das kommt aber häufig an Grenzen, das will ich euch nicht vorenthalten. Hier hat es für mich nicht funktioniert. Der Text wird nicht zufriedenstellend übernommen. Ich habe da noch versucht, eine Blume hinzuzufügen, um irgendwie rauszufinden, was geht. Was gut funktioniert, ist die Styles durchzuwechseln. Aber das bringt mir halt nichts, wenn ich es nicht wirklich zu einem Produkt von mir machen kann. Und der große Nachteil dieses Editors ist, dass ich hier keine Möglichkeit habe, noch manuell in dieses Bild einzugreifen und dann vielleicht einfach mal den Text zu markieren, Rechtschreibfehler zu korrigieren oder Objekte hinzuzufügen. Sondern ich kann alles nur über diesen Prompt-Editor hier machen. Aber so wirklich zuverlässig ist der nicht und große Änderungen kann der auch nicht machen. Also wenn ich zwei, drei Sachen gleichzeitig am Bild machen will, funktioniert das nicht. Hier sehen wir auch nochmal ein Beispiel, wo ich diese Tüte beschriften wollte. Und das hat auch mal gut funktioniert, als ich dem System genau gesagt habe, welche Schriftart es verwenden soll. Aber es hat auch irgendwie sehr oft einfach nicht funktioniert. Und was mir wirklich fehlt, ist jetzt für ein Branding von dieser Packung zum Beispiel, dass ich einfach ein Artwork hochladen kann. Zum Beispiel eine Textur, die dann auf die Tüte angewendet wird. Ich denke, den größten Vorteil hat man von playground.com für Produkt-Mockups. wenn man einfach ein Produkt auswählt, sich einen Style auswählt, das Bild clean generieren lässt, sich runterlädt und dann eben in Photoshop oder seinem Bildbearbeitungsprogramm der Wahl weiterarbeitet. Das hat dann für mich aber wenig mit KI-Bildgenerator zu tun, sondern ist ja einfach nur eine Datenbank von verschiedenen Produkt-Mockups. Trotzdem ist super beeindruckend, wie Templates hier verändert werden können. Ich zeige das mal nochmal an einem Beispiel der Social-Media-Templates. Wenn ich mir hier so ein Cover-Art auswähle, kann ich Apply Style auswählen und kann das hier wirklich komplett einmal auf links drehen. Das sieht super cool aus. Und wenn ich Glück habe, übernimmt es dann auch fehlerfrei mein Textprompt. Aber manchmal funktioniert es einfach nicht so zufriedenstellend. Dann habe ich hier oben das Problem, dass KI News falsch geschrieben ist und dass sich diese Texte hier doppeln und ich komme mit dem Textprompt da einfach nicht weiter. Aber Playground kann noch mehr und das war für mich komplett überraschend, als ich das Premium-Abo abgeschlossen hatte, denn dann öffnet sich ein vollständiger KI-Bildgenerator. In dem finden wir ganz schön fortgeschrittene Einstellungsmöglichkeiten, die wir auch aus anderen Umgebungen kennen. Ich kann Presets auswählen, ich kann Modelle auswählen und habe hier auch ein Stable Diffusion XL Modell oder das Playground V3 Beta. Und damit können wir Bilder generieren, so wie wir das von den anderen Editoren kennen. Ich habe hier V3 Beta angewendet und muss sagen, das Kolosseum, der Hintergrund und die Landschaft gefallen mir hier mit am besten. Auch die Tunika und der Körper ist wirklich gut getroffen, einzig beim Gesicht sehe ich hier Schwächen. Wenn du es bis hierhin geschafft hast, erstmal dickes Dankeschön und Gratulation an deine Ausdauer. Du bist ein sehr, sehr disziplinierter Mensch. Wenn du mir ein Like und Subscribe da lässt für diesen Content, den ich hier aufzeichne, würde mich das sehr freuen. Ich befinde mich aktuell in zwei Stunden purer Aufnahmezeit und werde jetzt einmal die Ergebnisse durchproduzieren und bin dann gleich wieder für dich da. A few moments later. Jetzt kommen wir endlich zu der großen Besprechung aller Bilder, die ich in diesem Test generiert habe. Anschließend werde ich außerdem alle KI-Bildgeneratoren in einem großen Ranking gegenüberstellen. Timestamps dazu findest du natürlich auch unten in der Videobeschreibung. In der Videobeschreibung findest du außerdem den Link zu dem Figma-Board, das wir hier benutzen. Figma ist ein super Tool, um Design-Elemente darzustellen. Bitte beachte, das Ganze ist kostenfrei. Du kannst das Login oder Registrieren Popup einfach ignorieren. Und das Coole an Figma ist, dass alle Bilder im Originalformat vorliegen. Das heißt, du hast die volle Größe und kannst einfach rein scrollen, um sie dir in jedem Detail anzusehen. Das Ganze machst du, indem du die Steuerungstaste gedrückt hältst und das Mausrad drehst. Das Board an sich ist relativ selbsterklärend. Auf der linken Seite finden wir die Prompts, die ich verwendet habe. Da waren einige mehr detailliert und umfangreicher. Manche waren kleiner und ich habe euch auch ein sehr schlechtes Beispiel trotzdem noch im Figma-Board drin gelassen, um euch zu zeigen, wie so eine Bildgenerierung auch fehlschlagen kann. Und in der oberen Zeile seht ihr dann die Tools, die wir getestet haben. Im Grunde haben wir heute den großen Flux-Test gemacht. Und da sieht man auch die Dominanz dieses Modells. FreePick basiert auf Flux, Fall.ai basiert auf Flux, Krog basiert auf Flux. Und die Verwandtschaft zwischen Mystic und Flux erkennt man zum Beispiel schon sehr stark im Cyberpunk-Setting, wo alle Fluxmodelle scheinbar dieselben Trainingsdaten haben und hier ähnliche Ergebnisse geliefert haben. Ich konzentriere mich jetzt wirklich auf die Besprechung der Bilder und der Bildqualität und nicht auf die Handhabung der Tools. Das habe ich ja schon in der Einzelvorstellung der Editoren gemacht und werde ich auch später nochmal im Gesamten beim Ranking vornehmen. Jetzt geht es wirklich nur darum, was für ein Ergebnis haben wir bekommen. Und die Qualität bei Midjourney ist natürlich erste Sahne. Gefällt mir insgesamt sehr gut. Das hier ist unser fotorealistischer römischer Krieger. Die Details an der Rüstung sind beeindruckend. Die Lichtsituation sowohl hier im Gesicht, im Kopfbereich, als auch auf der Rüstung und hier an der Schulter, die dann ein bisschen mehr im Schatten liegt, ist toll. Das Einzige, was ich bei Midjourney kritisieren würde, ist die Schärfe, die wir hier im Bild sehen. Die komplette Person ist von den Haarspitzen bis zum Bauchnabel im Grunde komplett scharf. Und das macht die fotorealistische Illusion dann wieder ein bisschen schwieriger, weil es einfach unglaubwürdig gut aussieht für unser Auge. trotzdem natürlich ein sehr sehr gutes bild und wenn man den stil markt passt das auch der comic stil unseres römischen kriegers gefällt mir bei mit journey sehr gut wir haben ein dramatisches bild setup die perspektive so ein unterschuss sehr sehr toll und dann haben wir hier unsere person auch bei der comic version gefällt mir mit journey sehr gut hat hier einen sehr eigenen stil generiert dramatischer bildaufbau hier von unser römer wirklich tolle details aus licht und schatten jetzt kommen wir zu bildern die habt ihr so noch nicht gesehen da kennt ihr auch nicht den prompt deswegen stelle ich den einmal kurz vor und zwar ist der prompt dass wir ein fotorealistisches bild ein close up eines geschäftsmanns im 40 jährigen alter haben wollen der einen anzug trägt im büro steht und einen sonnenuntergang durch eine glas fassade sehen das ist ein ganz typisches manager bild wenn man leute in einer office umgebung fotografiert dass man die einfach vor die glas fassade stellt dann am besten irgendwie so eine dramatische licht situation hat das ganze ist hier sehr gut umgesetzt es gibt hier sogar noch so ein kleines element was quasi so ein fensterrahmen ist was das hier so ein bisschen bricht aber wir haben eben diese starke gegenlicht situation das licht ist auch hier am gesichtsrand wieder gut umgesetzt und auch hier hinten wo so eine kleine silhouette am ohr entsteht auch hier sehen wir sehr detaillierte gesichtstexturen das ist natürlich die typische schärfe die wir auch im ersten bild bei mit journey gesehen haben und so schon fast ein bisschen zu perfekt sind aber die augen sind hier auch gut getroffen also das bild ist richtig stark im nächsten bild haben wir versucht ein landschaftsfoto zu generieren auch hier zeige ich euch zuerst einmal den prompt wir wollten eine dramatische küstenlinie sehen im sonnenaufgang ein felsigen strand stege türkisfarben das meer und eine berginsel und dann schauen wir mal wie mit journey das umgesetzt hat also wir sehen den sonnenaufgang wir sind den felsigen strand wir sehen hier hinten eine berginsel wenn man so sagen kann das ist nicht wirklich als insel erkennbar hier ob es hier aufhört oder angeschlossen ist aber das heißt mal drum wenn ich dieses ergebnis auf einer foto plattform wie 500px oder flicker sehen würde wüsste ich nicht ob es ein echtes bild ist oder nicht als nächstes wollte ich testen wie die bildgeneratoren mit der texterstellung klar kommen und das hat erst mal gar nicht funktioniert liegt aber nicht an den generatoren die eigentlich fast alle diesen test bestehen würden sondern an meinem schlechten prompt ich habe euch den als negativ beispiel trotzdem in diesem video drin gelassen Zum einen, um Transparenz zu zeigen, dass auch ich nicht perfekt bin, aber auch, um zu zeigen, hey, ihr müsst vielleicht ein bisschen rumoptimieren und euer Prompt ist ganz, ganz, ganz wichtig, ob die Generatoren auch das umsetzen können, was ihr wollt. Kommen wir uns diesen Prompt mal an. Ich habe ihn hier markiert als schlechter Prompt. Ein Tisch von oben mit einem Notizbuch, auf dem AI Strategy steht. Außerdem ein Laptop, Post-its und eine Kaffeetasse mit I love AI. Das Problem an diesem Prompt ist, dass zu viele Texterstellungen drin sind. Das ist so ein typisches Stockfoto, das man so kennt von Blogs, von Influencern und so weiter. Wir sehen hier oben einen Laptop, der ist sehr gut gelungen. Die Tasten hier sind gut. Hier auf dem Notizbuch steht dann AII und hier gibt es so ein paar Fragmente, die darauf andeuten, dass man irgendwie so ein Herz darstellen wollte. Das ist das große Problem an dem Prompt, es sind zwei Textgenerierungen drin gewesen. Ansonsten ist das Bild eigentlich sehr gut. Wir haben hier noch Hände von einer Person bekommen. An den Fingern sehen wir hier die Fingernägel passen nicht, die Fingerkuppen sind schwierig geworden. Der Prompt war zu kompliziert. Ich habe deshalb nochmal einen anderen Bildprompt gemacht, der simpler war. Und zwar lautet der Neon Billboard in a City with a Text No Code Reviews, das heißt eine Leuchtreklame in einer Stadt mit No Code Reviews. Auch der Textprompt ist eigentlich nicht so einfach, weil ich nicht nur ein Wort sehen wollte, sondern zwei. Aber das haben dann eben auch alle, fast alle Bildgeneratoren gut geschafft. Hier am Ende passt vielleicht so ein kleines Positionierungsthema des Textes nicht, dass er nicht ganz mittig ist. Aber auch mit Journey kann Text Perspektive passt. Und als letztes habe ich alle Bildgeneratoren noch gefragt, mir einen Cyberpunk-Ritter zu erstellen mit Neonschwertern und futuristischen Wolkenkratzern. Und da sind wir in der großen Stärke von Midjourney meiner Meinung nach. Immer wenn es so ein bisschen artistischer, künstlerischer wird, cineastischer, kommt hier wirklich ein brutal guter Stil raus, der auch sehr eigenständig ist. Ich finde es von den Texturen toll. Hier gibt es noch so ein bisschen Regenelemente, sieht das aus, als ob das hier so wegsprenkelt. aber auch das Licht setzt sich dann hier fort. Das Schwert ist in denselben Texturen drin. Toll, Lighting-Situation, das Lichtschwert strahlt quasi auch auf unseren Ritter drauf. Den Cyberpunk-Ritter so darzustellen, ist auch wieder sehr eigenständig. Der trägt hier ja quasi nur so einen Trenchcoat und so einen futuristischen Helm. Alle anderen Modelle haben das ein bisschen wörtlicher umgesetzt, indem sie uns dann wirklich einen Ritter mit Rüstung gemacht haben. Kommen wir zu FreePick. Ein Bildgenerator, der uns mehrere Modelle zur Auswahl lässt, von Flux schnell über Flux 1 bis hin zu einem auf Realismus trainierten Flux Modell und auch dem neuen eigenständigen Mystic Modell, das auch auf Flux basiert. Deswegen bespreche ich es hier auch zusammen. Wir haben einmal unser fotorealistisches Setting, einmal hier mit Flux auf der linken Seite und rechts mit Mystic. Und hier sehen wir den Unterschied zu Mid-Journey, den ich eben angesprochen habe. Diese Bilder sehen realistischer aus, weil sie nicht so überschärft, nicht so perfekt sind. Die Person steht eher ein bisschen im Schatten. Wir haben auch hier eine seitliche Beleuchtung und dann säuft das Gesicht schon so fast ein bisschen ab. Insgesamt sehen die Texturen auch super gut aus, aber sind eben nicht so überschärft. Was mir hier gut gefällt, die Textur im Gesicht. Der Prompt hat ja auch gesagt, dass die Person ein bisschen verlebt aussehen soll im Gesicht. Das heißt, wir haben hier ein bisschen, sehen das schon deutlich und auch die Mimik dieses älteren Kriegers gefällt mir gut. Hier bei Mystic Guter habe ich jetzt ein nicht so exemplarisches Bild gewählt, weil uns die Person abgewandt steht. Aber auch hier toll, die guckt aufs Kolosseum. Wir haben ein ganz starkes Bildsetting, aber was mir hier sehr, sehr gut gefällt, ist wirklich der Realismus. Das würde als Foto durchgehen und das ist das Krasse an Mystic. Es ist nochmal ein Ticken realistischer als schon das Flux-Modell, das bewusst auf Realismus gedreht ist. Mystic haut hier wirklich in der Bildqualität, in der Realismusqualität nochmal einen raus. Das Problem an Mystic ist, es ist auch teurer, es kostet irgendwie vier, fünfmal mehr Credits als Flux Real. Darauf muss man sich dann eben einstellen, wenn man diese nochmal ticken bessere Qualität will. aber Mystic ist auch erst in einer Alpha, das heißt das Modell wird dann in der Regel noch mal günstiger. Beim Comic-Stil sehen wir dann richtig die Verwandtschaft dieser beiden Modelle. Kann man aber nicht meckern, gefällt mir in beiden Situationen richtig gut. Hier auf der linken Seite beim Flux-Modell das Colosseum ein bisschen mehr blurry. Die Augen kann man hier so ein bisschen kritisieren, die saufen ein bisschen ab, aber auf der anderen Seite bei der Bildgröße ist das vielleicht auch einfach so, dass wir diese Details nicht erkennen sollen, damit es ein bisschen natürlicher aussieht. Und hier beim Mystic-Modell ist der Hintergrund ein bisschen schärfer und die Person ein bisschen krasser ausgeleuchtet. Hier hatte ich ehrlich gesagt auf den ersten Blick Probleme zu unterscheiden, ob Mystic überhaupt den Comic-Stil kann. Das sieht man hier schon deutlicher. Die Person hat eine Outline bekommen, also so einen schwarzen Rand und dadurch eher als Comic-Figur ersichtlich als das hier. Dann haben wir unsere Geschäftsleute generiert. Beide Ergebnisse auch sehr gut. Mystic hat hier wieder bei der Person wirklich abgeliefert und einen draufgesetzt. Das sieht wirklich hyperrealistisch aus und die Bildqualität ist einfach echt abgefahren. Was mir hier auch sehr gut gefällt, das sieht einfach insgesamt sehr realistisch aus und als ob es ein echtes Foto ist, weil es nicht ganz perfekt ist und weil es auch Unterschiede hat. Wenn die beiden Schultern zum Beispiel gleichmäßig aus dem Fokus heraus wären, würde es nicht funktionieren. Aber auch der Geschäftsmann von unserem Flux Realismus Modell auf Freepic gefällt mir sehr gut. die Haare gut geworden, der Anzug. Auch hier die Schultern, unterschiedlicher Fokusbereich. Die Person sitzt ja auch deutlich seitlich. Das heißt, es muss so sein, dass die Schärfe hier auf dem Gesicht sitzt und auf der Schulter und die Schulter schon ein bisschen Autofokus ist. Auch hier die Glasfassade mit dem Fensterrahmen wurde gut umgesetzt. An den Händen und Fingerkuppen sehen wir hier kleine Fehler. Das heißt, da müsste man nochmal reingehen und nacharbeiten. Das sieht jetzt nicht so perfekt aus, fällt aber auf den ersten Blick auch nicht so wirklich auf. Außerdem noch ein bisschen verbesserungswürdig ist, sind die Augen, die saufen so ein bisschen ab, würde man sagen. Das heißt, die sind nicht so gut ausgeleuchtet. Das könnte man fast akzeptieren, weil es kann halt einfach ein Fotografiefehler sein. Bei der Landschaftsfotografie haben beide Modelle auch einfach abgeliefert. Kann man nicht anders sagen. Geht ein bisschen mehr in den Bereich Langzeitbelichtung, vor allem hier bei dem Mystic-Modell. Hier, was sehr gut umgesetzt wurde, ist die Sonnenaufgangssituation und trotzdem türkises Wasser zu haben. Das hat bei Midjourney ja zum Beispiel nicht funktioniert. Und insgesamt ist der Detailgrad bei beiden Modellen auch höher als Midjourney, also für Landschaftsfotografie. Bei meinem Negativbeispiel für den schlechten Textprompt haben beide Modelle ihr Bestes gegeben. Flux kann Schrift, das wissen wir. Beide Modelle haben AI-Strategy irgendwie versucht zu schreiben. Und Mystic hat sogar noch versucht, die Tasse umzusetzen. Und bei den Tasten des Laptops sehen wir etwas, was wir ganz häufig sehen. Dass die dann irgendwie nicht ordentlich umgesetzt werden, ist schwierig. Dafür konnten beide unsere Billboards umsetzen. Hier muss ich aber sagen, das ist so ein bisschen unrealistisch geworden. Das steht mitten in der Fußgängerzone irgendwie auf Kopfhöhe herum. Hier bei Mystic ist es noch ein bisschen besser gelaufen, dass das Billboard wenigstens irgendwie über den Leuten hängt. Aber auch hier ist es eigentlich nicht so realistisch, dass ein riesiges Billboard an so einer Straßenlaterne hängt. Schwächen im Setting, aber der Text wurde gut umgesetzt. alle flugs basierende modelle haben diesen cyberpunk ritter ähnlich umgesetzt er trägt einen umhang eine komplette rüstung und wird von hinten seitlich in so einem schulter schuss dargestellt was einem dann persönlich besser gefällt ist geschmackssache und das ist auch etwas was man mit dem prompt noch ändern kann was mir hier auffällt beim flugs realismus modell ich habe eventuell zu viele schwerter bei mystic haben wir das problem das hat immer versucht in diese billboards dieser futuristischen stadt textelemente reinzubringen und dann sehen wir hier dass das andere schriftzeichen sind als hier was wieder die glaubwürdigkeit am bild ein bisschen verringert kommen wir zu ideogramm 2 ideogramm 2 hat mit den eigenständigsten bildstil aller editoren geliefert wir sehen hier unser h&m model das als alter römischer krieger vor dem kolosseum steht das problem ist einfach hier für mich die körperhaltung und auch der haarschnitt das ist kein authentischer historischer krieger trotzdem insgesamt ein realistisches bild also das ist eine echte person die hier steht und wir sehen keine fehler an den händen fingern oder füßen die augen saufen so ein bisschen ab aber das ist realistisch aber hier gibt es auch so ein kleines problem mit der pfille mit der richtung dennoch super eigenständiges bild super realistisches foto das war gewünscht und ist erfolgreich beim comic auch hier ein eigenständiger stil keine bildfehler gesicht ist so ein bisschen undeutlich würde ich sagen also in dem stil sieht das jetzt einfach so ein bisschen leer aus aber das kann auch einfach am zeichen stil liegen und auch beim geschäftsmann hat ideogramm einen eigenen bildstil gewählt es hat die person nicht nur vor eine glas fassade gestellt sondern auch noch hinterher fand ich überraschend clever das ist ein setting das habe ich so auch schon den auftrag gegeben und auch schon selber umgesetzt macht man auch ganz häufig bei fotos von leuten in einer büro umgebung dass man die hinter so eine glasscheibe stellt und dann so ein bisschen reflektion noch davor hat das ist glaube ich für eine kai gar nicht so einfach umzusetzen dass man dann eben auch noch reflektion vor dem gesicht hat die details der haare toll war bad realistisch hier dass nicht jedes haar dieselbe länge hat passt sehr sehr gut die krawatte top anzug also sehr gutes bild sehr eigenständiger stil und auch bei Bei der Landschaftsfotografie hat Ideogram 2 abgeliefert, muss man sagen. Das hier ist ein Foto, das würde für mich auch als Realismus durchgehen. Es hat hier ein paar Sachen besser gemacht und ein paar Sachen schlechter gemacht als andere. Das betrifft zum einen die Bildkomposition. Ideogram 2 hat sich hier im Gegensatz zu allen anderen dafür entschieden, die Berginsel, die im Prompt gesteckt hat, quasi in die Bildkomposition zentral reinzurücken und nicht den Sonnenaufgang, was ein Landschaftsfotograf üblicherweise machen würde. Wir sehen hier also unsere bergige Küstenlinie und diesen Mountain in der Komposition sehr deutlich. Und Ideogram 2 hat als einziges Tool versucht, hier den Steg, der auch im Prompt war, noch mit abzubilden. Alle anderen haben den einfach ignoriert. Deswegen geht durch und auch hier auf einer Fotografieplattform wäre das für mich ein echtes Foto. Beim Text Prompt, und zwar selbst beim schlechten Text Prompt, hat Ideogram einfach abgeliefert. Es ist das einzige Tool, das AI-Strategy auf das Notizbuch schreiben konnte und I Love AI auf die Kaffeetasse bzw. hier den Kaffeebecher und auch der Laptop sieht toll aus. Und das ist die ganz, ganz, ganz große Stärke von Ideogram 2, Text. Und auch bei unserer Neon-Reklame hat Ideogram 2 gepunktet. No-Code-Reviews wurde ordentlich als Text hingeschrieben. Einziger Kritikpunkt ist generell so ein bisschen das Setting des Bildes, ist für mich jetzt nicht der Stil, den ich persönlich wollte. und es gibt immer mal wieder anderen Text im Bild, wie hier oben links oder hier bei den Läden im Eingang. Hier steht nochmal No-Code, der reingebracht wurde in das Bild und dann so ein bisschen die Wirkung zerstört. Das ist aber einfach was, wo man bei Ideogram 2 einfach ein bisschen mehr prompten muss und ein bisschen mehr Bilder generieren muss, um sich hier dann das Beste und Passendste rauszusuchen. Und beim Cyberpunk-Ritter fiel es mir ehrlich gesagt sehr schwer, bei Ideogram 2 ein gutes Bild rauszubekommen. Der Stil gefällt mir einfach nicht von den Farben, von den Texturen und ich hatte auch so mal ein Problem mit der Anzahl der Schwerter. Kommen wir zu Leonardo AI. Auch ein Bildgenerator, der richtig abgeliefert hat, im Realismusbereich, aber auch in allen anderen Stilen. Wichtig ist hier aber immer, dass man das passende Modell zum passenden Stil und dem passenden Prompt auswählt. Es braucht also ein bisschen Einarbeitung. Im Realismusbereich gefällt es mir hier ganz gut. Die Person an sich mit der Rüstung sieht gut aus, die Augen sind eventuell ein bisschen dunkel. Die Person sieht aber so ein bisschen reingeschnitten aus, bzw. der Hintergrund sieht künstlich eingebunden aus und hat jetzt nicht so den natürlichen Blur-Effekt. Insgesamt ein gutes Ergebnis, aber ich würde es eher schlechter bewerten als das, was wir von Flux oder Mystic gesehen haben. Im Comic-Stil habe ich hier ein anime-orientiertes Modell ausgewählt. Gefällt mir insgesamt sehr gut. Und was dieses Modell gemacht hat, ist, dass es hier immer noch so Partikel in der Luft erzeugt hat, von denen ich nicht weiß, was es halten soll. Und ich weiß jetzt beim Comic-Stil auch nicht, wie flexibel das Modell wirklich ist. Richtig abgeliefert hat Leonardo AI auch beim Porträt unseres Geschäftsmanns. Das hier könnte aus einer Vielmann-Werbung stammen und ein hochbezahlter Fotoshoot von einem professionellen Fotografen für eine TV-Werbung sein, ehrlich gesagt. Wir haben hier wieder unser Wolkenkratzer-Setup mit Fensterrahmen gut umgesetzt und der Gegenlichtsituation. Und wir haben die seitliche Beleuchtung dieser Person. Die rechte Seite ist dann im Schatten. Das heißt hier auch ein gutes, interessantes Lichtsetting. Das haben wir aber auch bei den anderen gesehen. In der Brille sehr realistisch, dass das linke Glas von uns aus gesehen links keine Reflexion hat. Das rechte hat eine leichte Reflexion. Die Hauttexturen passen. Und was ich hier jetzt mal im Vergleich zum Mid-Journey am Realismus viel, viel glaubwürdiger finde, auch das Gesicht liegt nicht gleichmäßig in der Schärfe. Das heißt, die Person steht ja leicht seitlich und wir haben im Prinzip Fokus und Schärfe auf diesem Auge, auf dem von uns aus rechten, selbst das linke Auge, ist schon ein bisschen unscharf. Hier oben die Stirn, hier sehen wir den Unschärfebereich und die Schärfe liegt im Prinzip wirklich hier auf diesem Fleck. Und auch das rechte Ohr ist bereits wieder aus der Schärfe raus und das führt dazu, dass wir eben einen sehr natürlichen Eindruck haben, dass das hier ein echtes Foto ist. Auch bei der Landschaftsfotografie hat Leonardo komplett überzeugt. Wir sehen hier so ein paar Stilelemente, die aus der typischen Landschaftsfotografie stammen. Zum einen haben wir eine langsamere Verschlusszeit. Das führt dazu, dass wir den Effekt haben, dass das Wasser ein bisschen geglättet aussieht. Wir haben wieder den Blenden-Effekt mit einer sehr kleinen Blende zu fotografieren, sodass wir den Stern in der Sonne bekommen. Den Steg hat Leonardo wie die meisten Tools auch vergessen. Dafür hat es versucht, wirklich hier den felsigen Strand darzustellen und aber auch eine Berginsel im Wasser zu positionieren hier an verschiedenen Stellen. Das wäre für mich auch ein echtes Landschaftsfoto auf jeder Plattform. Auch beim Text sehr gutes Ergebnis. AI-Strategy auf dem Notizbuch, auch hier in einer Handschrift dargestellt. Auf der Tasse, I love AI, hat nicht ganz geklappt, hat fast geklappt, würde noch durchgehen. Die Post-its gut gelöst und beim Laptop sehen wir aber leider, dass es hier nicht geklappt hat und die Buchstabenfehler aufweisen. und auch bei der Neon-Reklame hat Leonardo ein gutes Ergebnis erzeugt. Der Text wurde gut dargestellt, das Setting mit der Stadt passt, einzig die Positionierung dieser Leuchtreklame in der Mitte einer Fußgängerzone ist wahrscheinlich nicht so ganz realistisch. Und beim Cyberpunk-Setting sind wir dann wieder in der großen Stärke von Leonardo. Das könnte aus einer Werbung, einem Film oder auch einem Computerspiel direkt aus dem neuen Cyberpunk-Trailer sein. Das ist für mich hier nicht unterscheidbar, ist das generiert oder ist das echt richtig gut. Kommen wir zum Bildgenerator Playground, den ich vor allem mit seinem Modell V3 getestet habe. Hier im realistischen Setup schon sehr gutes Kolosseum im Hintergrund. Wir sehen hier auch so ein bisschen von Rom und auch der Krieger passt für mich. Ich habe ein paar Bildfehler. Die Augen sind hier nicht ganz klar. Das müsste man nochmal optimieren. Bei den Händen wird es ein bisschen schwierig. Hier auf der rechten Seite würde ich auf jeden Fall nochmal eine Bereichsreparatur machen wollen. Bei den Füßen sehen wir Fehler in der Darstellung. Hier müsste man nochmal ran. Insgesamt schon ganz gut vom Setting. Der Hintergrund zum Beispiel besser als bei Leonardo, aber insgesamt kommt es nicht an die Fluxmodelle ran. Bei der Comic-Version passt es für mich nicht, kann aber auch daran liegen, dass ich nicht das richtige Modell auswähle. Auch Playground ist ein Editor, in dem man sich ein bisschen reinarbeiten muss und wissen muss, was man macht. Beim Büroangestellten, auch hier sehen wir Fehler in den Augen, das könnte man vielleicht noch reparieren. Das Setting an sich ganz gut umgesetzt, wobei die Fensterrahmen haben wir auch schon besser gesehen. Das ist hier ein bisschen wild geworden. Insgesamt aber die Texturen dieser Person nicht so gut. Und das hat zum Beispiel hier Ideogram 2 auch besser hingekriegt. Man hat auch hier versucht, diese Fensterfront umzusetzen oder eine Reflexion im Gesicht zu haben. Das überzeugt hier nicht. Bei der Landschaftsfotografie grundsätzlich gut. Man hat sich an den Prompt gehalten. Wir sehen einen Sonnenaufgang, wir sehen türkises Wasser, einen felsigen Strand und wir sehen einen Steg. Das ist das einzige Modell, das hier klar den Anweisungen gefolgt ist. Und wir sehen eine Berginsel. Und es hat sogar geschafft, die Kombination zu schaffen aus, wir wollen die Berginsel sehen und den Sonnenaufgang. Aber die Texturen gefallen mir hier nicht. Bei unserem Negativbeispiel hat es nicht geschafft, den Text umzusetzen. Und die Bildkomposition sieht auch nicht wirklich brauchbar aus. Brauchen wir eigentlich nicht drüber reden. Das einzige schöne Detail ist hier das Kaffeeherz in der Kaffeetasse. Und auch bei der Leuchtreklame irgendwie so ein Ergebnis. Der Text ist da. Ja, okay, es kann Text. Das Setting an sich könnte man noch als eigenständig betrachten. Aber dann gibt es hier so viele Fehler in der Glasfassade, diese Wolkenkratzer, was nicht passt, oder hier der Schrift hier hinten, dass man dann doch sagt, das kann man so eigentlich nicht benutzen. Und beim Cyberpunk-Ritter gefällt mir das zum einen stilistisch nicht, zum anderen hatte ich Probleme mit der Qualität, dass zu viele Schwerter oder zu viele Arme auftauchen. Und damit kommen wir auch schon zu Adobe Firefly 3, der KI-Bildgenerator, der aus unserem römischen Krieger eine römische Kriegs-Omi gemacht hat. Das ist das, was hier bei Adobe passiert ist, dass es im Prinzip bei Fotorealismus dachte, ich muss ein echtes Foto abbilden. Also es sieht realistisch aus, wie wenn ich meine Oma, verkleidet als Römerin, vors Kolosseum gestellt habe. Das Kolosseum ist realistisch. Hier unten sieht man sogar, dass Gitter die Einlassbeschränkungen machen. Die Texturen des Fußbodens, der Straße passen. Und hier hinten sehen wir eben auch moderne Touristen. Und selbst die Ausleuchtung der Person passt eigentlich. Wir haben hier eine krasse Gegenlichtsituation. Das sieht dann aus wie ein bisschen amateurhaft und zu stark im Gesicht ausgeleuchtet mit so einem Reflektor. Aber insgesamt ist das Gesicht dann eben einfach verwaschen. Es ist unscharf. Wir sehen Probleme an den Händen. Wir sehen Probleme an den Füßen. Der Comic-Stil passt eigentlich ganz gut. Ist ein schöner eigenständiger Stil. Fand ich eigentlich wieder sehr ansprechend. Beim Geschäftsmann eigentlich ein gutes Ergebnis. Insgesamt aber von der Qualität ein bisschen, würde ich mal sagen, eine Generation hinter den aktuellen Modellen, die wir sehen. Es ist einfach nicht so überzeugend wie die realistischen Ergebnisse, die wir aus Flux oder Leonardo bekommen. Es ist sehr gut. Sonnenuntergang passt, Framing, der Fensterfront passt, Augenblitzen passen, auch am Bad ist es gut, aber die Texturen des Gesichtes zu glatt, die Haare zu künstlich, die Texturen des Anzugs zu glatt und künstlich, geht heute einfach nicht mehr als Fotorealismus durch. Bei der Landschaftsfotografie ein sehr realistisches Ergebnis für einen Amateur-Landschaftsfotografen beziehungsweise für einen Touristen, der halt hingeht und mit seiner schlechten Digitalkamera ein Foto macht und dann irgendwie alles einmal auf HDR hochzieht. Aber der prompt gut umgesetzt. Wir haben türkises Wasser, wir haben Berginseln, wir haben Sonnenaufgang, wir haben Dramatik über die Wolken. Würde ich auch so als echtes Foto durchgehen lassen. Bei unserem Negativbeispiel für den Text funktioniert das Setting eigentlich ganz gut, aber wir haben hier super viele Fehler im Laptop, in den Stiften. Die Brille hat zwei Bügel, die Post-its sind miteinander verwoben. Also sehr schwierig. Auch bei unserem eigentlich Positivbeispiel für den Text, wo alle anderen Modelle es geschafft haben, Text zu erzeugen, hat Firefly versagt. Es konnte hier nicht No-Code schreiben, obwohl es Reviews schreiben konnte. Und die Positionierung dieser Leuchtreklame in der Stadt funktioniert halt auch nicht. Die Texturen hier am Boden passen nicht. Es ist mitten in der Stadt positioniert. Wir sehen keinerlei Fußgänger. und auch hier die Umgebung der Stadt ist nicht glaubwürdig und gut. Beim Cyberpunk-Ritter dann etwas didelistisch sehr merkwürdiges. Punkt. Bei Fall.ai habe ich dann wieder Flux-Modelle getestet. Zum einen Flux-Dev und Flux-Realismus. Die Ergebnisse sind gleich gut wie das, was wir von Freepig gesehen haben. Wir sehen ein sehr realistisches Foto vom Kolosseum. Hintergrund gut geblurrt, die Person absolut realistisch eingebunden, kann ein realistisches Foto sein. Das Einzige, was hier sein kann, ist, dass die Augen absaufen. Könnte man eine Bereichsreparatur machen. Es kann aber auch einfach sein, dass dieser Krieger schon halb blind ist oder eben sehr verlebt. Das kann man dann für sich entscheiden, ob man das jetzt als Realismus durchgehen lässt. Der Cartoon-Stil sieht ähnlich aus, wie wir das bei den anderen beiden Modellen schon gesehen haben, aber auch sehr, sehr, sehr gut. Der Geschäftsmann auch top realistisch. Das hier ist so ein Foto, das habe ich in meinem Leben selber schon irgendwie zigmal geschossen. Der Manager stellt sich vor die Glasfront, guckt bedeutungsschwer aus dem Fenster. Schön Gegenlicht-Situation. Richtig gut ausgeleuchtet hier, dass die Silhouette am Kopf abgebildet wird, dass dieser Bereich sehr viel dunkler ist. Und dann sehen wir noch ein paar Partikel hier auf den Scheiben, was auch nochmal einen Realismus reinbringt. Das wäre ein echtes Foto. Und auch bei der Landschaftsfotografie türkises Wasser. Wir haben eine Berginsel, die zwar technisch keine Insel ist, aber eben da reinrutscht. Wir haben einen steinigen Strand, aber noch ein bisschen Reststrand übrig. Wir haben hier einen schönen Vordergrund. Gefällt mir sehr gut. Und auch bei unserem schwierigen Beispiel mit dem Text zwei verschiedene Schrifttypen. Hier sieht man so ein kleines Fragment, was dieses Herz abbilden soll. Leider hat es dann eben dieses Herzeilauf ereinigt auf die Tasse geschafft, was auch einfach schwierig sein kann wegen der Perspektive. Wenn ich einerseits sage, ich will eine Vogelperspektive, andererseits will ich lesen können, was auf der Tasse steht, das ist schon super schwierig. Am Laptop sehen wir eben auch, nicht ganz so schlimm, wie wir es bei anderen gesehen haben, aber dass die Tasten hier nicht gut beschriftet sind. Die Post-its aber gut gelöst, insgesamt schon okay. Und bei unserer Leuchtreklame den Text gut hinbekommen. Die Reklame an sich, na, irgendwie unglaubwürdig. Passt aber von der Skalierung und das Setup von der Stadt noch okay. Und bei unserem Cyberpunk Rea sehen wir dann wieder die Trainingsdaten von Flux. Gefällt mir sehr gut. Passt so. Dann kommen wir zu Grog, der hier so ein bisschen außer Konkurrenz läuft. Werde ich dann im Ranking noch darauf eingehen. Grog hat Flux schnell eingebunden. Das heißt, wir sehen hier die ähnlichen Ergebnisse, die wir von den anderen Generatoren gesehen haben, die Flux einbinden. Aber ich zeige es deshalb, weil wir eine Qualitätsstufe niedriger sehen, weil Krog im Grunde eben nur die Schnellversion drin hat. Wir sehen hier den Römer. Das sieht eigentlich ganz gut aus, aber jetzt nicht so hyperrealistisch wie bei den anderen Modellen. Wir sehen den Cartoon-Stil. Der gefällt mir sehr gut. Wir sehen den Geschäftsmann. Für Flux schnell ist das schon richtig gut. Also auch hier die Gegenlichtsituation, die Fensterfront, den Rahmen, aber auch das Gesicht gut. die Schultern in unterschiedlichen Schärfen, die Augen gut, der Bart gut, das ist wirklich gut. Die Landschaftsfotografie auch tiptop, türkises Wasser, felsiger Strand, wir sehen die Berginsel in der Ferne und Langzeitbelichtet. Bisschen HDR, aber nicht zu schlimm, richtig gutes Ergebnis. Und beim Text hat man auch abgeliefert, AI Strategy auf dem Notizbuch und im Kaffeeschaum sehen wir I Love AI. Das ist eben die Schwierigkeit, wie beschriftet man eine Tasse, die man von oben sieht. Da läuft man halt in Probleme rein. Bei den Händen passt es aber. Keine Fehler hier. Beim Laptop mit den Buchstaben fast hingekriegt, aber dann doch nicht ganz. Insgesamt ist der Stil aber halt schon sehr Hardstock-Fotografie und Geschmackssache. Die Leuchtreklame, den Text gut hingekriegt, basiert auf Flux. Natürlich kann es Text. insgesamt aber hier der abstand der lampen über der text reklame passt nicht ganz wir sehen hier einen kleinen glitsch und das setting der wie diese leucht reklame eingebunden ist gefällt mir jetzt auch nicht so gut und beim cyberpunk ritter natürlich wieder flux am start wir sehen unseren cyberpunk ritter schulterschuss von hinten kleiner bildfehler hier eventuell mit dem zusätzlichen schwer das getragen wird aber an der schulter vorne links die schrift auf diesen reklamen ist natürlich schwierig ist aber gleichmäßig schwierig das heißt dadurch wieder so ein bisschen glaubwürdig passt aber zu grog und warum er ein bisschen außer konkurrenz läuft gleich im ranking mehr und damit kommen wir auch endlich zum großen finale diesen videos dem ranking wer hat am besten abgeschnitten wer wird der testsieger jetzt geht's endlich los so ich habe für unser großes ranking der ki bildgeneratoren eine tierlist zusammengestellt die kategorie es steht für supreme ist die beste mögliche bewertung und dann geht's absteigen von a bis d nach unten und ich werde jetzt unsere teilnehmer die hier schon im unteren rand seht in diese liste einsortieren und euch immer sagen warum kriterien sind handhabung funktionsumfang und das erzeugte ergebnis und dann fangen wir einfach mal an mit adobe firefly den ich auf die kategorie die setzte firefly ist cool wenn ihr sowieso ein adobe abo habt ihr habt dann zugriff auf die online suite ihr habt viele verschiedene tools zur verfügung um podcast zu erzeugen ihr habt eine kenber alternative das heißt ihr habt ein bild editor zur verfügung und so weiter und so fort und für zehn euro ist das auch alles fair und dann habt ihr eben auch noch firefly 3 mit dem ihr bilder erzeugen könnt das problem an dem bild generator ist der ist zwei evolutionsstufen hinten dran die ergebnisse sind einfach schwierig man kann ihn sicherlich nutzen für das ein oder andere man hat aber super viel ausschuss aber das große problem was mich wirklich ein bisschen traurig macht bei Adobe Firefly ist, mir fehlt da die KI-Magie. Mir fehlt, dass ich ein Prompt eingebe und ein Ergebnis bekomme, wo ich da sitze und ganz aufgeregt werde, wie toll das ist, wie gut das ist, entweder ganz fantasievoll oder hyperrealistisch. Es ist einfach sehr trocken und wie gesagt ein paar Generationen zurück. Unser nächster Wettbewerber ist Grog. Grog setze ich auf Platz C, beziehungsweise die Kategorie C. Krog hat Flux schnell eingebunden. Super Modell, super schnell in der Bildgenerierung, erzeugt nicht viele Fehler, kann alle möglichen Stile, kann man universal verwenden, tipptopp. Warum trotzdem auf Platz C? Krog hat das Problem, dass man keinerlei Einstellungsmöglichkeiten für den Bildgenerator hat. Das heißt, man bekommt Bilder in der Größe 1024x768. Man kann sie weder upscalen, man kann sie nicht größer machen, man kann keine Bereichsreparaturen machen. Man bekommt einfach nur dieses Bild. Und um Grog zu nutzen, braucht man ein Twitter Premium Abo. Wenn man dieses Twitter Premium Abo schon hat, würde ich Grog eigentlich ein bisschen höher bewerten. Dann könnte es auch in den B-Tier reinkommen. Aber ich glaube, dass die wenigsten von euch dieses Abo haben. Und extra dafür abzuschließen, nein. Also ist er für mich eigentlich ein guter Generator, denn auf Flux schnell basierend, was ein super Modell ist. Aber aufgrund der Paywall leider nicht zu empfehlen. Und in der Kategorie B wird es spannend, weil das hier schon wirklich gut verwendbare Tools sind, die ich auch eigentlich in der Bezahlversion sogar empfehlen kann, die aber einfach ein paar Einschränkungen oder Besonderheiten mit sich bringen, die sie nicht zu meinem persönlichen Favoriten machen. Und in der Kategorie B ordne ich zum einen einmal ein Ideogramm 2. Ideogramm 2 ist ein supermächtiger Bildgenerator, wenn es um die Erzeugung von Text geht. Ihr könnt hier wirklich Assets generieren, die viel Text haben und auch kompliziertere Texte. Und an Ideogram 2 ist toll, dass es eine kostenlose Version gibt, zwar relativ eingeschränkt mittlerweile, aber ihr könnt pro Tag einige Bilder erstellen. Das heißt, wenn ihr das einfach mal ausprobieren wollt, viel Spaß. Ideogram 2 hat aber zwei Sachen, die mich stören. Und das eine ist, dass der Stil, der erzeugt wird von diesem Generator, mir persönlich nicht gefällt. Absolut subjektiv. Sorry. Und das andere ist, dass ihr bei Ideogram 2 immer viele Bilder generieren müsst, um ein Gutes zu bekommen. Aber ansonsten, wenn ihr Designs oder Artwork oder irgendwas erstellen wollt, was viel Text beinhaltet, probiert auf jeden Fall Ideogram 2 aus. das zweite tool in der kategorie b ist playground das ich vor allem mit der version v3 ausprobiert habe bei playground.com ist es einfach so dass ihr einen super mächtigen generator zur verfügung habt der verschiedene sachen kann und es hat glaube ich definitiv eine lernkurve und bedarf ein bisschen einarbeitung ihr habt auf der einen seite den designer auf dem ihr produkt mock-ups social media templates buch cover und so weiter machen könnt und das funktioniert einerseits ganz toll weil viele verschiedene stil varianten möglich sind und die assets in diese transformiert werden können gleichzeitig hatte ich hier ein bisschen probleme dass euch eben kein richtiger editor zur verfügung steht sondern alles nur über prompt funktioniert und text nicht so wirklich gut geklappt auf der anderen seite habt ihr den create bereich wo ihr den kri bild generator zur verfügung hat der mega viele modelle angebunden hat auch stabil diffusion modelle und so weiter und eigentlich sehr viel kann aber auto für box eben nicht so gute ergebnisse erzeugt oder so eine überzeugende bedienbarkeit hat wie die anderen tools die wir betrachtet haben denke playground ist ein tool wenn man sich da richtig einarbeitet und wenn ich mich da richtig einarbeitet könnte ich vielleicht noch höher bewerten aber bei dieser betrachtung jetzt heute hat es einfach nicht für mehr gereicht wir haben jetzt noch vier tools übrig und kommen die kategorie s und a und beides sind absolute top kategorien es ist einfach nur noch ein bisschen besser noch ein tickend überzeugender und natürlich alles gute tools und alle absolut empfehlenswert der unterschied ist einfach nur bei wem habe ich jetzt in diesem test die magie gespürt und diese begeisterung die mich so von anfang an in das thema künstliche intelligenz reingezogen hat unbedingt die sachen weiterempfehlen will und sagen will hey freunde das müsst ihr unbedingt ausprobieren macht mega spaß schaut euch das mal an und ich fange mal direkt mit dem platz hier schon mit dem könig der ki bildgeneratoren mit journey und mit journey kommt bei mir in die kategorie a und das muss ich einordnen mit journey ist immer noch einer der besten kibild generatoren absolut tolles tool und jetzt mit der neuen web oberfläche wirklich auch noch mal viel komfortabler zu verwenden und viel einfacher zu verwenden mit journey hat aber meiner meinung nach einen nachteil es gibt uns am wenigsten hilfestellung in der stil auswahl was wir erzeugen können das ist der stil von mit journey what do you imagine und dann kommt es du einfach drauf los und kommt zu einem ergebnis arbeitest mit dem ergebnis weiter lässt dir Varianten davon erstellen und kommst zu einem kreativen Prozess oder Ergebnis, bei dem du vorher vielleicht gar nicht wusstest, dass du da hin willst. Bei Midjourney muss man sich dann aber eben mit Prompt Engineering, welche verschiedenen Stile, Kameraeinstellungen, atmosphärischen Settings sind möglich, auseinandersetzen. Das muss man auch bei allen anderen Editoren, keine Frage, das macht den Prozess einfacher und besser. Aber bei Midjourney ist es irgendwie Voraussetzung, dass da überhaupt dann was rauskommt. Und deswegen setze ich mit Journey auf A. Das zweite Tool im A-Tier ist für mich Fall AI. Fall AI ist ziemlich cool und sehr empfehlenswert, richtet sich aber an Entwickler, bezeichnet sich selber als Entwicklerplattform. Und darauf muss man sich eben einlassen. Deswegen ist es mit ein bisschen Einschränkung zu empfehlen, meiner Meinung nach. Und man hat hier auch so eine Mischung aus, ich habe die Profi-Modelle zur Verfügung, ich habe Stable Diffusion-Modelle, ich habe alle Flux-Modelle, ich habe angepasste Modelle wie Focus zur Verfügung, aber ich habe trotzdem nicht das Profi-Setup wie in der lokalen Installation, kann keinen Einfluss auf Workflows und so weiter nehmen und dann gibt es dann doch wieder Einschränkungen. Außerdem ist das User-Interface dann auch wieder gewöhnungsbedürftig, braucht Einarbeitung. Je nach Modell ist alles ein bisschen anders und das macht es schon nötig, hier ein bisschen rumzuprobieren. Trotzdem für jeden absolut empfehlenswert, der noch nicht dabei ist oder die Rechenleistung nicht zur Verfügung hat, dass er lokale Installationen machen will, aber sich mal angucken will, wie die Modelle denn eigentlich funktionieren. Und dann kommen wir zu den beiden großen Gewinnern dieses Tests, FreePick Picasso und Leonardo AI. Beides absolut tolle Tools, die ich uneingeschränkt empfehlen kann. FreePick sogar noch ein bisschen mehr. FreePick ist meiner Meinung nach aktuell der Geheimtipp, wenn es sich noch nicht rumgesprochen hat und mittlerweile kein Geheimtipp mehr ist. Das Tool ist deshalb so empfehlenswert, weil wir zum einen eine Free-Version haben, wo wir 20 Bilder pro Tag erstellen können mit Flux schnell. Zum anderen, weil es auch in der Paid-Version einiges bietet. Wir haben verschiedene Flux-Modelle, auch das Realismus-Modell. Wir haben mit Mystic ein auf Flux basierendes Modell, was aber nochmal eine extra Meile mehr geht bei der Bildqualität. Und wir haben auch Möglichkeiten, mit den Bildern in Anschluss weiterzuarbeiten, Bereichsretuschen zu machen, Upscaling zu machen, die Bilder nochmal zu verbessern. Und Flux bietet vor allem Anfängern auch eine gewisse Guideline durch die Menüstrukturierung, welche Stile stehen zur Verfügung, welche Lichtsituationen stehen zur Verfügung und so weiter und so fort. Und diese Einstellungsmöglichkeiten sind jetzt nicht so komplex wie bei Leonardo und nicht fürs professionelle Arbeiten gemacht, aber eben deswegen auch sehr zugänglich für Einsteiger oder auch für interessierte Fortgeschrittene, die sagen, ich will jetzt hier nicht Prompt Engineering studieren, ich möchte jetzt hier nicht auswendig lernen, was für Settings ich machen kann, ich möchte einfach ein Tool haben, das mir zeigt, was geht und dann wende ich das an. Und wer dann bereit ist, den nächsten Schritt zu machen in Richtung professionellere Anwendung, semiprofessioneller, fortgeschrittener Bereich, der kann Leonardo AI nutzen. Leonardo AI ist das Tool für ambitionierte Fortgeschrittene, die digitale Assets auf Profi-Niveau wirklich erstellen wollen. Wir können hier im Bereich Cinematic extrem viel machen und wirklich kinofähige oder fernsehwerbungsfähige Bilder erstellen. Wir haben ganz viele verschiedene Modelle zur Verfügung und auch ein Menü und eine Navigation, die uns an die Hand nimmt und bereits verschiedene Stile auswählen lässt, verschiedene Modelle auswählen lässt und Einstellungen treffen. Bei Leonardo gibt es eine gewisse Lernkurve. Wir müssen uns ein bisschen einarbeiten, weil nicht jedes Modell jeden Stil gut kann. Das ist natürlich ein bisschen Voraussetzung, dass man hier ein bisschen ausprobieren will. Es hat aber eine sehr gute Preisstruktur. Das heißt, wir können einmal Credits aufladen und dann wirklich sehr, sehr viel rumprobieren und haben immer noch genug Guthaben zur Verfügung. Man merkt es eigentlich gar nicht, dass man Credits verbraucht, auch wenn einzelne Feature uns immer angezeigt werden mit, das verbraucht jetzt 25 Credits. Und das Coole an Leonardo ist, dass es ein großes Tool ist, wo es sich wirklich lohnt, die Einarbeitungszeit zu investieren. Es gibt noch viele weiterführende Features, wie zum Beispiel konsistente Charaktererstellung oder konsistente Bildsettings zu erstellen oder Animationen zu erstellen oder noch viele experimentelle Modelle, mit denen man Sachen machen kann. Auch, dass man Live-Assets erzeugen kann oder dass man In-Paintings machen kann und so weiter. Da gibt es wirklich keine Grenze. Ganz, ganz tolles, komplexes Tool, das man sich mal anschauen sollte, wenn man darauf Bock hat. Am Ende dieses Videos interessiert mich vor allem deine Meinung. Wie hat es dir gefallen? Magst du solche langen Videos? Ist es dir zu lang? Hätte ich kompakter sein sollen? Gib mir bitte dein persönliches Feedback in den Kommentaren. Ich habe hier massiv viel Arbeitszeit reingesteckt und bin fast verzweifelt. Wenn es dir gefallen hat, lass mir auf jeden Fall ein Like und Subscribe da. Und wenn es dir nicht gefallen hat, sag mir warum. Außerdem würde mich interessieren, was dein persönlicher Favorit ist, ob du meine Erfahrung, die ich im Prompting und beim Ausprobieren der Tools gemacht habe, bestätigen kannst oder ob du eigentlich denkst, ich habe es falsch bewertet und du hast eine ganz gegensätzliche Meinung. Auch dann unbedingt in die Kommentare und lass uns darüber diskutieren. Und außerdem, ich werde zu jedem dieser KI-Tools noch einzelne Videos machen und die Funktionen genauer unter die Lupe nehmen, auch so ein bisschen ranführen, wie man sie einsetzen kann. Wenn dich das interessiert, folge auch unbedingt meinem Kanal. Vielen Dank fürs Zuschauen. Vielen Dank für dein Interesse. Ich bin Markus von NoCodeReviews. Bis bald.