Kategorie: AI & Machine Learning

  • Teil I: „Das ist nicht KI, sondern UI, worüber ihr da redet!“ | Part I: “That’s not AI, it’s UI, what you’re talking about!”

    Teil I: „Das ist nicht KI, sondern UI, worüber ihr da redet!“ | Part I: “That’s not AI, it’s UI, what you’re talking about!”

    Text in English

    Ein Vorwort
    Was mir in Bezug auf den Umgang mit KI und Machine Learning aktuell vielerorts auffällt, ist ein wenig mit der Situation in Deutschland vergleichbar, während eines internationalen Fußballturniers: Es liegt ein wenig Aufregung in der Luft, und fast jede Person, welche sich ein wenig mit Fußball auskennt, besitzt den Anspruch, Bundestrainer zu sein. Der dabei reale Raum der Einflussnahme findet dabei meistens zwischen dem heimischen Sofa, einer Flasche Bier und dem TV-Gerät statt. Aber dort fühlt es sich so an, als wäre man selbst am Spielfeldrand, und weiß alles natürlich immer besser als die Person, die den Job wirklich macht.
    Gewinnt die Mannschaft, klopft man sich lobend auf die Schulter. Verliert die Mannschaft vor den eigenen Augen im heimischen TV-Gerät , dann hat man damit nichts zu tun. Schließlich hat man von Anfang an gesagt, dass die gewählte Taktik zum Scheitern verurteilt war. Das ist natürlich grundsätzlich völlig in Ordnung, wenn da nur eine Sache nicht wäre: International laufen gerade alle gefühlt in Sache von KI und Machine-Learning um die Wette. Aber beim überwiegenden Digitalisierungs-Low-Performer Deutschland, will man davon scheinbar nicht wirklich viel wissen. Man schaut im TV wie bei einem Fußballturnier lieber mit Abstand zu. Man redet über mögliche Taktiken, Optionen und Perspektiven, nimmt keinen Einfluss auf das reale Geschehen. Und wenn mal darüber gesprochen wird, dann verwechseln sehr viele KI mit UI und merken es nicht einmal. Das stört mich mittlerweile so sehr, dass ich diese Beitragsserie angefangen habe.

    Natürlich kann ich nicht alles hier erklären, aber selbst als Künstler der sehr intensiv zu diesen Themen auch forscht, kann ich zumindest ein paar Impulse geben. Es ist auch nicht einfach zu fassen, was aktuell alles passiert. Innerhalb von wenigen Stunden ändern und entwickeln sich stellenweise komplette Technologien neu, und dies stellenweise mehrmals an einem einzigen Tag. Entwicklungen, gerade in technologischer Hinsicht, welche bis vor einiger Zeit sich über Jahre hinweg erstreckten, finden inzwischen binnen eines Nachmittags statt. In Bezug auf Fotografie finde ich es faszinierend und gleichermaßen unheimlich, dass ich an einem Abend beispielsweise, während ich eine Kanne Tee trinke, mir einfach mal eine neue „Evolutionstheorie“ ausdenken kann. Binnen von Minuten kann ich diese fotografisch bebildern, ohne mein Sofa dabei verlassen zu müssen. Dies mit ca. 10 KI-Modellen parallel, um Bilder nach meiner Vorstellung zu erzeugen.
    Ich verstehe, dass all das, was gerade um uns geschieht, verunsichern kann, das ist mehr als verständlich. Natürlich ist es auch nahezu unmöglich, als Individuum all den neuen Entwicklungen gleichermaßen Aufmerksamkeit zu schenken. Ich würde dies gerne, aber dafür hat der Tag einfach zu wenige Stunden. Sehr komprimiert zusammengefasst formuliere ich an dieser Stelle meine erste Aussage, welche meines Erachtens grundsätzlich in Bezug auf KI verstanden werden sollte, bevor man darüber urteilt oder spricht:

    Aussage Eins: „Das ist nicht KI, sondern eine UI, worüber ihr da redet!“

    Also vorweg „UI“ ist die Abkürzung von „User Interface“. Dies bedeutet so viel wie Benutzeroberfläche, also das, womit man als Person mit einem Gerät interagiert. Bei einem Smartphone wären dies z. B. Gesten auf dem Touchscreen. Oder an einem Computer in Form von Maus und Tastatur, oder auf einer Internetseite in Form von einer grafischen Benutzeroberfläche wie Eingabemasken beispielsweise und so weiter.

    Warum ist das wichtig zu wissen?
    Ich beobachte in vielen Debatten gerade im kulturellen und künstlerischen Kontext über KI & Machine-Learning Menschen, welche ausgehend einer Eingabemaske, welche sie beispielsweise mal bei Microsoft-Copilot, Google-Gemini oder OpenAI-ChatGPT nutzten, oder Bildgeneratoren wie Midjourney, Adobe-Firefly oder DALL-E nun denken: „Das ist also KI“. Aus der Erfahrung heraus, selbst einen Text, also Prompt, in eine Eingabemaske eingegeben zu haben, und daraufhin ein Ergebnis erhalten zu haben, denken einige Personen, verstanden zu haben, worum es geht. Dies jedoch ohne dabei zu wissen: wie KI/Machine-Learning an sich funktioniert, was dort passiert, wie KI-Modelle entstehen, was KI-Modelle überhaupt sind, wie die dazugehörigen Trainingsdaten erzeugt werden und so weiter und so weiter.

    User statt Producer

    Aufbauend auf die alleinigen Erfahrungen an einer UI, schwingen dann viele selbst ernannten Expertinnen auf Bühnen, indessen Reden und debattieren aus ihrer Perspektive über KI und Zukunft. In Wahrheit sprechen sie schlussendlich aber nur über UIs, und ihrer Erfahrungen damit. Verstanden, worüber sie wirklich sprechen, also das, was hinter den Eingabemasken geschieht, tun viele leider nicht wirklich. Sie reden über das grafische Framework, das ihnen Unternehmen zur Verfügung stellen, nicht darüber, wie das Framework, und alles dahinter damit einhergehend funktioniert oder wie es aufgebaut ist.
    Was ich damit zugespitzt sagen möchte: Viele wissen nicht, worüber sie sprechen, aber in vielen Kreisen hat man sich scheinbar darauf geeinigt, dass dies State-of-the-Art nun ist! Eine kollektive Unwissenheit ist schlussendlich auch vielleicht einfacher zu legitimieren, anstatt zuzugeben, dass nur wenige Personen wirklich wissen, was sie tun oder erklären können.
    Bei unseren europäischen Nachbarländern und weit darüber hinaus stellt sich das viel innovativer dar. Aber hier in Deutschland, verwechselt man oftmals UI mit KI, und damit in meinen Worten einfach erklärt: User und Producer Ebene! Dadurch denkt der User schlussendlich, er sei der Producer, bewegt sich nur in definierten Rahmen, aber merkt es nicht mehr. Das ist in etwas so als würde man ein Malen-Nach-Zahlen-Bild ausmalen, und wäre davon überzeugt sein, frei und autonom ein Bild ohne Vorgaben zu malen!

    Daher möchte ich an dieser Stelle auf ein Video verweisen, auf welches ich in meiner Lehre gerne aufmerksam mache. Dort wird in meinen Augen hervorragend KI veranschaulicht: Link zu Youtube

    Vorschau
    So, das war jetzt relativ viel für den Anfang. Bald geht es weiter, mit dem Beweis: dass eine eigene fotografische, künstlerische sowie stilistische Bildsprache mit der Hilfe von KI möglich ist. Ich künde meine Blog-Artikel in meinem Instagram-Account auch an, falls man Interesse hat, kann man mir dort folge

    Bis bald und viele Grüße.
    Florian Albrecht-Schoeck


    A foreword
    What strikes me in many places when it comes to the topic of AI and machine learning is a bit like the situation in Germany during an international football tournament: there is a bit of hype in the air, and almost every person who knows a little about football claims to be the German national coach. The real space of influence usually happens between the sofa at home, a bottle of beer and the television. But it feels as if you are on the sidelines yourself, and of course you always know better than the person who is actually doing the job.

    If the team wins, you give yourself a pat on the shoulder in self-praise. If the team loses in front of your own eyes on your home TV, then you have nothing to do with it. You just said from the beginning that the chosen tactic was doomed to fail. Of course, that’s fine in principle, if only there wasn’t one problem: on an international level, everyone is racing to get ahead in the field of AI and machine learning. But when it comes to Germany, a digitalization low performer, it seems that people don’t really want to know much about it. Like at a football tournament on TV, they prefer to watch it from a distance. They talk about possible tactics, options and perspectives, but don’t really influence what’s happening in real life. Even when it is discussed, many people misunderstand UI for AI and don’t even realize it. This has become such a big issue for me that I have started this series of posts.

    Of course I can’t explain everything here, but even as an artist who does a lot of research on these topics, I can give at least a few impulses. It’s not easy to grasp everything that’s currently taking place either. Within a few hours, entire technologies change and develop anew in places, and this happens several times in a single day. Developments, particularly in technological terms, which used to take years to complete, now take place in the space of an afternoon.

    I understand that everything that is happening around us right now can be disconcerting; that is more than understandable. Of course, it is also almost impossible for an individual to pay attention to all of the new developments alike. I would like to, but the day just doesn’t have enough time. At this point, I would like to summarize my first statement, which I believe should be understood in principle with regard to AI before judging or talking about it:

    Statement One: “This is not AI, but a UI, what you are talking about!”

    First of all, “UI” is short for “user interface”. This means the way in which a person interacts with a device. On a smartphone, for example, gestures on the touchscreen. Or on a computer using a mouse and keyboard, or on a website in the format of a graphical user interface such as input masks, for example, and so on.

    Why is this important to know?
    In many debates about AI and machine learning, especially in a cultural and artistic context, I observe people who, based on an input mask that they used, for example, with Microsoft-Copilot, Google-Gemini or OpenAI-ChatGPT, or image generators such as Midjourney, Adobe-Firefly or DALL-E, now think: “So that’s AI”. Based on their experience of entering a text (a prompt) into an input mask and then receiving a result, some people think they understand what it is all about. What they don’t know, how AI/machine learning works, what happens there, how AI models are created, what AI models in general are, how the training data for them is generated and so on and so forth.

    User instead of producer

    Based on their own experiences at a UI, many self-proclaimed experts then take to the stage to talk and debate about AI and the future from their perspective. In reality, however, they only talk about UIs and their experiences with them. Unfortunately, not many people really understand what they are actually talking about, namely what happens behind the input masks. What they talk about is the graphical framework that the company provides for them, not how the framework and everything behind it works or how it is structured. 

    What I want to say with this is: a lot of people don’t know what they are talking about, but in many circles, it seems that they have agreed that this is the state of the art! In the end, collective ignorance is perhaps easier to legitimize than to admit that only a few people really know what they are doing, or can even explain it. 

    Our European neighbors and far beyond are much more innovative in this respect. But here in Germany, people often mistake UI for AI, and in my words, simply explained: user and producer level! As a result, the user finally thinks he is the producer, only moves around inside defined parameters, but no longer notices it. It’s a bit like coloring a paint-by-numbers picture and being convinced that you are painting a picture freely and autonomously without any guidelines! 

    At this point, I would like to refer you to a video that I like to draw attention to in my teaching. In my opinion, it illustrates AI excellently (unfortunately it is in German): Link to Youtube

    Preview
    So, that was quite a lot to start with. I’ll continue soon with the proof that a unique photographic, artistic and stylistic visual language is possible with the help of AI. I will announce my blog articles on my Instagram account, if you are interested you can follow me there.

    See you soon and best regards.

    Florian Albrecht-Schoeck

  • Eine neue Zeitrechnung – Teil I: Die Höhlenmalereien von Offenbach am Main

    Eine neue Zeitrechnung – Teil I: Die Höhlenmalereien von Offenbach am Main

    Zu diesem Projekt: Wichtige Information

    Florian Albrecht-Schoeck mit seinem treuen Hund Gizmo, als sie noch vereint waren. Bild: Privat.

    Wir beginnen mit einem der ältesten Bildnisse aus der menschlichen Vorzeit: Die erst im Jahr 1980 entdeckte „Höhlenmalerei von Offenbach am Main”. Entdeckung durch Verlust
    Entdeckt wurde dieses einzigartige historische Dokument, von Florian Albrecht-Schoeck, während er damals, an einem regnerischen Herbstnachmittag, verzweifelt von Darmstadt zu Fuß aus, seinen damalig verschollenen Beagle-Rüden Gizmo im Wald suchte. Er lief über Stunden durch Wälder und suchte seinen damaligen treuen Weggefährten. Der Hund ist bis heute verschwunden. Er ist nie wieder aufgetaucht.

    Der bis heute schmerzhafte Verlust seines vierbeinigen Freundes, wird für ewig einen schmerzhaften Fleck in seinem Herzen hinterlassen, jedoch findet der bis heute tier- und kinderlose Innenarchitekt Trost in einer Sache. Albrecht-Schoeck fand bei der Suche nach seinem Hund, die bis dato älteste bildliche Darstellung von Menschen und drachenähnlichen Wesen.

    Wiege der Menschheit

    Dieser Fund wird bis heute als der Beweis gesehen, dass unsere Geschichte neu geschrieben und gedacht werden muss. Archäologen auf der ganzen Welt bezeichnen diesen Ort bis heute als die Wiege der Menschheit. Lange vor den ersten bis heute bekannten Siedlungen oder Tempelanlagen, gab es diese Höhlen und Malereien. Dies an einem anderen Ort zwischen der heutigen Stadt Darmstadt sowie Offenbach am Main. Zudem wurden Materialproben in der Höhle entnommen, welche der Wissenschaft bis heute mehr Rätsel als Antworten liefern: auf der gesamten Welt hat man nie wieder vergleichbares Material bzw. Gestein jemals gefunden.Hinzu streitet man sich darüber, was genau auf den Höhlenzeichnungen zu sehen ist: Jagen Menschen Drachen, oder umgekehrt Drachen Menschen, oder lebten sie einst zusammen?

    Ein Blick in die Vergangenheit und die Zukunft?

    In den kommenden Wochen und Monaten werde ich meine bisherigen Funde, Dokumente, Bilder, Filme und Geschichten, also alles, was ich zusammentragen und recherchieren konnte, versuchen, zu einem Gesamtbild zusammenzusetzen. Schlussendlich sprechen wir möglicherweise über die Antwort auf die echt großen Fragen unserer Existenz.


    Wichtige Information

    Weil wir in einer echt verrückten Welt leben, zur Klarstellung: Ich bin Künstler und erzähle gerne Geschichten. Auch sind alle Bilder mit KI generiert (mit eigenen LoRa Dateien auch). Das Ganze hier ist Teil eines Kunstprojektes und natürlich eine Fiktion. 

  • Making-of: „Sleep Well 3” – mit KI und Fotografie das 20. Jahrhundert etwas neu interpretiert.

    Making-of: „Sleep Well 3” – mit KI und Fotografie das 20. Jahrhundert etwas neu interpretiert.

    Vorab schon mal ein paar Eindrücke meiner neuen Arbeit “Sleep Well III”. Aktuell arbeite ich an einem Video in englischer und deutscher Sprache, wo man sicher besser nachvollziehen kann, wie meine neue künstlerische, fotografische sowie KI-Arbeit entstanden ist. Auch sind auf dieser Seite nur Making-of-Bilder aktuell zu sehen, nicht die finale Arbeit.

    Was habe ich hier gemacht?

    Kurz gesagt könnte man sagen: Ich habe einem Sprachmodell Informationen von 1901 bis 1999 zur Verfügung gestellt. Dieses hat es in mit „eigenen Worten“ neu erzählt und in Promts umgewandelt. Diese Promts waren dann die Vorlage dafür, ca. 2000 fotografische Bilder dieses Jahrhunderts neu zu interpretieren. Aufbauend auf verschiedenen Bilder-Modellen kamen mein selbsttrainierten LoRa Modelle zum Einsatz, welche meine Person als männlich und weiblich gelesen Person darstellen können, sowie stilistische art und weisen Fotografien zu erstellen wie ich es mit einer Mittelformat-Kamera oder meinem Smartphone mache. Diese ca. 2000 Bilder habe ich dann bei einem Online-Dienstleister jeweils in den Größen von 15 cm x 10 cm auf Glanzpapier drucken lassen. Diese Bilder habe ich dann in einem Fotostudio intuitiv zu einer Art Collage ausgelegt, und nach dem Ausleuchten, wiederum mit einer „echten“ 100-Megapixel-Kamera als „ein“ Bild fotografiert. Das Ergebnis habe ich bald fertiggestellt.

    Viele neue Fragen zu KI und Fotografie

    Für mich haben sich beim Erstellen dieser Arbeit viele neue Fragen ergeben. Aber eines ist für mich ganz klar: Diese Technik wird unser Verhältnis zum Medium Fotografie, Film etc. sehr verändern. Auch die Frage, ob es sich nun hierbei um Fotografie handelt, ist auch nicht klar in ein „Ja” oder „Nein” meiner Meinung nach zu beantworten. Die Technik ersetzt kein kreatives Handeln. In meinen Augen ist es ein unfassbares Werkzeug, welches mir als Künstler einen immensen Spielraum gibt, theoretisch alles erstellen zu können, visuell wirklich alles!

  • Mein erstes über 50 Megapixel großes, KI-generiertes fotografisches Bild.

    Mein erstes über 50 Megapixel großes, KI-generiertes fotografisches Bild.

    An dieser Stelle ein spontaner kleiner, auch mal sehr technischer Einblick in meine experimentelle künstlerische aktuelle Arbeit mit KI. Nachdem ich für mich, vorerst eine Vielzahl nötiger Techniken beigebracht habe, um Bilder zu generieren, so wie ich das möchte, geht es mir nun darum, diese Bilder auch in gedruckte Formate umsetzen zu können. Es ist mir sehr wichtig, die Bilder ohne Qualitätsverluste auf Papier zu bringen und das auch in großen Formaten, wenn ich das möchte. Nach einigen Versuchen und Recherchen habe ich diese Motiv mithilfe von KI, lokal auf meinem Rechner, vorerst auf folgende Größen generiert: 12032 Pixel x 8064 Pixel

    Für mich dabei ist echt faszinierend, dass das Bild in seinem Formaten und Pixeln einer Bilddatei entspricht, welche ungefähr einer 50 Megapixel-Digitalkamera entspricht. Hinzu kommen noch all die Details in den Bildern, welche einfach nicht verpixelt sind durch das Vergrößern, sondern detailreich, korrekt und sauber dargestellt werden. Das Ganze habe ich eben mit einem gebauten Arbeitsablauf auf meinem Rechner mit KI erstellt, was ca. 45 Minuten bis zur Fertigstellung pro Bild dauert.Die entstandene Datei wäre locker verlustfrei, mit 100 cm x 70 cm und noch viel größer druckbar. Ich frage mich inzwischen, ob man in Zukunft noch leistungsfähige und klobige Kameras überhaupt darüber hinaus benötigt, wenn die Technik sich so schnell weiterentwickelt. Wir werden es sehen!

    Ansichten: Bild, Detail und ein Testdruck in ca. 60 cm x 40 cm und gerahmt:

  • Zehn von ca. 2500 KI-Bilder aus Sleep Well III

    Zehn von ca. 2500 KI-Bilder aus Sleep Well III

    Please scroll down for English

    Sleep Well III
    Ich poste hier mal spontan mal zehn ausgesuchte KI-Bilder aus meiner kommenden Arbeit “Sleep Well III”. Die zehn Bilder gehören zu einer aktuell ca. 2500 umfassenden Sammlung von Bildern, wo ein von mir erstellter Arbeitsablauf dafür sorgt, dass 100 Jahre Menschheitsgeschichte von einer KI einer anderen KI gewissermaßen erzählt wird, und die letztere dazu Bilder/Fotografien erstellt. Dargestellt wird der Zeitraum 1900 bis 1999 durch mich als Person trainierte KI-Modelle. In “Sleep Well III” geht es inhaltlich auch darum, dass es jetzt schon vollkommen normal ist, dass wir Bilder, Meinungen, Erinnerungen, Gefühle usw. ohne große Mühe in jedem nur erdenkbaren Medium darstellen, anpassen und manipulieren können. Theoretisch ist jede Person, welche ein Smartphone oder Computer bedienen kann, in der Lage, ihre ganz eigene Interpretation der Wirklichkeit, Historie oder Sichtweise in welcher Art auch immer realistisch anmutend darzustellen. Die Technik an sich ist faszinierend und bietet viele Chancen. Dass aber mit hoher Wahrscheinlichkeit in unserer Welt mehr Probleme durch diese Technik geschaffen werden als zu lösen, ist leider wahrscheinlicher. Meine Arbeiten “Sleep Well I”, “Sleep Well II” und Teil III ergeben zusammen aktuell eine Wandarbeit von 2 × 9 Metern. Teil 4 ist schon in Planung. Ich vermute, dass ich in ca. 14 Tagen Teil 3 fertigstellen werde. Das wird super =)

    Sleep Well III
    I’m spontaneously posting ten selected machine learning images from my upcoming work “Sleep Well III”. The ten pictures are part of a collection that currently includes around 2500 images, where a workflow I created is used to ensure that 100 years of human history is told by one AI to another AI, so to speak, and the second AI creates images/photographs for this. The period from 1900 to 1999 is represented by AI models trained by myself. In terms of content, “Sleep Well III” is also about the fact that it is already perfectly normal for us to be able to present, adapt and manipulate images, opinions, memories, feelings, etc. in every imaginable medium without much hassle. In theory, anyone who can operate a smartphone or computer is able to present their own interpretation of reality, history or point of view in a way that feels realistic. The technology itself is fascinating and offers many opportunities. Unfortunately, however, it is more likely that this technology will create more problems in our world than it solves. My works “Sleep Well I”, “Sleep Well II” and Part III currently add up to a wall piece measuring 2 × 9 meters. Part 4 is already in the planning stage. I expect to finish Part 3 in about 14 days. It’s going to be great =)

  • Mein Schatten im KI generierten Bild

    Mein Schatten im KI generierten Bild

    Ich experimentierte und arbeite aktuell an vielen neuen künstlerischen Arbeiten parallel. Dazu arbeite ich mich immer tiefer in KI-Themen und Technik ein. Das Bild, das ich hier gepostet habe, ist das erste generierte Bild, welches einem KI LoRA Model zugrunde liegt, welches mit ca. 700 Smartphone-Fotos von mir trainiert wurde. In dieser ca. 640 MB Datei habe ich die Informationen in Gruppen einfach gesagt unterteilt:

    • Gruppe 1: Erstelle Bilder in dem Stil wie ich als Florian mit dem Smartphone meine Umgebung fotografiere
    • Gruppe 2: Erstelle Bilder wie ich als Florian mit dem Smartphone fotografiere, aber füge meinen Schatten hinzu. Es gibt in meinem Datensatz von den 700 Trainingsbilder viele Bilder, auf denen mein Schatten auftaucht.

    So ist dies das erste von mir erstellte KI-Bild mit meinem Smartphone-Stil und mit meinem Schatten drauf! Der Schatten liest sich natürlich in dieser Thematik weitaus interessant in viele Richtungen. Bald mehr dazu.

  • Was ist heutzutage noch Fotografie? Meine neue künstlerischen Arbeit: „An AI image noise for my friend: Me with a pink frog: photography is dead”.

    Was ist heutzutage noch Fotografie? Meine neue künstlerischen Arbeit: „An AI image noise for my friend: Me with a pink frog: photography is dead”.

    Sie sehen hier einen ausgedruckten “echten” Testdruck eines überwiegend KI generierten Bildes an einer Magnetwand. Kann man ein KI-generierten Bild, das augenscheinlich exakt so aussieht wie eine Fotografie, eine Fotografie nennen? Viele Debatten, auch mal sehr hitzig, führe ich aktuell immer wieder über diese Frage. Aus diesem Anlass habe ich neben innerhalb meines Forschungsprojektes als künstlerische Mitarbeiter an der HfG Offenbach, vorgestern nach einer sehr emotionalen Diskussion mit einem engen Freund diese Arbeit erstellt: „An AI image noise for my friend: Me with a pink frog: photography is dead”

    Eine Antwort auf alle Fragen gibt diese Arbeit natürlich nicht. Aber es ist eine Annäherung an die Frage für mich. Ansichten und ein Text zu dieser auf KI Generierung basierten künstlerischen weitestgehend Fotografischen Arbeit finden gibt es hier.