Dall-E

Die Entwicklung in 2 jahren:

Der Start ins Jahr 2021 war geprägt von mehreren bedeutenden Entwicklungen im Bereich Künstliche Intelligenz. OpenAI stellte zwei Konzepte mit multimodalen Ansätzen vor, namentlich DALL-E und CLIP, die in der Lage sind, bemerkenswerte Ergebnisse auf dem Gebiet der fotorealistischen Text-Bild-Übertragung zu erzielen, worüber ich in meinem Artikel berichtet habe.

OpenAI bereitete die Veröffentlichung von CLIP als Open-Source-Projekt vor, während DALL-E noch in interner Entwicklung war. CLIP, ein neuronaler Algorithmus, der „lernen kann, visuelle Konzepte aus natürlicher Sprache effizient herzuleiten“, wurde von vielen Künstlern und Programmierern für verschiedene visuelle Projekte genutzt. Es wurde mit StyleGAN2, VQGAN und anderen Ansätzen gepaart, um Zero-Shot-Bilder ohne Referenzproduktion zu ermöglichen. Ein großer Dank gebührt Advadnoun, der treibenden Kraft hinter dieser Bewegung. In dieser ständig aktualisierten Liste auf Reddit finden Sie mehr als 70 Google Colab Notebooks (interaktive Umsetzungen von Repositories, die Sie direkt aus Ihrem Browser heraus ausführen können – auch ohne Python-Wissen).

Der Ablauf der Arbeit ähnelte der von DALL-E, aber mit einer anderen Methodik und einem ganz anderen Ergebnis: nicht lebensecht, sondern eher ein Abbild der „Maschinenträume“ von Google Deep Dream, aber mit völlig neuen visuellen Motiven.

Im Vorjahr wurde ein Abbild von DALL·E namens ruDALLe in Russland erschaffen, das ich hier untersuchte. Die russischen Wissenschaftler bemühten sich, die Struktur von OpenAI’s Herangehensweise nachzuahmen, aber da der ursprüngliche Transformer von DALL·E nicht öffentlich zugänglich war, konnten sie lediglich mäßig überzeugende, aber immer noch interessante Ergebnisse erzielen.

Welche Nachteile hat Dall-E?

Ein wesentlicher Nachteil von ruDALLe bestand nicht nur in den nur ansatzweise realistischen Bildern, sondern auch in seiner Unfähigkeit, metaphorische Bildsprache zu verwenden. Angesichts komplexer und abstrakter Aufgabenstellungen wie “Nostalgie” oder “Erinnerungen an ein früheres Leben” konnte ruDALLe nur Titel nachbilden (worauf das russische Modell zweifellos übertrainiert war).

Vorurteile gegenüber der KI “DALL-E”: In den letzten Jahren haben Diskriminierung und Vorurteile an Bedeutung gewonnen, da sie sich in den Schlüsseltechnologien der Zukunft, der KI, einschleichen. Intelligente Computerprogramme, die aus Daten lernen und unsere Lebensweise verändern werden, wie wir sie noch nie zuvor erlebt haben. Es ist wichtig, dass sie mit verschiedenen Datensätzen und unter Einbeziehung vieler Entwickler:innen programmiert werden, da sonst die Gefahr besteht, diskriminierende KI-Systeme zu schaffen. Der Vorfall bezüglich des Launchs von Googles Chatbot „Allo“, einschließlich des „Smart Reply“-Bots, ist ein hervorstechendes Beispiel dafür, wie Unternehmen sich Gefahren ausgesetzt sehen können. 2016 brachte Google das Messaging-Programm in großem Stil heraus, doch wurde schnell deutlich, dass der Chatbot eine schlechte Tendenz zur Geschlechtsdiskriminierung aufwies, indem er Frauen mit sexuell anzüglichen und beleidigenden Antworten begegnete. Dies veranschaulicht die Notwendigkeit, dass Unternehmen bei der Entwicklung von künstlicher Intelligenz auf mögliche Vorurteile achten. Alle Aspekte des Prozesses – von der Datenerfassung über den Algorithmus bis hin zu Benutzertests – müssen auf Vielfalt achten. Es gibt viele Beispiele für diskriminierendes Verhalten von Künstlicher Intelligenz gegenüber Frauen und People of Color, einschließlich Amazons Rekrutierungstool, das systematisch männliche Bewerber bevorzugte, sowie Facebooks Kennzeichnungssystem für Bilder, welches einen dunkelhäutigen Mann fälschlicherweise als Primaten erkannte. Nicht nur Frauen und People of Color erfahren Diskriminierung durch KI, auch die queere Community ist von Vorurteilen betroffen.

Die Gründer von Open-Ai (dall-E):

OpenAI bemerkt, dass Künstler vordergründig bedeutsame Inputs zu den Fähigkeiten von DALL-E geleistet haben. Heutzutage kann jeder Benutzer die neue Funktion namens »Outpainting« ausprobieren, die es ermöglicht, Bilder über die äußeren Grenzen hinaus auszudehnen.

Im Jahr 2015 gründeten Investoren wie Elon Musk und Sam Altman den OpenAI-Forschungsverband, ursprünglich als eine reine Nonprofit-Organisation, um die Künstliche Intelligenz zu erforschen. Nach dem Einstieg von Unternehmen wie Microsoft wurde 2019 ein Gewinn orientiertes Unternehmen namens OpenAI LT ausgegliedert, das als Tochtergesellschaft von der weiterhin gemeinnützigen OpenAI Inc. kontrolliert wird.