Einführung: Was sollte ich über GenAI wissen?

In der dynamischen Welt der Unternehmenskommunikation ist es unerlässlich, am Puls der Zeit zu bleiben und die neuesten Technologien zu beherrschen. Eine solche bahnbrechende Technologie ist die Generative Künstliche Intelligenz (GenAI), die Potenzial zeigt, die Erstellung und Verbreitung von Medieninhalten grundlegend zu verändern. Für Medienschaffende ist es daher von großer Bedeutung, sich ein grundlegendes Verständnis über GenAI anzueignen, um im digitalen Zeitalter wettbewerbsfähig zu bleiben. Doch was verbirgt sich hinter dem Begriff GenAI und welche neuen Entwicklungen sollten Medienschaffende diesbezüglich besonders im Auge behalten? 

Künstliche Intelligenz (KI) bezieht sich auf Technologien, die Computern lehren, menschliche Kommunikation und Verhaltensweisen zu verstehen und zu simulieren. Kaplan und Haenlein definieren KI als die Fähigkeit eines Systems, externe Daten korrekt zu interpretieren, aus diesen Daten zu lernen und diese Erkenntnisse flexibel zur Erreichung spezifischer Ziele und Aufgaben zu nutzen. Die Intelligenz der KI liegt in ihrer Fähigkeit, wie Menschen zu denken, zu reagieren und Aufgaben auszuführen, die menschliche Intelligenz erfordern [1]

Ein wesentlicher Vorteil von KI-Systemen gegenüber herkömmlichen Softwaresystemen ist ihre überlegene Effizienz. Sie erfüllen Aufgaben, die über die Kapazitäten von Menschen hinausgehen, z.B. die Erzeugung hunderter einzigartiger Bilder oder von Millionen von Wörtern innerhalb einer Stunde [2]

Die jüngste Entwicklung der Generativen Künstliche Intelligenz (GenAI) hat die KI-Landschaft revolutioniert. GenAI ist ein Unterbereich der KI, der sich auf die Erstellung neuer Daten, basierend auf vorhandenen Daten, konzentriert. Diese Technologie nutzt tiefe neuronale Netzwerke, um aus großen Trainingsdatensätzen Muster und Strukturen zu erlernen und dadurch neue Inhalte zu generieren [3]. Während traditionelle KI-Systeme darauf ausgelegt sind, Muster zu erkennen und Entscheidungen zu treffen, zielt GenAI darauf ab, neue Inhalte wie Bilder, Texte, Musik und mehr zu erzeugen. Sie erweitert die Fähigkeiten der KI, indem sie nicht nur analysiert und versteht, sondern auch kreativ neue Inhalte erschafft.  

Je nach Art der generierten Medien lassen sich die verschiedenen Funktionen von GenAI durch eine Vielzahl von Technologien unterstützen, die wir im Folgenden erläutern werden. 

Natural Language Processing (NLP) bezieht sich auf einen Bereich der KI, der Maschinen befähigt, menschliche Sprachen zu verstehen, zu interpretieren und Bedeutungen daraus abzuleiten. NLP betrifft viele Funktionen wie Spracherkennung, Übersetzung, Stimmungsanalyse, Informationsextraktion, Texterstellung usw. Dabei legt sie die Grundlage für eine natürliche sprachliche Interaktion zwischen Menschen und Maschinen. 

Generative Language Model (GLM) ist eine Art von NLP-Modell, das darauf trainiert ist, lesbare menschliche Sprache basierend auf Mustern und Strukturen in den Eingabedaten zu generieren. Das Aufkommen von Deep Learning führte zu signifikanten Leistungsverbesserungen des GLMs. Damit hat GLM ein Niveau erreicht, das eine kohärente und überzeugende Texterstellung in verschiedenen Formaten ermöglicht [4]. Die bekannteste Anwendung von GLM ist wahrscheinlich Chatbot, z. B. ChatGPT

Die Veröffentlichung von ChatGPT im Jahr 2022, einem leistungsstarken GenAI-Tool von OpenAI, hat die gesamte Gemeinschaft der KI-Technologie revolutioniert. Ein GPT (Generative Pretrained Transformer) zählt zu den fortschrittlichsten GLMs und ist in der Lage, qualitativ hochwertigen Text in natürlicher Sprache zu erzeugen [5]. Er wird vorab mit umfangreichen Textdaten trainiert und erlernt dadurch ein breites Spektrum an sprachlichen Mustern und Kenntnissen, was die Grundlage für die Bewältigung vielfältiger sprachlicher Aufgaben bildet. Anschließend lässt sich der GPT auch auf spezifische Aufgaben abstimmen, was wir als Fine-Tuning bezeichnen. Durch weiteres Training mit einem aufgabenbezogenen Datensatz wird das Modell besser an die Ansprüche der jeweiligen Aufgabe angepasst. ChatGPT nutzt verstärkendes Lernen durch menschliches Feedback (RLHF), um die passendste Antwort für eine gegebene Anweisung zu bestimmen. Das aktuelle Modell GPT-4o ist multimodal und akzeptiert Text, Bild, Audio sowie Video als Eingabe. ChatGPT hat erfolgreich das juristische Staatsexamen [6] sowie Teile von medizinischen Lizenzprüfungen [7] bestanden. 

Generative Adversarial Network (GAN) wurde 2014 von Goodfellow et al. vorgestellt und erlangte schnell Popularität im Bereich der Bildgenerierung. Mit dieser Technologie wird die Erstellung hochauflösender und realistischer Bilder ermöglicht. Basierend auf dem GAN-Modell entwickelten Elgammal et al. 2017 ein Deep-Net, das in der Lage ist, sowohl den Stil als auch den Inhalt verschiedener Kunstwerke zu lernen. Dieses Modell kann nicht nur die charakteristischen Merkmale bestehender Kunstwerke erfassen, sondern diese Komponenten auch neu und kreativ kombinieren, um völlig neue Kunstwerke zu schaffen. Diese Fähigkeit, Stil und Inhalt zu trennen und neu zu kombinieren, stellt einen bedeutenden Fortschritt in der künstlichen Intelligenz und der Kunstgenerierung dar. 

Eine aktuellere Technologie im Bereich Bildgenerierung ist das Generative Diffusion Model (GDM). Trainiert mit größeren Datensätzen, welche wesentlich mehr Parameter enthalten, erzeugt GDM detailliertere und realistischere Bilder, die eine harmonische Kombination aus Vielfalt in den generierten Bildern und Ähnlichkeit zu den Trainingsdaten aufweisen [8]. Ein Beispiel hierfür ist Stable Diffusion entwickelt von Stability AI

GenAI steht noch am Anfang ihrer Entwicklung und hält noch viele Überraschungen für uns bereit. Die generativen Funktionen von GenAI-Tools werden in Zukunft die kreativen Prozesse grundlegend verändern, in denen Medienschaffende Ideen formulieren und umsetzen [9]. Es bleibt spannend zu beobachten, wie diese Technologie die Zukunft der Unternehmenskommunikation nachhaltig prägen wird. 

Bereit für einen Deep Dive ins Thema GenAI Anwendungen in der Unternehmenskommunikation? Erfahre mehr in weiteren Artikel auf dieser Website!

Bild: Adobe Stock / Prostock-Studio

Kommentar verfassen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Nach oben scrollen