Folge 93: Prof. Björn Ommer und wie wir finden, was noch nicht existiert
Description
Prof. Björn Ommer leitet nach Stationen in Berkeley, Zürich und Heidelberg die Computer Vision & Learning Group der LMU München. Mit seinem neuronalen Netzwerk "stable diffusion" kann er aus Texten oder Skizzen Bilder erzeugen - so wie eine Websuche, die das erschafft, wonach wir suchen.
Wir sprechen mit Björn über die methodischen Ansätze und Herausforderungen von solch generativen Computermodellen wie GPT-3, DALL-E oder Stable Diffusion, die mit der Erzeugung von Texten und Bildern viele Branchen revolutionieren. Sie könnten in Zukunft ermöglichen, Inhalte individuell und ad hoc zu erzeugen: Wie wäre es mit einem Kinofilm, der sich live an die anpasst, die ihn gerade anschauen?
Bereits die heutigen Modelle sind spielerisches und kreatives Werkzeug für alle, stoßen aber noch an viele Grenzen - und "verstehen" nicht wirklich, was sie tun. Und sie werfen Fragen auf, wie mit der kreativen Leistung der Trainingsdaten, aber auch den vom Algorithmus erzeugten Bildern umzugehen ist. Björn gibt uns einen spannenden Einblick in einen Zweig der Digitalisierung, der exponentiell wächst und unseren Alltag verändern wird.
https://stablediffusionweb.com/#demo
https://ommer-lab.com/people/ommer
P.S. Das Beitragsbild wurde natürlich mit "Stable Diffusion" erzeugt. Was war wohl der Text?
Gut ein Drittel aller Schuhe wird in Deutschland wird bereits online gekauft. Nur: Schuhe und Füße passen eher selten problemlos zusammen, die benötigte Größe kann selbst beim gleichen Herstellen ganz unterschiedlich sein. Und so werden große Mengen an Schuhen wieder retourniert und landen im...
Published 11/21/24
Vor zwei Jahren waren wir der erste deutschsprachige Podcast, der ChatGPT als Studiogast begrüßte. Nun ist ChatGPT zurück bei #digdeep: Die brandneue Sprachvariante kann nun im direkten menschlichen Dialog bestehen. Und wie sie das kann!
Beeindruckend ist, wie natürlich sich das Gespräch...
Published 11/07/24