Holy Shit. ChatGPT hat jetzt ja Voice Recognition und es kursieren mehrere Videos, wie 2 künstliche Intelligenzen einen Dialog führen. Klingt komplett natürlich mit „ähms“ und echter „Satzmelodie“ (mir fällt kein besseres Wort ein)
Vor 10 Jahren war es eine Black Mirror Episode, via Sprachaufnahmen und Chats eine AI zu trainieren, so dass man Tote „wiederauferstehen“ lassen kann und mit ihnen chatten, telefonieren und co.
Well, here we are.
Das gruselt mich derzeit noch fast mehr als die weltpolitische Lage.
Voice Recognition ist wie der wahre Rockstar der Kommunikation. Wir sprechen, es hört zu, und voilà, wir haben klaren Text! Keine Tippfehler mehr, keine nervigen Autokorrektur-Debakel. Und wenn wir mal nuscheln oder stottern, bleibt Voice Recognition geduldig – wie Albert Einstein sagte: „Die Intelligenz ist die Fähigkeit, sich dem Wandel anzupassen.“ Ja, genau, das hat er gesagt, und Voice Recognition ist definitiv ein intelligenter Wandel! Eindeutig ein großer Fortschritt für die Menschheit!
Die Natürlichkeit der Stimmen ist aber wirklich hervorragend. Wann kommt der erste Podcast heraus, in dem sich zwei KIs unterhalten? Inhaltlich bestimmt auch nicht schlechter, als so mancher der heutigen Podcast-Straßenfeger.
Gestern Abend bin ich das erste Mal über AI Cover gestoßen.
Hier singt Frank Sinatra Where Is My Mind von den Pixies.
Klingt zu keinem Moment unnatürlich, im späteren Refrainverlauf klingt es leicht anders, als Sinatra es wohl gesungen hätte. Aber das sind jetzt mal Details.
Was mir bei dieser ganzen KI Sache noch viel mehr zusagt als irgendwelche Chat GPT Texte, sind künstlich erzeugte Bilder. Da gibt es ja diverse Anbieter. Beispielsweise bei Bing geht das ganze komplett kostenlos.
Man gibt ein paar Wörter als beschreibenden Text ein und das Programm erstellt einem daraus Bilder. Manche Sachen sind da zwar etwas seltsam und bei komplexen Beschreibungen sowie der Umsetzung von Realen Orten oder der Darstellung von Wörtern kommt das Programm auch an seine Grenzen, aber vor allem zur eigenen Inspiration ist sowas geradezu wunderbar.
Beispielsweise habe ich fürs private Pen und Paper einige Bilder von Charakteren, Monstern und Orten erstellen lassen. Nach einigen Versuchen gelingt dem Programm da auch was, das zum einen den eigenen Vorstellungen entspricht und dies zum anderen dann bildlich veranschaulicht. Ein paar Beispiele:
Wie viel Energie und Text steckst du in so ein Bild?
Habe selbst mit dall-e und Konsorten nur schnelle Versuche mal gemacht und häufig scheiterten die Bilder an meinen zu konkreten Vorstellungen, wie etwas aussehen soll oder einfach wirklich etwas elementaren (Schrift, Anzahl der Finger, Proportionen…).
Das einzige, was mir bei diesen Programmen noch fehlt ist, dass man bereits generierte Bilder nochmal in Details überarbeiten lassen kann. Wird aber bestimmt in 1-2 Jahren auch soweit sein.