Als das Unternehmen OpenAI vor nicht einmal 2 Jahren, im November 2022, seine KI-Lösung ChatGPT veröffentlichte, wurde kurz darauf darüber spekuliert, dass Google mit Sicherheit bereits eine ähnlich mächtige Lösung in der Schublade liegen hat, die bisher nur geschlossen blieb, um das sehr lukrative Geschäftsmodell der Google-Suche nicht zu gefährden.
Denn Assistenzsysteme wie ChatGPT oder auch perplexity.ai suchen nicht, sie liefern Antworten. Bereits im März 2023 stellte Google seine Lösung Gemini vor (damals noch unter dem Namen »Bard«), eine direkte Reaktion auf ChatGPT. Gemini erlaubt multimodales Arbeiten, das heißt, man kann sowohl diverse Medien wie Sprache oder Fotos eingeben als auch unterschiedliche Formate, wie Code oder Sprache, ausgegeben bekommen.
Soweit, so gut.
Bereits am 12. Juni dieses Jahres fand im Rahmen einer beeindruckend organisierten und orchestrierten Veranstaltung der Google Cloud Summit in Offenbach statt. Auf 4 Bühnen wurde die neueste Technologie vorgestellt, unter anderem auch, wie Gemini in google Workspace (dem Konkurrenzprodukt zu Microsoft 365) eingebunden ist.
Gemini ist in alle Workspace-Anwendungen von google integriert und kann anwendungsübergreifend genutzt werden.
Bild: google.de
Gemini ist z.B. Bestandteile der Videokonferenz-Lösung Google Meet. Kann ich an einem Meeting nicht teilnehmen, klicke ich auf den »Attend for me« -Button und teile Gemini mit, welche Punkte er als mein Stellvertreter ins Meeting einbringen soll. Nach dem Meeting erhalte ich von ihm eine Zusammenfassung mit den sich daraus für mich ergebenden Aufgaben.
Gemini erstellt auch Präsentationen, generiert Bilder, die zum Corporate Design meines Unternehmens passt und bereitet Kundentermine vor. Gemini verfasst Blogposts und Projektpläne. Er liest Korrektur und macht Vorschläge zum Schreibstil. Er erstellt eine Aufgabenübersicht oder auch eine Konferenzagenda. Er fasst meine E-Mails zusammen und generiert daraus To-Do-Listen. Er simuliert ein professionelles Licht, um mich optimal in einem Videocall auszuleuchten. Und er übersetzt Konferenzen in Echtzeit und gibt die Texte als Untertitel aus.
Zwei vorgestellte, derzeit noch nicht veröffentlichte Lösungen haben uns darüber hinaus begeistert:
1. Google Vids
Mit Google-Vids soll die Erstellung von Videos (auch Schulungsvideos) kinderleicht von der Hand gehen. Selbstverständlich auch durch die Assistenz von Gemini. Gemini erstellt Voice Overs und schneidet automatisch die »Ähms« und »Mhms« aus Ihren Videos.ide
Einen ersten Eindruck zu Google Vids erhalten Sie unter http://tiny.cc/googlevids.
2. Google Project Astra
Dieses Projekt hat uns am nachhaltigsten beeindruckt. Die sprechende KI kann, über Smartphones und smarte Brillen, Gesehenes in Echtzeit analysieren.
Die Anwendungsmöglichkeiten sind gigantisch. Uns fehlt der Platz an dieser Stelle, es zu beschreiben. Sofern Sie das Projekt noch nicht kennen, legen wir Ihnen das zweiminütige Video unter http://tiny.cc/Astra ans Herz.
Bei aller Begeisterung für die sogenannte »Künstliche Intelligenz« darf nicht vergessen werden, dass hinter all diesen Lösungen keine Intelligenz steckt. ChatGPT und auch Gemini sind ungefähr so intelligent wie Schottergärten.
Oder wie Sepp Hochreiter, ein deutscher KI-Pionier jüngst im FAZ D:Economy-Podcast ausgeführt hat:
Diese Large Language Models, wie man sie nennt, sind überhaupt nicht intelligent. Die sind so intelligent wie eine Datenbank. Die haben zwar sehr viel menschliches Wissen über diesen Text abgespeichert, aber alles, was rauskommt, ist nur eine Zusammenstöpselung von Texten, die vorher reingesteckt wurden.
Zwei sehr gut investierte Minuten, um einen Blick in die nähere Zukunft zu werfen. Mehr Zeit benötigt es nicht, um sich vom Project Astra begeistern zu lassen: http://tiny.cc/Astra
Mehr über Josef »Sepp« Hochreiter und wie er mit seinem Unternehmen NXAI »OpenAI vom Markt fegen« möchte, lesen Sie in einer unserer kommenden Newsletterausgaben. |
Commenti