Mittwoch, 29. Mai 2024
Navigation öffnen
Infografik

KI: Womit lernen ChatGPT & Co?

Infografik: ChatGPT & Co.: Chatbots lernen von Patenten, Wikis und Nachrichten | Statista
Die Leistung der derzeit öffentlich verfügbaren KI-Angebote wie ChatGPT oder Bard übertrifft die Vorstellungen der meisten Menschen. Eine Recherche der Wahington Post zeigt nun, auf Basis welcher Inhalte die KIs trainiert werden, um Antworten in natürlicher Sprache geben zu können.

Kontextualisierte Wahrscheinlichkeitsprüfung: Chatbots sind nicht intelligent

Entgegen der öffentlichen Wahrnehmung sind derzeit verfügbare Chatbots wie OpenAIs ChatGPT oder Googles Bard, dessen Integration in sämtliche Google-Dienste auf der Entwickler:innen-Konferenz I/O angekündigt wurde, nicht intelligent und besitzen kein eigenes Bewusstsein. Die zugrundeliegenden large language models (LLMs) werden an bereits verfügbaren Informationen aus dem Internet trainiert und setzen diese so neu zusammen, dass das Ergebnis einer Wahrscheinlichkeitsprüfung im Kontext von natürlicher Sprache standhält. Dass manche Quellen eher priorisiert werden als andere, zeigt unsere Grafik auf Basis einer exklusiven Recherche der Washington Post.
 
 

Lesen Sie mehr zu diesem Thema:

App „FAST.AI“ erkennt Symptome für Schlaganfälle

Erschienen am 22.02.2023Hochpräzise arbeitende Anwendung nutzt Künstliche Intelligenz zur frühzeitigen Warnung. Mehr erfahren Sie hier!

Erschienen am 22.02.2023Hochpräzise arbeitende Anwendung nutzt Künstliche Intelligenz zur frühzeitigen Warnung. Mehr erfahren Sie...

© VFX - stock.adobe.com

Patents.Google.com hat höchsten Anteil beim Training von KI

Das US-Nachrichtenportal analysierte zusammen mit dem Allen Institute for AI den von Google veröffentlichten C4-Korpus, der 15 Millionen Webseiten-Schnappschüsse enthält und durch Inhaltsfilter bereinigt wurde, auf die Verteilung der enthaltenen Tokens, also Wörter oder Phrasen, auf die im Korpus befindlichen Seiten. Mit 0,46% hat patents.google.com den größten Anteil. Dabei handelt es sich es um eine Sammlung von mehr als 120 Millionen Patent-Anmeldungen aus der ganzen Welt sowie Teilen von Google Books und Google Scholar.
 
Infografik: Womit werden ChatGPT & Co. trainiert? | Statista

Urheberrechtliche Fragestellung sind bei KI immer noch ungeklärt

Auf dem 2. Platz landet wikipedia.org mit einem Token-Anteil von 0,19%, gefolgt von scribd.com mit 0,07%. Letzteres ist vor allem vor dem Hintergrund der Urheberrechtsfrage bei KI-generierten Texten relevant. Während Inhalte von Wikipedia unter den freien Creative-Commons-Lizenzen laufen, startete Scribd als freie Upload-Plattform für Dokumente, auf die gerade in den Anfangstagen zahlreiche geschützte Werke hochgeladen wurden. Medienangebote wie die New York Times, der Guardian und Forbes befinden sich ebenfalls unter den Top 8, und auch hier ist die Frage nach dem Urheberrecht relevant.
 
 

Lesen Sie mehr zu diesem Thema:

Künstliche Intelligenz – Hoffnung für viele Menschen mit seltenen Erkrankungen?

Erschienen am 09.01.2023Was leistet KI bei seltenen Erkrankungen? Lesen Sie das Update zu den orphan diseases von Dr. rer. nat. med. habil. Eva Gottfried!

Erschienen am 09.01.2023Was leistet KI bei seltenen Erkrankungen? Lesen Sie das Update zu den orphan diseases von Dr. rer. nat....

© dehweh - stock.adobe.com

Diskussion über länderübergreifende KI-Regulierungen

Während Regulierung von und Gesetzgebung zum Thema KI bisher eher schleppend anläuft, wagen einzelne nationale und intranationale Behörden und Organe vereinzelt Vorstöße in diese Richtung. Italien sperrte den Zugang zu ChatGPT kurzzeitig, in Deutschland will die Taskforce KI der Datenschutzkonferenz die DSGVO-Eignung des OpenAI-Chatbots unter die Lupe nehmen, und in der EU wird die Einführung des AI Act diskutiert, der länderübergreifende gesetzliche Rahmenbedingungen für den Einsatz von KI-Tools in der Europäischen Union schaffen soll.
 
Infografik: ChatGPT gefällt den Nutzer:innen | Statista

Quelle: Statista



Sie können folgenden Inhalt einem Kollegen empfehlen:

" KI: Womit lernen ChatGPT & Co?"

Bitte tragen Sie auch die Absenderdaten vollständig ein, damit Sie der Empfänger erkennen kann.

Die mit (*) gekennzeichneten Angaben müssen eingetragen werden!

Die Verwendung Ihrer Daten für den Newsletter können Sie jederzeit mit Wirkung für die Zukunft gegenüber der MedtriX GmbH - Geschäftsbereich rs media widersprechen ohne dass Kosten entstehen. Nutzen Sie hierfür etwaige Abmeldelinks im Newsletter oder schreiben Sie eine E-Mail an: rgb-info[at]medtrix.group.