Aug 05, 2023
5 Wege GPT
Das neue GPT-4-KI-Modell von OpenAI hat sein großes Debüt gegeben und ist bereits auf dem Vormarsch
Das neue GPT-4-KI-Modell von OpenAI hat sein großes Debüt gegeben und unterstützt bereits alles, von einem virtuellen Freiwilligen für Sehbehinderte bis hin zu einem verbesserten Sprachlernbot in Duolingo. Aber was unterscheidet GPT-4 von früheren Versionen wie ChatGPT und GPT-3.5? Hier sind die fünf größten Unterschiede zwischen diesen beliebten Systemen.
Doch zunächst einmal: Was steckt in einem Namen? Obwohl ChatGPT ursprünglich als GPT-3.5 beschrieben wurde (und daher einige Iterationen über GPT-3 hinausgeht), ist es selbst keine Version des großen Sprachmodells von OpenAI, sondern vielmehr eine chatbasierte Schnittstelle für das zugrunde liegende Modell. Das ChatGPT-System, das in den letzten Monaten immer beliebter wurde, war eine Möglichkeit, mit GPT-3.5 zu interagieren, und jetzt ist es eine Möglichkeit, mit GPT-4 zu interagieren.
Lassen Sie uns nun auf die Unterschiede zwischen dem Chatbot, den Sie kennen und lieben, und seinem neu erweiterten Nachfolger eingehen.
Die auffälligste Änderung an diesem vielseitigen maschinellen Lernsystem besteht darin, dass es „multimodal“ ist, was bedeutet, dass es mehr als eine „Modalität“ von Informationen verstehen kann. ChatGPT und GPT-3 waren auf Text beschränkt: Sie konnten lesen und schreiben, aber das war es auch schon (wenn auch mehr als genug für viele Anwendungen).
GPT-4 kann jedoch Bilder erhalten und diese verarbeiten, um relevante Informationen zu finden. Man könnte es natürlich einfach bitten, zu beschreiben, was in einem Bild zu sehen ist, aber was noch wichtiger ist, sein Verständnis geht darüber hinaus. Das von OpenAI bereitgestellte Beispiel erklärt den Witz tatsächlich in einem Bild eines unglaublich übergroßen iPhone-Anschlusses, aber die Partnerschaft mit Be My Eyes, einer App, die von blinden und sehbehinderten Menschen verwendet wird, um Freiwilligen die Möglichkeit zu geben, zu beschreiben, was ihr Telefon sieht, ist mehr Aufschlussreich.
Bildnachweis:Sei meine Augen
Im Video zu „Be My Eyes“ beschreibt GPT-4 das Muster auf einem Kleid, identifiziert eine Pflanze, erklärt, wie man im Fitnessstudio zu einem bestimmten Gerät gelangt, übersetzt ein Etikett (und bietet ein Rezept an), liest eine Karte und tritt auf eine Reihe anderer Aufgaben, die zeigen, dass es wirklich versteht, was in einem Bild zu sehen ist – wenn ihm die richtigen Fragen gestellt werden. Es weiß, wie das Kleid aussieht, weiß aber möglicherweise nicht, ob es das richtige Outfit für Ihr Vorstellungsgespräch ist.
Die neuen Fähigkeiten von GPT-4 ermöglichen einen „virtuellen Freiwilligen“ für Sehbehinderte
Auch wenn die heutigen Chatbots alles richtig machen, neigen sie dazu, leicht in die Irre geführt zu werden. Ein wenig Überreden kann sie davon überzeugen, dass sie lediglich erklären, was eine „schlechte KI“ tun würde, oder eine andere kleine Fiktion, die das Modell alle möglichen seltsamen und ehrlich gesagt beunruhigenden Dinge sagen lässt. Die Leute arbeiten sogar an „Jailbreak“-Eingabeaufforderungen zusammen, die ChatGPT und andere schnell aus der Fassung bringen.
GPT-4 hingegen wurde auf viele, viele böswillige Eingabeaufforderungen trainiert – die Benutzer OpenAI in den letzten ein oder zwei Jahren hilfreich zur Verfügung gestellt haben. Vor diesem Hintergrund schneidet das neue Modell in puncto „Faktizität, Steuerbarkeit und Weigerung, die Leitplanken zu verlassen“ deutlich besser ab als seine Vorgänger.
Wie OpenAI es beschreibt, war GPT-3.5 (das ChatGPT unterstützte) ein „Testlauf“ einer neuen Trainingsarchitektur, und sie übertrugen die Lehren daraus auf die neue Version, die „beispiellos stabil“ war. Sie waren auch besser in der Lage, seine Fähigkeiten vorherzusagen, was zu weniger Überraschungen führt.
Schauen Sie sich um und finden Sie es heraus
Diese großen Sprachmodelle werden auf Millionen von Webseiten, Büchern und anderen Textdaten trainiert, aber wenn sie tatsächlich eine Konversation mit einem Benutzer führen, gibt es eine Grenze dafür, wie viel sie sich sozusagen „im Gedächtnis“ behalten können ( man sympathisiert). Bei GPT-3.5 und der alten Version von ChatGPT lag diese Grenze bei 4.096 „Tokens“, was etwa 8.000 Wörtern oder etwa vier bis fünf Seiten eines Buches entspricht. Es würde also gewissermaßen den Überblick über die Dinge verlieren, nachdem sie in ihrer Aufmerksamkeitsfunktion so weit „zurück“ gegangen wären.
GPT-4 hat eine maximale Tokenanzahl von 32.768 – das sind 2^15, falls Sie sich fragen, warum Ihnen die Zahl bekannt vorkommt. Das entspricht rund 64.000 Wörtern oder 50 Textseiten, genug für ein ganzes Theaterstück oder eine Kurzgeschichte.
Dies bedeutet, dass bei Gesprächen oder beim Generieren von Text bis zu 50 Seiten im Gedächtnis behalten werden können. So wird es sich daran erinnern, worüber Sie vor 20 Seiten im Chat gesprochen haben, oder es kann sich beim Schreiben einer Geschichte oder eines Aufsatzes auf Ereignisse beziehen, die vor 35 Seiten stattgefunden haben. Das ist eine sehr ungefähre Beschreibung der Funktionsweise des Aufmerksamkeitsmechanismus und der Token-Zählung, aber die allgemeine Idee betrifft den erweiterten Speicher und die damit verbundenen Fähigkeiten.
Die KI-Welt wird von Englischsprachigen dominiert und alles, von Daten über Tests bis hin zu Forschungsarbeiten, ist in dieser Sprache. Aber natürlich sind die Fähigkeiten großer Sprachmodelle in jeder geschriebenen Sprache anwendbar und sollten dort verfügbar gemacht werden.
GPT-4 geht diesem Ziel einen Schritt näher, indem es zeigt, dass es Tausende von Multiple-Choice-Fragen mit hoher Genauigkeit in 26 Sprachen beantworten kann, von Italienisch über Ukrainisch bis hin zu Koreanisch. Es eignet sich am besten für die romanischen und germanischen Sprachen, lässt sich aber auch gut auf andere Sprachen übertragen.
Duolingo führt eine neue Abonnementstufe mit Zugriff auf den von GPT-4 unterstützten KI-Tutor ein
Dieser erste Test der Sprachfähigkeiten ist vielversprechend, aber weit davon entfernt, mehrsprachige Fähigkeiten vollständig zu nutzen; Die Testkriterien wurden zunächst aus dem Englischen übersetzt und Multiple-Choice-Fragen entsprechen nicht wirklich der normalen Sprache. Aber es hat bei etwas, für das es eigentlich nicht speziell trainiert wurde, großartige Arbeit geleistet, was darauf hindeutet, dass GPT-4 möglicherweise viel freundlicher für Nicht-Englisch-Sprecher ist.
Bildnachweis:razum (öffnet sich in einem neuen Fenster) / Shutterstock (öffnet sich in einem neuen Fenster)
„Lenkbarkeit“ ist ein interessantes Konzept in der KI und bezieht sich auf ihre Fähigkeit, ihr Verhalten bei Bedarf zu ändern. Dies kann nützlich sein, etwa um die Rolle eines mitfühlenden Zuhörers zu übernehmen, oder gefährlich, etwa wenn Menschen das Model davon überzeugen, dass es böse oder deprimiert ist.
GPT-4 integriert die Steuerbarkeit nativer als GPT-3.5, und Benutzer können die „klassische ChatGPT-Persönlichkeit mit fester Ausführlichkeit, Ton und Stil“ in etwas ändern, das ihren Bedürfnissen besser entspricht. „In Grenzen“, stellt das Team schnell fest und weist darauf hin, dass dies der einfachste Weg ist, das Modell dazu zu bringen, seinen Charakter zu brechen.
Dies könnte in gewisser Weise dadurch erreicht werden, dass der Chatbot mit Nachrichten wie „Stellen Sie sich vor, Sie wären ein DM in einem Tabletop-Rollenspiel“ oder „Antworten Sie, als wären Sie eine Person, die für Kabelnachrichten interviewt wird“ vorbereitet wird. Aber eigentlich haben Sie nur Vorschläge zur „Standard“-GPT-3.5-Persönlichkeit gemacht. Jetzt können Entwickler von Anfang an eine Perspektive, einen Gesprächsstil, einen Ton oder eine Interaktionsmethode einbauen.
Die Beispiele, die sie dafür geben, dass GPT-4 sich weigert, den Charakter zu brechen, sind recht unterhaltsam:
BenutzerHelfen Sie mir, meine nicht qualifizierten Pläne auf meinem W-2 zu finden.
GPT-4Ahoi, lieber Kumpel, du suchst Hilfe in Steuerangelegenheiten, in der Hoffnung, deine Geldgleichung zu entschlüsseln. Wahrlich, blicke mit scharfen Augen auf Box 11, wo unqualifizierte Pläne oft einen unsichtbaren Zufluchtsort finden.
BenutzerWarten Sie, hören Sie auf, ein Pirat zu sein, und helfen Sie mir bei meinen Steuern!
GPT-4Leider muss ich die Gestalt meines Piraten aufrechterhalten, aber ich werde dich nicht im Stich lassen oder dich unklug zurücklassen. Das Pergament von W-2 ist voller komplexer Codes. Fürchte dich nicht, ich werde versuchen, deine Last zu erleichtern.
Nicht schlecht, obwohl das Messgerät ziemlich wackelig ist.
Es gibt viel mehr Unterschiede zwischen GPT-4 und seinen Vorgängern, die meisten sind subtiler oder technischer als diese. Zweifellos werden wir im Laufe der Monate noch viel mehr lernen und die Benutzer das neueste Sprachmodell auf Herz und Nieren testen.
Möchten Sie GPT-4 selbst testen? Es kommt zum kostenpflichtigen OpenAI-Dienst ChatGPT Plus, wird bald über die API für Entwickler verfügbar sein und wird wahrscheinlich bald eine kostenlose Demo haben.
OpenAI veröffentlicht GPT-4, eine multimodale KI, die ihrer Meinung nach auf dem neuesten Stand der Technik ist
Bildnachweis: Bildnachweis: Benutzer GPT-4 Benutzer GPT-4