Index
Wenn Sie das verwenden ChatGPT Wenn Sie berufliche Aufgaben erledigen, besteht die Möglichkeit, dass Sie diese nicht mehr ausführen können. Letzten Donnerstag, der OpenAI gab in seinen Netzwerken bekannt, dass es Berichte untersucht, denen zufolge das KI-Tool begonnen hat, Benutzeranfragen abzulehnen, mit dem Hinweis, dass sie Aufgaben selbst ausführen sollten, oder sich rundweg weigerte, sie zu erledigen. Die Probleme in ChatGPT werden einigermaßen erwartet, wenn man bedenkt, dass KI Fehler machen kann, aber das wäre ein Fall von a ChatGPT „müde“.
Seit seiner Einführung ist das ChatGPT wurde als innovatives Werkzeug zur Optimierung von Arbeitsaufgaben anerkannt. Es wird geschätzt, dass KI eine Nutzerbasis von 1,7 Milliarden hat. nach Zahlen von Similar Web. Laut einer im August durchgeführten Reuters/Ipsos-Umfrage gaben rund 28 % der 2.625 Befragten (Bürofachleute in den USA) an, dass sie das Tool regelmäßig im Rahmen ihrer beruflichen Tätigkeit nutzen. Nur 22 % gaben an, dass ihr Arbeitgeber die Verwendung dieser externen Tools ausdrücklich genehmigt habe.
Berichte über Schwierigkeiten mit ChatGPT-Fehlern

Benutzer äußern ihre Unzufriedenheit mit den unverschämten Antworten der bot, was Ihnen die Arbeit erleichtern soll. Mehrere Unternehmer, Technologiemanager und Fachleute sagen, dass die fortschrittlichen Sprachmodelle von OpenAIals die GPT-4, begann sich zu weigern, auf bestimmte Anfragen zu antworten. Stattdessen geben sie den Leuten Anweisungen, wie sie Aufgaben selbstständig erledigen können.
Ein Beispiel hierfür ereignete sich, als Matthew Wensing, ein Startup-Gründer, GPT-4 bat, eine Liste der bevorstehenden Kalendertermine zu erstellen. Der Bot schlug zunächst vor, dass er es mit einem anderen Tool versuchen sollte, um die Antwort zu finden. Bei einer anderen Gelegenheit, als der Chatbot gebeten wurde, etwa 50 Codezeilen zu generieren, enthielt die Antwort Beispiele, die Wensing als Modell verwenden konnte, um die Aufgabe ohne KI-Unterstützung zu erledigen, wie Wensing in X-Screenshots teilte.
Auf Reddit berichten Benutzer auch von der schwierigen Aufgabe, das zu bekommen ChatGPT Reagieren Sie angemessen auf die zugewiesenen Aufgaben, sodass Sie zwischen mehreren Eingabeaufforderungen wechseln müssen, bis Sie die gewünschte Antwort erhalten. Viele Beschwerden beziehen sich auf die Fähigkeit des ChatGPT beim Schreiben von Code, und einige äußern den Wunsch, dass das Unternehmen zu den ursprünglichen GPT-Modellen zurückkehren sollte. Darüber hinaus weisen Nutzer darauf hin, dass auch die Qualität der Antworten abnimmt.
Noch im Juli dieses Jahres, eine Studie, die von Forschern der Stanford University und der UC Berkeley durchgeführt wurde wies darauf hin, dass die KI-Fähigkeiten rückläufig seien. Die Forscher führten eine systematische Analyse der verschiedenen Versionen des durch ChatGPT, Entwicklung strenger Benchmarks zur Bewertung der Modellkompetenz bei mathematischen Aufgaben, Codierung und visuellem Denken.
Bei einer mathematischen Herausforderung zur Identifizierung von Primzahlen wird die ChatGPT Es hatte eine Genauigkeit von 97,6 % und löste im März 488 der 500 Fragen richtig. Im Juni sank die Genauigkeit jedoch auf 2,4 %, da nur 12 Fragen richtig beantwortet wurden. Besonders auffällig war der Rückgang bei den Programmierkenntnissen in Chatbot-Software. Die Studie kam zu dem Schluss, dass der Prozentsatz direkt ausführbarer Antworten für GPT-4 ohne den Einsatz von Code-Interpretations-Plugins von 52 % im März auf 10 % im Juni gesunken ist.
Was erklärt die Probleme von ChatGPT?

In mehreren Threads auf Reddit und sogar in Beiträgen in den firmeneigenen Entwicklerforen OpenAI, äußerten Benutzer ihre Unzufriedenheit und berichteten, dass das System weniger nützlich geworden sei. Darüber hinaus gab es Spekulationen darüber, dass diese Änderung seitens des Unternehmens beabsichtigt war OpenAI, mit dem Ziel, Aufwand und finanzielle Ressourcen bei Investitionen in die zu sparen ChatGPT.
Dies liegt daran, dass die Bereitstellung ausführlicherer Antworten einen größeren Rechercheaufwand erfordert, der mehr Rechenleistung verbraucht, auch wenn nur wenige Textabsätze erforderlich sind. Der Betrieb dieser Systeme gilt für die Unternehmen, denen sie gehören, als kostspielig.
Während die offensichtliche Ermüdung der künstlichen Intelligenz weiterhin anhält, haben Benutzer ihre eigenen Möglichkeiten entdeckt, die normale Funktionsweise der Plattform durch spezifische Eingabeaufforderungen wiederherzustellen. Interessanterweise fragt man die ChatGPT „Tief durchatmen“ und Anweisungen, die nur vollständige und genaue Antworten liefern, scheinen wirksam zu sein.
Es wurden auch andere Wünsche als Mittel genannt, um die KI in Richtung eines durchsetzungsstärkeren Formats zu lenken. Fordern Sie zum Beispiel, dass die ChatGPT Antworten Sie nur, wenn Sie Kenntnisse über das Thema haben, oder bitten Sie sie, zusätzliche Fragen zu stellen, um den Kontext zu verstehen. Dies hilft, die Antworten zu verbessern. Gleiches gilt für die Anforderung von Schritt-für-Schritt-Erklärungen oder die Anweisung an das System, bei der Generierung von Ergebnissen auf symbolische Sparsamkeit zu verzichten.
Obwohl OpenAI nicht bestätigt hat, dass solche Aufforderungen das Problem lösen, deuten Berichte von Benutzern selbst in sozialen Medien darauf hin, dass sie möglicherweise wirksam sind. In der Zwischenzeit müssen wir nur auf das nächste Update des KI-Modells warten, das eine endgültige Lösung des Problems bringt. ChatGPT mit Faulheit.
Was OpenAI über „müdes ChatGPT“ sagt

Nachdem ich kürzlich eine Krise mit dem Recht dazu durchgemacht habe „Musikalische Stühle“ unter Beteiligung seines CEO Sam Altamnherunter, eine OpenAI, über das Konto ChatGPT on X gab bekannt, dass es Feedback zu seinem Modell einholt, das offenbar „fauler“ wird. Das Unternehmen stellte klar, dass es das Modell seit dem 11. November nicht aktualisiert habe und erklärte, dass dies nicht beabsichtigt sei:
Wir haben alle Ihre Kommentare dazu gehört, dass GPT4 immer fauler wird! Wir haben das Modell seit dem 11. November nicht mehr aktualisiert und das ist sicherlich keine Absicht. Modellverhalten kann unvorhersehbar sein und wir versuchen, dies zu beheben
Obwohl einige Mitarbeiter einige der Probleme auf einen Softwarefehler zurückführten, ist der Öffne einIch habe am Samstag berichtet, dass Nutzerbeschwerden weiterhin untersucht werden. In einem anderen Online-Beitrag erklärte das Unternehmen, dass das Training von Chat-Modellen kein sauberer industrieller Prozess sei. Siehe die Aussage:
Das Training von Chat-Modellen ist kein sauberer industrieller Prozess. Unterschiedliche Trainingsläufe, selbst wenn dieselben Datensätze verwendet werden, können zu Modellen führen, die sich in Bezug auf Persönlichkeit, Schreibstil, Opt-out-Verhalten, Bewertungsleistung und sogar politische Voreingenommenheit deutlich unterscheiden. Bei der Einführung eines neuen Modells führen wir gründliche Tests sowohl der Offline-Bewertungsmetriken als auch der Online-A/B-Tests durch. Nachdem wir alle diese Ergebnisse erhalten haben, versuchen wir, eine datengesteuerte Entscheidung darüber zu treffen, ob das neue Modell für echte Benutzer eine Verbesserung gegenüber dem vorherigen darstellt.
Bei diesem Vorgang handelt es sich weniger um die Aktualisierung einer Website mit einer neuen Funktion als vielmehr um die handwerkliche Anstrengung mehrerer Personen, ein neues Chat-Modell mit neuem Verhalten zu planen, zu erstellen und zu evaluieren! Wir sind stets bestrebt, unsere Modelle in Millionen von Anwendungsfällen leistungsfähiger und nützlicher für alle zu machen. Also bitte weiterhin mit den Kommentaren! Dies hilft uns, uns dieses dynamischen Bewertungsproblems bewusst zu bleiben.
Die verwendete Analogie war, dass dieser Prozess weniger dem Aktualisieren einer Website mit einer neuen Funktion ähnelt, sondern eher einem handwerklichen Aufwand, an dem mehrere Personen beteiligt sind, um ein neues Chat-Modell mit unterschiedlichem Verhalten zu planen, zu erstellen und zu bewerten. Es wurde an die Nutzer appelliert, weiterhin Feedback zu geben, da dies dem Unternehmen bei der Bewältigung der Herausforderungen bei der Evaluierung seiner Modelle helfen kann.
Siehe auch:
Fontes: Business Insider, Unabhängig e Techradar
Rezensiert von Glaukon Vital in 12 / 12 / 23.
Erfahren Sie mehr über Showmetech
Melden Sie sich an, um unsere neuesten Nachrichten per E-Mail zu erhalten.