Anthropic: Claude 3 schneidet in Tests besser ab als GPT-4

Singapore News News

Anthropic: Claude 3 schneidet in Tests besser ab als GPT-4
Singapore Latest News,Singapore Headlines
  • 📰 heise_de
  • ⏱ Reading Time:
  • 54 sec. here
  • 2 min. at publisher
  • 📊 Quality Score:
  • News: 25%
  • Publisher: 68%

Claude 3 soll in zahlreichen Tests besser abschneiden als ChatGPT 4. Anthropics Chatbot kommt in drei Größen.

Der ChatGPT-Konkurrent Claude aus dem Hause Anthropic erscheint in einer neuen Version – beziehungsweise als eine neue Modellfamilie: Claude 3 Haiku, Claude 3 Sonnet und Claude 3 Opus. Sie alle sollen GPT-4, also OpenAIs leistungsstärkstes KI-Sprachmodell in Tests übertreffen. Ihre Schwerpunkte liegen jeweils auf verschiedenen Bereichen, Schnelligkeit, Kosten, Intelligenz. Die Modelle haben auch spezielle visuelle Fähigkeiten.

Konkret schneidet Opus in einigen gängigen Tests besser ab, beispielsweise bei Mathematik-Aufgaben auf dem Niveau eines Grundschülers. Eine von Anthropic veröffentlichte Tabelle zeigt die Testergebnisse im Vergleich zu anderen Modellen, wie etwa GPT-4 – das in allen Tests schlechter abschneidet als Opus.Dagegen schneidet Haiku zwar in den Tests nicht gleichermaßen gut ab, ist aber deutlich schneller und günstiger als Opus.

Die Vorgängerversionen von Claude sollen unnötig oft den Dienst verweigert haben, wenn Prompts zu nah an ihre Leitplanken und Schranken kamen. Das soll mit Claude 3 deutlich seltener passieren. Der Chatbot soll dank eines besseren Verständnisses von Kontexten auch besser erkennen können, ob es sich wirklich um Gefahren oder Missbrauch handelt. Freilich halluziniert der Chatbot weniger als Claude 2.1., aber er halluziniert.

Die Kosten sind dem Blogbeitrag zu entnehmen. Los geht es mit Haiku bei Input/Output Kosten für eine Million Token in Höhe von 0,25/1,25 US-Dollar.

We have summarized this news so that you can read it quickly. If you are interested in the news, you can read the full text here. Read more:

heise_de /  🏆 20. in DE

Singapore Latest News, Singapore Headlines

Similar News:You can also read news stories similar to this one that we have collected from other news sources.

Gemälde von Claude Monet in Lyon mit Suppe beworfenGemälde von Claude Monet in Lyon mit Suppe beworfenEin Gemälde von Claude Monet wurde in Lyon mit Suppe beworfen. Das Museum der Schönen Künste spricht von Vandalismus und kündigt eine Klage an.
Read more »

Blaue Karte im Fußball: Jetzt äußert sich die FIFA - erste Tests noch in diesem Sommer möglich!Blaue Karte im Fußball: Jetzt äußert sich die FIFA - erste Tests noch in diesem Sommer möglich!London - Wird im Fußball neben der Gelben und Roten eine neue Blaue Karte eingeführt? Ein entsprechender Bericht sorgt für Wirbel. Nun meldet sich der Weltverband zu Wort.
Read more »

Apple Vision Pro: Erste Tests und Video-Reviews sind daApple Vision Pro: Erste Tests und Video-Reviews sind daGemischte Reaktionen – kann das Headset wirklich ein iPhone ersetzen?
Read more »

Notengebung: Sechs Lehrer reden KlartextNotengebung: Sechs Lehrer reden KlartextFlucht, Corona, Chat-GPT - Noten zu geben, wird für viele Lehrkräfte immer schwieriger. Sechs Lehrerinnen und Lehrer berichten.
Read more »

Gegen Microsoft und Sam Altman: Elon Musk verklagt OpenAIGegen Microsoft und Sam Altman: Elon Musk verklagt OpenAIElon Musk war 2015 Mitbegründer von OpenAI. Das Unternehmen habe mit GPT-4 und der Kooperation mit Microsoft Vertragsbruch begangen, klagt er.
Read more »

CB-Funk-Podcast #55: Ryzen-Fehler­korrekturen und die RTX 3050 6 GB 70 W im TestCB-Funk-Podcast #55: Ryzen-Fehler­korrekturen und die RTX 3050 6 GB 70 W im TestDiese Woche besprechen Jan und Fabian im CB-Funk die aufwändige Korrektur des Tests zu AMD Ryzen 8000G und die neue GeForce RTX 3050 6 GB.
Read more »



Render Time: 2025-08-27 23:11:44