Dall’esordio di ChatGPT in poi sono stati diversi gli sfidanti (o i wannabe) ad alzare la voce per rubare un po’ dell’attenzione altrimenti dedicata al modello di OpenAI. E oggi c’è un nome che sta facendo molto rumore: Claude 2.0. Sì, avete capito bene, c’è un altro sceriffo in città, e promette di imporre la sua legge. Diamo un’occhiata a cosa rende Claude 2.0 così speciale.
La “rivolta” dei fuoriusciti
La versione 2.0 di Claude (la trovate qui) non è semplicemente un aggiornamento. Questo modello di intelligenza artificiale nato da Anthropic, startup fondata da due ex collaboratori di OpenAI, è un salto quantico rispetto alla sua versione precedente, la 1.3.
I dati parlano chiaro. Nel test Codex HumanEval, progettato per valutare la competenza nella programmazione Python, Claude 2.0 ha ottenuto un impressionante 71,2%, un netto miglioramento rispetto al precedente 56,0%.
Non è tutto: ha anche dimostrato abilità matematiche superiori, con un punteggio dell’88,0% su GSM8k, una serie di problemi matematici di livello scolastico. Claude è l’AI che tutti vorrebbero avere al nostro fianco durante un esame.
Claude 2.0, il Gigante “buono”
Tra i suoi tratti distintivi, Claude 2.0 annovera sicuramente una progettazione più “educata”, che pone un’enfasi particolare sulla riduzione del danno, cercando di evitare contenuti offensivi o pericolosi. Rispetto alla versione precedente, Claude 1.3, il nuovo modello è due volte più efficace nel generare risposte sicure. Questo lo rende una scelta ideale per le aziende che cercano output sicuri e rispettosi.
La definizione di “gigante” però se la guadagna sul piano quantitativo: Claude 2.0 può elaborare una quantità enorme di dati in un’unica volta. Parlo di circa 100.000 token, o intorno alle 75.000 parole. È come leggere un romanzo in pochi secondi!
Claude è più forte di ChatGPT?
La domanda da un milione di euro. Come è messo Claude 2.0 con ChatGPT? Mi scuserete se non reputo Bard ancora all’altezza. Considererei 3 fattori, e qualche “frattaglia”.
Limiti di Contesto:
Claude 2.0: come detto, ha un limite di 100.000 token, che gli permette di elaborare prompt di testo più lunghi e avere una finestra di contesto e memoria più ampia.
ChatGPT: Ha vari limiti a seconda della versione: ChatGPT-3 ha un limite di 4096 token, GPT4 (8K) ha un limite di 8000 token e GPT4 (32K) ha un limite di 32000 token. Ciò significa che la “memoria” di ChatGPT delle conversazioni non risale tanto indietro come quella di Claude 2.0.
Tempo di Elaborazione:
Claude 2.0: Progettato per prestazioni più veloci, con tempi di risposta medi di circa 5 secondi.
ChatGPT: Di solito impiega da pochi secondi fino a 30 secondi per generare una risposta. La velocità potrebbe diminuire durante i periodi di picco di domanda.
Punteggi dei Test – USMLE, BAR & GRE:
Claude 2.0: Ha ottenuto punteggi migliori di ChatGPT nella sezione di scrittura del GRE e nell’esame del Bar.
ChatGPT: Ha ottenuto punteggi migliori di Claude nelle sezioni verbale e quantitativa del GRE e nell’esame USMLE.
USMLE: Sta per “United States Medical Licensing Examination”. È un esame per i medici che vogliono ottenere la licenza per praticare la medicina negli Stati Uniti. L’esame valuta la capacità del medico di applicare conoscenze, concetti e principi e di dimostrare competenze fondamentali per la pratica sicura ed efficace della medicina. BAR: Si riferisce all’esame da avvocato, che è un esame che un individuo deve superare per essere ammesso a praticare la legge in una determinata giurisdizione. Gli esami del Bar variano da stato a stato negli Stati Uniti, ma di solito consistono in una serie di prove scritte su vari argomenti legali. GRE: Sta per “Graduate Record Examination”. È un esame standardizzato utilizzato per l’ammissione a programmi di laurea magistrale e dottorato in molte università, in particolare negli Stati Uniti. Valuta le competenze verbali, quantitative e di scrittura analitica del candidato.
Altre cose da considerare
Tra le note a margine: ChatGPT è più diffuso, mentre Claude è disponibile solo negli USA e in UK (ma potete provarlo anche se non siete in questi due paesi, usando una VPN). Ancora: al momento Claude è gratuito, mentre ChatGPT presenta due versioni: free e a pagamento. Altro? Ah, si. ChatGPT ha i plugin, Claude 2.0. Però Claude 2.0 è aggiornato al 2023 e ChatGPT al 2021. Però ChatGPT può connettersi online e Claude 2.0 no.
Insomma, se ne danno di santa ragione. Trovo ancora in vantaggio ChatGPT, ma devo dire che Claude 2.0 è un ottimo sfidante e potrebbe tentare presto il sorpasso. A naso, cosa scegliereste? O meglio: state già usando entrambi? Quale preferite? Siamo qui per leggervi, diteci la vostra sui canali social di Futuro Prossimo!