O provedor de IA Antrópico tem como alvo o mercado de ações, e a fantasia do mercado de ações precisa de uma grande oportunidade. Conseqüentemente, o mais recente Large Language Model (LLM) da Anthropic é chamado Claude Fable 5. O provedor geralmente não o lança na tradicional quinta-feira, mas na terça-feira. O objetivo é “ultrapassar tudo o que já está geralmente disponível”.
Leia mais depois do anúncio
A essência do assunto está “disponível ao público em geral” porque Fable 5 é uma variante de conteúdo limitado do novo Mito 5. Conforme ordenado por Donald Trump como medida voluntária, este LLM está inicialmente disponível apenas para a NSA e, possivelmente com a aprovação da Casa Branca, para empresas norte-americanas selecionadas como parte do projeto de segurança de TI Glasswing.
Por trás disso está uma mensagem testada e comprovada no novo marketing LLM que é muito poderosa e não deixa dúvidas. Desta vez afeta não só a área de segurança informática, mas também biologia e química, bem como destilação. O que se entende não é a produção de licor intelectual apoiado pela IA, mas a extração de competências: outros LLMs não são treinados com dados brutos, mas utilizam o resultado dos LLMs existentes.
Classificação com falsos positivos
A destilação pode ser legítima, como a criação de uma versão mais compacta do LLM, ou ataque. Em fevereiro, a Anthropic acusou os concorrentes chineses Deepthink, Minimax e Moonshot de atacar Claude por meio de destilação em grande escala. Eles fizeram 16 milhões de tentativas de destilação usando mais de 24 mil contas de usuários falsas. A Antrópico quer acabar com isso.
Esta é uma das razões pelas quais LLMs menores (“classificadores”) monitoram a entrada do usuário. Isso não é fundamentalmente novo, mas o Fable 5 é lançado de uma nova maneira: se o classificador considerar a entrada suspeita, ele não se recusa a processar, mas muda para a variante antiga Claude Opus 4.8. Isso também deve ser exibido ao usuário.
Houve reclamações online sobre rebaixamentos para questões inócuas, como interpretação de exames de sangue. Esses falsos positivos levaram a acusações de que a Anthropic não estava usando isso apenas como medida de segurança, mas também para esconder a sobrecarga do servidor. Opus 4.8 requer menos poder de computação que o Fable 5.
No futuro, é provável que existam pelo menos quatro versões do mesmo Claude Mythos: uma versão completa para as autoridades dos EUA, uma para empresas de TI selecionadas com menos restrições em questões de segurança, uma para cientistas selecionados com menos restrições biológicas e químicas, e a Fábula 5 para o público pagante em geral.
Leia mais depois do anúncio
Preços duplos
Claude Fable 5 geralmente não está incluído na assinatura de Claude. Clientes (Pro, Max, Team e com contrato Enterprise cobrado de acordo com o número de contas) só podem experimentar o Fable 5 por 14 dias, mas usar o dobro do número de limites de uso. A partir de 23 de junho, Fable 5 será cobrado exclusivamente com base na quantidade de tokens.
Os preços dos tokens (cada um em dólares americanos) são duas vezes mais altos que os de Claude Opus 4.8 e, portanto, correspondem à sua versão rápida: 10 dólares por milhão de tokens de entrada, 12,50 dólares por milhão de tokens de gravação em cache (5 minutos), 20 dólares por milhão de tokens de gravação de cache (1 hora), 1 dólar por milhão de tokens lidos do cache, dólares por milhão, e 5 de saída por milhão de tokens lidos do cache, dólares por milhão, e 5 saídas por milhão de tokens lidos de os dólares do cache e milhões de tokens.
Folheto de 300 páginas
Assuntos antrópicos Claude Mythos 5 e Fable 5 para treze benchmarks selecionados. De acordo com a tabela publicada, o novo LLM superou tudo o que foi visto anteriormente em onze benchmarks. Para os dois restantes, está um pouco atrás da variante Claude Mythos Preview. A classificação é menos rigorosa.
Referências por provedor
(Lance: Antrópico)
A Anthropic está particularmente orgulhosa do desempenho do novo LLM em reconhecimento de imagens: “Fable 5 é o estado da arte para tarefas que também envolvem visão. Ele pode extrair números exatos de diagramas científicos detalhados e executar tarefas complexas dependendo de imagens, incluindo a recriação do código-fonte de aplicações web a partir de imagens”, disse o anúncio. Fable 5 também joga jogos de computador melhor do que a versão anterior de Claude.
Mas a Opus ainda está à frente em pelo menos uma área: Mythos 5 e Fable 5 são mais alucinantes em alguns testes. O cartão do sistema, que na verdade é um livro de 319 páginas, revela isso e muito mais.
(d.s.)



