Evolução Do Chatbot Grok Da xAI: Adicionando Capacidades Multimodais
A Evolução do Chatbot Grok da xAI: Adicionando Capacidades Multimodais
A xAI, a empresa de inteligência artificial (IA) fundada por Elon Musk, está fazendo progressos significativos em relação à adição de entradas multimodais ao seu chatbot Grok. Isso significa que, em breve, os usuários poderão enviar fotos para o Grok e receber respostas baseadas em texto.
Grok-1.5V: Modelos Multimodais em Diversos Domínios
De acordo com documentos públicos de desenvolvedores, a atualização mais recente do Grok, a versão 1.5V, trará “modelos multimodais em uma série de domínios”. Isso foi inicialmente mencionado em um post no blog da xAI no mês passado.
Os documentos de desenvolvedores mais recentes parecem mostrar progresso no lançamento de um novo modelo. Um script de exemplo em Python demonstra como os desenvolvedores podem usar a biblioteca do kit de desenvolvimento de software (SDK) da xAI para gerar uma resposta com base em texto e imagens.
Grok: Uma Atualização Significativa
Essa é uma atualização significativa para o Grok, que a xAI lançou pela primeira vez em novembro de 2023 e está disponível para usuários que pagam pela assinatura X Premium Plus. A última atualização foi o Grok 1.5, lançado em março, que trouxe melhorias nas capacidades de raciocínio.
Treinamento do Modelo Grok
De acordo com um post no blog da X, o modelo Grok é treinado “em uma variedade de dados de texto de fontes públicas disponíveis na Internet até o terceiro trimestre de 2023 e conjuntos de dados revisados e curados por … revisores humanos”. O Grok-1 não foi treinado em dados da X (incluindo postagens públicas da X), mas tem “conhecimento em tempo real do mundo”, incluindo postagens na X.
Grok vs. Concorrentes
Apesar de ser relativamente nova no campo da IA, a xAI está se aproximando de seus concorrentes, como o ChatGPT da OpenAI, em vários benchmarks que abrangem uma ampla gama de problemas de competição do ensino fundamental ao ensino médio, de acordo com um post no blog da xAI.
No entanto, é importante observar que os benchmarks para grandes modelos de linguagem são frequentemente criticados, pois os modelos podem se sair bem nesses testes se os dados de treinamento incluírem os próprios benchmarks.
Conclusão
A adição de capacidades multimodais ao chatbot Grok da xAI é um passo importante em direção à próxima fronteira da IA conversacional. Essa atualização coloca o Grok em uma posição mais competitiva em relação a modelos como o GPT-4 da OpenAI e os avanços anunciados na Google I/O. À medida que a IA multimodal continua a evoluir, a xAI está se posicionando para se destacar nesse campo em rápida expansão.
Referências
Robison, K. (2024). Elon Musk’s AI company, xAI, is making progress on adding multimodal inputs to its Grok chatbot. The Verge.