Evolução do Chatbot Grok da xAI: Adicionando Entradas Multimodais
A Evolução do Chatbot Grok da xAI: Adicionando Entradas Multimodais
A empresa de inteligência artificial (IA) de Elon Musk, a xAI, está fazendo progressos na adição de entradas multimodais ao seu chatbot Grok, de acordo com documentos públicos de desenvolvedores. Isso significa que, em breve, os usuários poderão enviar fotos para o Grok e receber respostas baseadas em texto.
Avanços no Grok 1.5V
Em um post no blog do mês passado, a xAI anunciou que o Grok-1.5V oferecerá “modelos multimodais em uma série de domínios”. Os documentos mais recentes dos desenvolvedores parecem mostrar progresso no lançamento de um novo modelo. Um script de exemplo em Python demonstra como os desenvolvedores podem usar a biblioteca do kit de desenvolvimento de software da xAI para gerar uma resposta com base em texto e imagens.
Grok: Uma Atualização Significativa
Esta é uma grande atualização para o Grok, que a xAI lançou pela primeira vez em novembro de 2023 e está disponível para usuários que pagam pela assinatura X Premium Plus. A última atualização foi o Grok 1.5 em março, que veio com capacidades de raciocínio aprimoradas.
Comparação com Concorrentes
A xAI, fundada por Elon Musk em março de 2023, é relativamente nova no campo da IA e fica atrás de concorrentes como o ChatGPT da OpenAI. No entanto, de acordo com um post no blog da xAI, o modelo Grok 1.5 está fechando a lacuna com o GPT-4 em vários benchmarks que abrangem uma ampla gama de problemas de competição do ensino fundamental ao ensino médio.
Conclusão
A adição de capacidades multimodais ao chatbot Grok da xAI é um passo importante na evolução dos chatbots conversacionais. Essa atualização coloca o Grok em uma posição mais competitiva em relação a outros modelos de IA avançados, como o GPT-4 da OpenAI. À medida que a tecnologia de IA continua a avançar, é provável que os chatbots multimodais se tornem cada vez mais comuns e úteis para os usuários.
Referências
Robison, K. (2024). Elon Musk’s AI company, xAI, is making progress on adding multimodal inputs to its Grok chatbot. The Verge.