Alibaba Lança Novos Modelos de IA para Controlar PCs e Smartphones
Alibaba lança novos modelos de IA capazes de controlar PCs e smartphones
O time Qwen da Alibaba lançou recentemente uma nova família de modelos de IA, o Qwen2.5-VL, capaz de realizar diversas tarefas de análise de texto e imagem. Esses modelos podem analisar arquivos, entender vídeos, contar objetos em imagens e até controlar um PC, mostrando-se competitivos em relação a outros modelos de empresas renomadas.
Qwen2.5-VL: Desempenho superior em diversas áreas
De acordo com os benchmarks do time Qwen, o melhor modelo Qwen2.5-VL supera concorrentes como o GPT-4o da OpenAI, o Claude 3.5 Sonnet da Anthropic e o Gemini 2.0 Flash do Google em avaliações de compreensão de vídeos, matemática, análise de documentos e perguntas e respostas. Além disso, o Qwen2.5-VL pode analisar gráficos, extrair dados de digitalizações de faturas e formulários, e compreender vídeos longos, entre outras capacidades.
Restrições e recursos interessantes do Qwen2.5-VL
Por ser uma IA desenvolvida por uma empresa chinesa, o Qwen2.5-VL possui restrições em relação aos tópicos que pode discutir, seguindo diretrizes do regulador da internet chinês. No entanto, destaca-se a capacidade do modelo de interagir com softwares em computadores e dispositivos móveis, como demonstrado em um vídeo em que o Qwen2.5-VL controla aplicativos em um desktop Linux.
Disponibilidade e licenças dos modelos Qwen2.5-VL
Os modelos menores da série Qwen2.5-VL, Qwen2.5-VL-3B e Qwen2.5-VL-7B, estão disponíveis sob uma licença permissiva. Já o modelo principal, Qwen2.5-VL-72B, possui uma licença personalizada da Alibaba, exigindo permissão para uso comercial em empresas e desenvolvedores com mais de 100 milhões de usuários ativos mensais.
Referências
Fonte: TechCrunch