Microsoft Anuncia Nova Versão Do Modelo De Linguagem Phi-3 Com Capacidade De Análise Visual
Microsoft anuncia nova versão do modelo de linguagem Phi-3 com capacidade de análise visual
A Microsoft anunciou recentemente uma nova versão de seu modelo de linguagem de pequeno porte, o Phi-3, que agora possui a capacidade de analisar imagens e informar sobre seu conteúdo. O Phi-3-vision é um modelo multimodal, ou seja, pode ler tanto texto quanto imagens, e é especialmente útil para dispositivos móveis.
Phi-3-vision: um modelo visual poderoso em um pacote compacto
O Phi-3-vision é um modelo de 4,2 bilhões de parâmetros, o que o torna significativamente menor do que outros modelos de IA focados em imagens, como o DALL-E da OpenAI e o Stable Diffusion da Stability AI. Ao contrário desses modelos, o Phi-3-vision não gera imagens, mas pode entender e analisar o conteúdo de uma imagem para o usuário.
Essa abordagem de modelos de IA menores e mais leves está ganhando popularidade à medida que a demanda por serviços de IA mais acessíveis e eficientes em termos de recursos computacionais cresce. Modelos menores podem ser usados para alimentar recursos de IA em dispositivos como smartphones e laptops, sem a necessidade de ocupar muita memória do computador.
A família Phi-3: diferentes tamanhos para diferentes necessidades
Além do Phi-3-vision, a família Phi-3 inclui outros membros com diferentes tamanhos e capacidades:
Phi-3-mini
O menor modelo da família, com 3,8 bilhões de parâmetros, lançado em abril junto com o Phi-3-vision.
Phi-3-small
Um modelo um pouco maior, com 7 bilhões de parâmetros.
Phi-3-medium
O maior modelo da família, com 14 bilhões de parâmetros.
Essa diversidade de tamanhos permite que os desenvolvedores de IA escolham o modelo mais adequado para suas necessidades específicas, equilibrando capacidade e eficiência computacional.
Conclusão
A Microsoft continua a inovar no campo da inteligência artificial, lançando modelos cada vez mais avançados e eficientes. O Phi-3-vision, com sua capacidade de analisar imagens, é mais uma demonstração dessa evolução, oferecendo uma solução compacta e poderosa para aplicações móveis e de baixo consumo de recursos.
Referências
Notícia original: Microsoft anuncia nova versão do modelo de linguagem Phi-3 com capacidade de análise visual