Imagem: Gemini, IA do Google, foi desenvolvida para ser flexível e funcionar de data centers a celulares com versões Ultra, Pro e Nano/Divulgação/Google

O Google lançou nesta quarta-feira (6) o Gemini, modelo de inteligência artificial (IA) que é tratado pela empresa como o mais poderoso já criado por sua equipe. Ele funciona como o “motor” do Bard (concorrente do ChatGPT), mas, por enquanto, está disponível apenas em inglês.

A exemplo do ChatGPT, o Bard é um chatbot (robô conversador): funciona como uma página de bate-papo. Baseado em aprendizado de máquina (“machine learning”, em inglês)., ele é capaz de “imitar” humanos ao fornecer respostas a perguntas feitas pelos usuários. Para gerar mensagens com as informações solicitadas, essas ferramentas usam uma infinidade de textos disponíveis na internet.

O Gemini também poderá ser usado por outros aplicativos e, na prática, vai competir com ferramentas como o GPT-4, o modelo de IA da OpenAI usado no ChatGPT. Segundo o Google, o Gemini superou a capacidade humana em um teste de conhecimento e solução de problemas que combina 57 temas, incluindo matemática, física e história. A empresa também diz que ele se saiu melhor nesse teste do que o GPT-4.

O Google informa que a abordagem para desenvolver o Gemini foi um pouco diferente da adotada em outros modelos de inteligência artificial multimodais, isto é, que conseguem entender ao mesmo tempo diferentes formatos de mensagens, como textos, imagens, áudios e códigos.

O que o Gemini pode fazer?
Segundo o Google, o Gemini será útil em tarefas que exigem mais capacidade de raciocínio. Ele poderá ser usado tanto para ajudar programadores com códigos complexos quanto estudantes com a lição de casa, por exemplo.
Em uma demonstração divulgada pela empresa, o Gemini serviu para analisar a foto de um exercício de física e identificar um erro no cálculo (veja acima). Graças a essa IA, foi possível encontrar a solução correta. Ela também criou problemas semelhantes para o usuário tentar resolver.

Como o Gemini funciona?
O Gemini é o modelo de IA mais flexível já desenvolvido pelo Google. A ideia é que ele consiga rodar tanto em infraestruturas grandes, como as de data centers, quanto em dispositivos mais limitados, como celulares.

Para atender a esse objetivo, a nova inteligência artificial terá três versões:
⚡ Gemini Ultra: maior e mais poderoso, voltado para tarefas altamente complexas – será liberado apenas em 2024.
? Gemini Pro: voltado para rodar uma ampla gama de tarefas e atender a usuários, a partir desta quarta-feira no Bard, e a desenvolvedores, a partir de 13 de dezembro.
? Gemini Nano: vai rodar diretamente nos dispositivos móveis para os quais foi criado, o que lhe permite funcionar mesmo quando não há internet – disponível no Pixel 8 Pro, o celular do Google, para criar resumos de áudios e sugerir respostas inteligentes no WhatsApp.

Fonte: G1