A Google acaba de anunciar o lançamento do Gemini, o seu mais recente modelo de Inteligência Artificial (IA) multimodal, posicionando-se como um forte concorrente do GPT-4 da OpenAI.
Este avanço representa um marco significativo no campo da IA, prometendo transformações profundas no modo como interagimos com a tecnologia.
O que torna o Gemini único?
O Gemini destaca-se por ser um modelo multimodal, capaz de processar e gerar diferentes formas de média, incluindo texto, imagem e áudio.
Esta característica multimodal permite uma interação mais natural e intuitiva com os utilizadores, abrindo portas para uma ampla gama de aplicações.
Pontuação histórica em benchmarks
Um dos aspetos mais impressionantes do Gemini é a sua capacidade de superar a performance humana em benchmarks fundamentais, alcançando 90% no MMLU (Massive Multitask Language Understanding).
Este feito histórico sublinha a eficácia e a sofisticação do modelo.
As três versões do Gemini
O Gemini será disponibilizado em três versões:
- Gemini Ultra: destinado a tarefas complexas e de alto nível, ideal para entidades empresariais.
- Gemini Pro: um equilíbrio perfeito entre potência e leveza, adequado para tarefas avançadas e start-ups.
- Gemini Nano: a versão mais compacta e eficiente, perfeita para tarefas de IA em dispositivos, como no Google Pixel 8.
A implementação do Gemini será faseada. Inicialmente, a versão “fine-tuned” do Gemini Pro será integrada ao Bard, seguida pelo lançamento do Gemini Nano no Pixel 8 Pro. O Gemini Ultra está previsto para lançamento no início do próximo ano.
O futuro com Gemini
Com o Gemini, a Google não só reforça a sua posição como líder em tecnologia de IA, mas também molda o futuro da interação humana com a inteligência artificial.
Este desenvolvimento promete revolucionar a forma como utilizamos e percebemos a tecnologia no nosso dia a dia.
Deixa um comentário