Ferret: Apple lança LLM multimodal e de código aberto

Ferret: Apple lança LLM multimodal e de código aberto

A revolução tecnológica no campo da Inteligência Artificial (IA) tem sido marcada por avanços notáveis e surpresas inesperadas. Entre esses desenvolvimentos, destaca-se o lançamento do modelo “Ferret” pela Apple, um marco significativo na jornada da empresa em IA.

Este modelo Large Language Model (LLM) multimodal e de código aberto representa uma virada de jogo, não apenas pela sua capacidade técnica avançada, mas também por simbolizar uma mudança na abordagem tradicionalmente fechada da Apple no desenvolvimento de novas tecnologias.

Em um campo dominado por gigantes como Google e Microsoft, a Apple, com seu modelo Ferret, está se posicionando de maneira audaciosa, desafiando as normas estabelecidas e abrindo novos caminhos para a integração de IA em dispositivos e sistemas. Este artigo explora as facetas multifacetadas do Ferret, analisando suas características, capacidades, e o potencial impacto no cenário tecnológico global.

 

Lançamento Silencioso do Ferret pela Apple

Em um movimento quase imperceptível, a Apple entrou no cenário da IA de código aberto com o lançamento do Ferret em outubro de 2023. Este passo é notavelmente raro para a Apple, conhecida por manter seus projetos de desenvolvimento sob estrito sigilo. O modelo Ferret, um LLM multimodal e de código aberto, foi uma surpresa para muitos no campo da tecnologia.

Embora tenha sido lançado com uma licença não comercial, direcionando seu uso principalmente para pesquisa, a chegada do Ferret simboliza uma mudança significativa na estratégia da Apple. Este lançamento não apenas marca a entrada da empresa no domínio de IA de código aberto, mas também indica uma possível abertura em suas práticas de desenvolvimento de tecnologia, um campo que está se tornando cada vez mais colaborativo e aberto​​.

 

Parceria com Universidades

A colaboração da Apple com instituições acadêmicas de renome, especificamente a Universidade de Columbia e Cornell University, foi crucial no desenvolvimento do modelo Ferret. Esta parceria representa um alinhamento estratégico entre a indústria e a academia, essencial para inovações de ponta em IA.

Ao unir forças com pesquisadores dessas universidades, a Apple conseguiu combinar sua expertise tecnológica com insights acadêmicos, resultando em um modelo LLM de alta qualidade e multifuncional. Este modelo não só beneficia a comunidade científica, mas também sinaliza um compromisso da Apple com a pesquisa colaborativa e inovadora, algo que pode redefinir as fronteiras do desenvolvimento em IA​​​​​​.

 

Características do Modelo Ferret

O modelo Ferret da Apple é uma demonstração impressionante de inovação em IA, oferecendo duas versões com tamanhos distintos de 7 e 13 bilhões de parâmetros. Essa diferenciação permite uma flexibilidade notável no uso do modelo, adequando-se a uma variedade de necessidades e escalas de pesquisa.

Características do Modelo Ferret
Características do Modelo Ferret

A inclusão de código e pesos para uso exclusivo em pesquisas reflete a intenção da Apple de contribuir para o avanço científico na área de IA, ao mesmo tempo que mantém um foco na aplicação prática e na inovação. O modelo Ferret, com suas características avançadas, representa um passo significativo para a Apple no campo competitivo da IA, mostrando a capacidade da empresa de criar soluções de IA que são tanto poderosas quanto flexíveis​​.

 

Capacidades Multimodais e Análise de Imagens

O modelo Ferret se destaca por suas capacidades multimodais, especialmente na análise de imagens. Ele pode examinar regiões de imagens de qualquer forma, demonstrando um entendimento preciso de pequenas áreas, superando inclusive modelos como o GPT-4V nesta capacidade.

A flexibilidade do Ferret em analisar e identificar elementos em imagens torna-o uma ferramenta poderosa para tarefas como buscas visuais. Essa habilidade de discernir detalhes em imagens e fornecer informações contextuais abre novas possibilidades para aplicações em inteligência artificial, destacando o Ferret como uma inovação notável no campo da IA multimodal​​​​.

 

Comparação com Outros Modelos de IA

O modelo Ferret representa um avanço significativo em relação a outros modelos de IA, particularmente em sua capacidade de reconhecer elementos em pequenas seções de imagens. Isso é evidenciado pela sua comparação com o GPT-4V, onde o Ferret demonstra superioridade nesse aspecto.

Esta capacidade aprimorada destaca este modelo não apenas como uma ferramenta de pesquisa valiosa, mas também como um indicativo do potencial crescente da Apple no desenvolvimento de tecnologias de IA inovadoras. A habilidade do Ferret de processar e entender detalhes visuais com maior precisão é um marco notável, colocando-o em uma posição de destaque entre os modelos de IA atuais​​​​.

 

Treinamento e Dados do Ferret

A robustez do modelo Ferret é em grande parte atribuída ao seu extenso treinamento com 1,1 milhão de amostras que continham informação hierárquica espacial. Além disso, cerca de 95 mil dados negativos foram utilizados para aprimorar a precisão do modelo.

Essa abordagem de treinamento contribuiu significativamente para a eficácia do Ferret, permitindo-lhe alcançar resultados superiores em comparação com modelos concorrentes. A capacidade do Ferret de descrever detalhes de imagens com precisão e minimizar a confusão de objetos é um testemunho do sucesso dessa metodologia de treinamento​​.

 

Estratégia da Apple e Concorrência no Campo da IA

O lançamento do Ferret em código aberto representa uma jogada estratégica da Apple, refletindo seu esforço para se posicionar firmemente no competitivo mundo da IA. Esta decisão pode ser vista como uma resposta à liderança estabelecida de empresas como OpenAI e Anthropic.

A Apple, enfrentando limitações em sua própria infraestrutura para alimentar Large Language Models (LLMs) em larga escala, optou por uma abordagem aberta, diferentemente de suas práticas anteriores mais reservadas. Este movimento não apenas impulsiona a inovação interna, mas também possibilita uma maior colaboração e avanço no campo da IA​​.

 

Reação da Comunidade e Potencial Futuro

A disponibilização do Ferret em código aberto gerou surpresa e interesse considerável na comunidade de IA e aprendizado de máquina. A ferramenta, sendo treinada com o uso de avançadas placas gráficas e memória, tem potencial para evoluir significativamente nos próximos meses.

Reação da Comunidade e Potencial Futuro

Apesar de sua licença atual ser para uso não comercial, futuros desenvolvimentos podem permitir a adaptação do Ferret para uso em dispositivos como iPhones, iPads, Macs, e outros produtos da Apple. Essa estratégia, embora diferente do usual para a Apple, abre caminho para avanços significativos e colaboração mais ampla em pesquisas com o Ferret​​.

 

Acesso ao Código e Comunidade de Desenvolvedores

O código deste modelo está disponível no GitHub, oferecendo aos desenvolvedores e pesquisadores uma oportunidade valiosa de explorar e contribuir para essa inovação em IA. Esta abertura não só fomenta a pesquisa e o desenvolvimento na comunidade de IA, mas também estimula a colaboração e o compartilhamento de conhecimento.

Com o código do Ferret acessível publicamente, espera-se um crescimento em aplicações e experimentações, potencializando avanços significativos na aplicação prática de IA e no desenvolvimento de novas tecnologias​​.

 

Avanços em Execução Local de LLMs em Dispositivos Apple

A Apple também tem feito progressos significativos para possibilitar a execução de modelos LLM, como o Ferret, diretamente em dispositivos como iPhones e iPads. Esta inovação permitiria o acesso a tecnologias de IA avançadas sem a necessidade de conexão com serviços na nuvem, oferecendo maior autonomia e velocidade de processamento.

Este avanço reflete o compromisso contínuo da Apple em melhorar a funcionalidade e a eficiência de seus dispositivos, prometendo uma nova era de experiências imersivas e aplicações de IA diretamente nas mãos dos usuários​​.

Sumário

Picture of Janderson de Sales

Janderson de Sales

Sou um Especialista WordPress, com formação em Tecnologia da Informação e Professor de Física pela Universidade Federal de Rondônia. Trabalho com produção de conteúdo para blogs, desenvolvimento e manutenção de sites WordPress, e sou um entusiasta de tecnologias de inteligência artificial. Tenho conhecimento em produção de imagens de alta qualidade em plataformas de IAs generativas de imagens e possuo habilidades em SEO e desenvolvimento web. Estou comprometido em oferecer soluções inovadoras e eficazes para atender às necessidades do mercado digital.