Nos últimos dias, surgiram algumas notícias importantes sobre a IA, e em particular os modelos generativos.
Os modelos generativos baseados em IA são utilizados principalmente para imagens, além de vídeos e textos, e estão se tornando cada vez mais realistas.
Summary
Modelos generativos de IA mais potentes: as últimas notícias
Uma notícia importante a respeito é a da Stability AI, que anunciou o lançamento do Stable Diffusion 3.5, modelo de geração de imagens AI open source.
Trata-se de uma versão aberta que inclui múltiplas variantes altamente personalizáveis com base nas suas dimensões, executáveis em hardware de consumidor e gratuitas para uso tanto comercial quanto não comercial, de acordo com a licença permissiva Stability AI Community License.
É possível baixar Stable Diffusion 3.5 Large e Stable Diffusion 3.5 Large Turbo do Hugging Face, incluindo o código no GitHub. Stable Diffusion 3.5 Medium, por sua vez, será lançado em 29 de outubro.
Stable Diffusion 3.5
Stable Diffusion 3.5 é o modelo generativo AI mais poderoso criado até agora pela Stability AI.
Em junho, tinham lançado Stable Diffusion 3 Medium, a primeira versão aberta da série Stable Diffusion 3, que, no entanto, não tinha atendido plenamente às expectativas da comunidade.
Assim, após ouvir o feedback da própria comunidade, a Stability AI desenvolveu uma nova versão para avançar na sua missão de transformar os media visuais.
Stable Diffusion 3.5 quer fornecer aos criadores ferramentas amplamente acessíveis, de ponta e gratuitas para a maioria dos casos de uso, e oferece uma variedade de modelos desenvolvidos para atender às necessidades de pesquisadores científicos, hobbistas, startups e empresas.
Esta versão é um dos modelos generativos de imagens baseados em IA mais personalizáveis e acessíveis no mercado, com no entanto ao mesmo tempo desempenho de alto nível em termos de pronta aderência e qualidade da imagem.
Notícias AI e atualizações no campo dos modelos generativos: a gestão autônoma do mouse e do teclado
Mas há também mais alguma coisa.
Anthropic anunciou o lançamento de uma nova versão beta do seu modelo baseado em IA, Claude, que permitirá aos desenvolvedores que trabalham com a API assumir até mesmo o controle do cursor do mouse, para clicar em botões e campos e inserir texto de forma autônoma.
Esta atualização permite que os desenvolvedores indiquem a Claude para usar os computadores como fazem as pessoas, ou seja, olhando para uma tela, movendo um cursor, clicando nos botões e digitando texto. Segundo a Anthropic, Claude 3.5 Sonnet é o primeiro modelo de IA a oferecer o uso do computador na beta pública, embora nesta fase ainda seja experimental a ponto de ser às vezes complicado e sujeito a erros.
Já estão experimentando esta nova funcionalidade Asana, Canva, Cognition, DoorDash, Replit e The Browser Company.
A atualização do Claude 3.5 Sonnet está disponível para todos os usuários.
Notizie negative
No entanto, não há apenas notícias positivas sobre o desenvolvimento dos modelos generativos de AI.
Por exemplo, a Penguin Random House (PRH) introduziu uma nova declaração nas páginas de direitos autorais, tanto dos livros novos quanto dos reimpressos, na qual se afirma que nenhuma parte de seus livros pode ser utilizada ou reproduzida de qualquer forma com o objetivo de treinar tecnologias ou sistemas de inteligência artificial.
PRH é o maior editor comercial do mundo, e portanto poderia servir de exemplo deste ponto de vista.
A declaração cita uma diretiva do Parlamento Europeu, e visa proibir o uso dos seus textos pelas empresas de inteligência artificial para o desenvolvimento de chatbots e outras ferramentas digitais.
Por outro lado, nos EUA já surgiram vários casos de violação de direitos autorais nesse sentido, tanto que muitos livros já foram utilizados sem autorização para treinar ferramentas de inteligência artificial.
PRH é o primeiro entre os Big Five dos editores comerciais anglófonos a modificar suas informações sobre o copyright para tais fins.
Acelerações e frenagens
Como acontece praticamente sempre, um novo setor em rápida expansão produz fortes acelerações e grandes travagens.
O problema nestes casos é que as acelerações poderiam levá-lo muito à frente, tanto que as frenagens poderiam apenas desacelerar a aceleração sem conseguir pará-la.
No entanto, nem tudo que reluz é ouro, e em todas as evoluções há sempre também um componente de destruição.
Neste caso, o risco é o de destruir o modelo de negócio de alguns entre aqueles que produzem informação, e de fazê-lo recorrendo de fato ao roubo da propriedade intelectual.
Não é nem mesmo dito que os legisladores sejam capazes de acompanhar essas rápidas evoluções, portanto pode levar algum tempo antes que todas as questões mais delicadas sejam examinadas, e talvez resolvidas.
O que é claro, porém, é que não se trata apenas de uma moda, ou de um fogo de palha, mas de um daqueles grandes saltos em frente que levou a sociedade humana a dominar incontestada este mundo.