Concorrente do ChatGPT? Conheça o StableLM

Laís E. Chaves
8 de mai. de 2023
3 min de leitura

A Stability AI lançou um novo modelo de linguagem de código aberto, o StableLM, o mais novo concorrente do tão famoso ChatGPT. A versão alfa do modelo está disponível em 3 bilhões e 7 bilhões de parâmetros, com modelos de 15 bilhões a 65 bilhões de parâmetros para seguir. Os desenvolvedores podem inspecionar, usar e adaptar livremente os modelos básicos do StableLM para fins comerciais ou de pesquisa, sujeitos aos termos da licença CC BY-SA-4.0.

Em 2022, a Stability AI impulsionou o lançamento público do Stable Diffusion, um modelo de imagem revolucionário que representa uma alternativa transparente, aberta e dimensionável à IA proprietária. Com o lançamento do conjunto de modelos StableLM, a Stability AI continua a tornar a tecnologia fundamental de IA acessível a todos. Os modelos StableLM podem gerar texto e código, alimentando uma série de aplicativos downstream. Eles demonstram como modelos pequenos e eficientes podem oferecer alto desempenho com treinamento adequado.

O lançamento do StableLM se baseia na experiência em modelos de linguagem anteriores de código aberto, como a EleutherAI, um centro de pesquisa sem fins lucrativos. Esses modelos de linguagem incluem GPT-J, GPT-NeoX e o conjunto Pythia, que foram treinados no conjunto de dados de código aberto The Pile. Muitos modelos de linguagem de código aberto recentes continuam a se basear nesses esforços, incluindo o Cerebras-GPT e o Dolly-2.

O StableLM é treinado em um novo conjunto de dados experimental baseado no The Pile, mas três vezes maior, com 1,5 trilhão de tokens de conteúdo. A riqueza desse conjunto de dados proporciona ao StableLM um desempenho surpreendentemente alto em tarefas de conversação e codificação, apesar de seu pequeno tamanho, de 3 a 7 bilhões de parâmetros (em comparação, o GPT-3 que tem 175 bilhões de parâmetros).

A Stability AI irá lançar também um conjunto de modelos de pesquisa com ajuste de instruções. Inicialmente, esses modelos ajustados usarão uma combinação de cinco conjuntos de dados recentes de código aberto para agentes de conversação: Alpaca, GPT4All, Dolly, ShareGPT e HH. Esses modelos ajustados destinam-se apenas ao uso em pesquisa e são lançados sob uma licença não comercial CC BY-NC-SA 4.0, alinhado com a licença Alpaca de Stanford.

Os modelos de linguagem formarão a espinha dorsal da economia digital dessa companhia, dando voz a todos por meio do design. Modelos como o StableLM demonstram compromisso com uma tecnologia de IA que seja transparente, acessível e solidária.

Transparente: O código-fonte dos modelos é aberto, para promover a transparência e fomentar a confiança. Os pesquisadores podem inclusive, "dar uma olhada nos bastidores", para verificar o desempenho, trabalhar em técnicas de interpretabilidade, identificar possíveis riscos e ajudar a desenvolver proteções. As organizações dos setores público e privado podem adaptar esses modelos de código aberto para seus próprios aplicativos sem compartilhar seus dados confidenciais ou abrir mão do controle de seus recursos de IA.

Acessível: O StableLM foi projetado de maneira que os usuários comuns possam executar os modelos em dispositivos locais. Usando esses modelos, os desenvolvedores podem criar aplicativos independentes compatíveis com hardware amplamente disponível, em vez de depender de serviços proprietários de outras empresas. Dessa forma, os benefícios econômicos da IA são compartilhados por uma ampla comunidade de usuários e desenvolvedores. O acesso aberto e detalhado aos modelos permite que a ampla comunidade acadêmica e de pesquisa desenvolva técnicas de interpretabilidade e segurança além do que é possível com modelos fechados.

Suporte: Os modelos foram criados para dar suporte aos usuários, não para substituí-los. O foco é o desempenho eficiente, especializado e prático da IA, e não a busca por uma 'inteligência divina'. Essas ferramentas ajudam pessoas comuns e empresas a usar a IA para liberar a criatividade, aumentar a produtividade e criar novas oportunidades econômicas.

Os modelos já estão disponíveis no repositório no GitHub, e a Stability IA promete lançar ainda mais modelos em breve, fomentando a democratização do acesso a tecnologia e a Inteligência Artificial de fácil acesso a todos.

Quer saber mais sobre Inteligência Artificial e suas Aplicações? Acesse já o nosso site!

https://www.engenhariahibrida.com.br/

Fonte: https://stability.ai/

São Paulo (SP)

São Paulo

Campinas

São José dos Campos

São Bernardo do Campo

Santos

Guarulhos

Sorocaba

São Carlos

Araraquara

Piracicaba

Rio de Janeiro (RJ)

Rio de Janeiro

Duque de Caxias

Volta Redonda,

Macaé

Campos dos Goytacazes

Minas Gerais (MG)

Belo Horizonte

Contagem

Betim

Ipatinga

Santa Rita do Sapucaí

Uberlândia

Juiz de Fora

Espírito Santo (ES)

Vitória

Serra

Vila Velha

Cariacica

Paraná (PR)

Curitiba

São José dos Pinhais

Araucária

Londrina

Maringá

Pato Branco

Santa Catarina (SC)

Florianópolis

Joinville

Blumenau

Itajaí

Jaraguá do Sul

Criciúma

Rio Grande do Sul (RS)

Porto Alegre

Caxias do Sul

Canoas

Santa Maria

Gravataí