Dados sintéticos vão complementar o mundo real

Contribuição: Profª. Paula Chimenti

Celebrados na década passada como o novo petróleo, os dados estão começando a padecer de agruras similares às de seu “correlato” econômico. Em primeiro lugar, sua coleta é cara. Estão menos disponíveis do que parecia e seu uso enfrenta questões como privacidade ou segredos concorrenciais. Outro paralelo é a finitude: apesar da abundância, a produção de novos dados não segue a mesma velocidade do desenvolvimento das tecnologias de inteligência artificial (IA) que os consomem, particularmente a IA generativa (GenAI), capaz de entender comandos e produzir conteúdos em linguagem natural.

(…)

Mais uma é o uso de redes generativas adversariais (GAN), com treinamento de duas redes para “competirem” entre si – uma introduz pequenas modificações nos dados e outra as identifica até validar os dados como “autênticos”.

(…)

As técnicas são usadas no C4IA para, por exemplo, compensar a falta de registros originais no estudo de línguas indígenas. Em pesquisa científica, marcada por escassez de dados, algoritmos podem ser treinados para obtenção de respostas com índices de confiança semelhantes aos levantamentos com pessoas reais. Outro exemplo visa empregar dados sintéticos em lugar de especialistas responsáveis por informações para o Global Entrepreneurship Monitor (GEM), que classifica países segundo condições de empreendedorismo e cujo custo deixa de fora os mais pobres, diz Paula Chimenti, professora e coordenadora do Centro de Estudos em Estratégia e Inovação do Coppead/UFRJ.

(…)

Acesse o artigo na íntegra clicando aqui.

Veja todas as nossas notícias clicando aqui.

Rolar para cima
Scroll to Top