Como a IA aprende, e a importância dos dados

Summary

V8.Innovation Labs - Soluções IA Driven

Matéria por Rodrigo Carvalho
Um conceito chave para o entendimento da IA e suas possibilidades, é o de aprendizagem.
  

Em 1959, Arthur Samuel definiu a Inteligência Artificial como “O campo de estudo que permite aos computadores terem a habilidade de aprender sem serem explicitamente programados”. 

O processo de aprendizagem é fundamental para a IA e suas aplicações. Entender como a IA aprende é importante para mapear as possibilidades e limites das soluções.  

A IA aprende com seus modelos sendo expostos a dados, muitos dados. Dados públicos e privados. Os privados são os que podem customizar a solução, e trazer um diferencial estratégico na aplicação das capacidades da IA. 

Vamos entender um pouco mais sobre as estratégias de aprendizagem e sobre a importância dos dados no uso da IA. 

As Estratégias de Aprendizagem:

A aprendizagem da IA conta com três principais estratégias: 

  • Aprendizado Supervisionado. Aprender com dados rotulados. 
  • Aprendizado Não Supervisionado. Aprender com dados não rotulados. 
  • Aprendizado por Reforço. Aprender com feedback com base na experimentação.  


1. APRENDIZADO SUPERVISIONADO 

Nesta abordagem, o modelo aprende recebendo como entrada um conjunto de dados com características definidas. Para cada entrada, um rótulo é fornecido e define a saída esperada. 

O modelo deve aprender a mapear as entradas para as saídas esperadas.  

Por exemplo, uma inteligência artificial que tem como objetivo prever o preço de imóveis com base nas suas características, pode ser treinado com um conjunto de dados, onde cada entrada define um imóvel com as suas características (localização, tamanho, materiais da casa, idade do imóvel, escolas próximas etc.). Neste caso, o rótulo é o preço do imóvel. Ao ser exposto a vários dados de imóveis e seus preços, a inteligência artificial aprende a prever o preço de um imóvel com base nas suas características.  

Após o treinamento, a IA estará preparada para responder quanto deve custar um imóvel dadas as suas características.   

O fato de o treinamento ser feito com dados rotulados (no nosso exemplo, com um conjunto para treinamento em que temos os preços das casas) define o conceito de supervisionado.  

Após o treinamento, o modelo pode ser usado para fazer previsões em novos dados não rotulados. 

Uma IA treinada com um número suficientemente grande de dados pode superar a capacidade humana em uma determinada tarefa, como já aconteceu para a capacidade de reconhecimento de imagens. 

Exemplos de aplicações: 

  • Reconhecimento de padrões em imagens. 
  • Identificar se o perfil de tráfego na rede configura um ataque hacker. 
  • Decidir se dado um perfil de cliente deve ter crédito autorizado. 
  • Concluir, com base nas últimas ações, um cliente está prestes a deixar a empresa. 
  • Concluir, com base nos comentários do cliente no site da empresa, se ele está satisfeito. 

2. APRENDIZADO NÃO SUPERVISIONADO 

A IA também pode nos ajudar a entender a informação através de insights, com a compreensão de padrões nos dados que ainda não entendemos, auxiliando também na tomada de decisões. 

Aqui entra o aprendizado não supervisionado.  

O modelo é treinado com dados de entrada não rotulados, ou seja, não informamos ao modelo o que esperamos da avaliação. Daí a classificação como não supervisionado. 

Por exemplo, digamos que queremos descobrir perfis de consumo de clientes, e temos dados do comportamento de compra de milhares de clientes em diversos canais. Ao passar estes dados para um modelo de aprendizado não supervisionado, as interações podem encontrar padrões estatísticos tais como grupos de clientes (clusters) com base em características similares e outras relações entre suas características.  

Podemos descobrir que clientes compram fraldas, também costumam comprar cerveja. Através de aplicações estatísticas sobre os dados, a IA aprendeu que esta é uma relação objetiva.  

Cabe ao usuário, ou processos automatizados, tomar decisões sobre os insights gerados. 

3. APRENDIZADO POR REFORÇO  

Aqui a chave para o treinamento e aprendizagem está no mecanismo de retorno (feedback) negativo ou positivo para uma determinada decisão do modelo. Este modelo de aprendizagem é comum para treinamento de robôs.  

Por exemplo, em um cenário em que um robô autônomo precisa navegar em um ambiente desconhecido, evitando obstáculos e alcançando um destino específico podemos usar o aprendizado por reforço.  

O robô pode ser treinado para aprender a executar ações de movimento e receber recompensas positivas quando chegar ao destino, e recompensas negativas quando colidir com obstáculos. Com o tempo, o robô aprende a navegar de forma mais eficiente e segura no ambiente. 

Nesse tipo de abordagem, o modelo aprende a tomar decisões em um ambiente dinâmico com o objetivo de maximizar uma recompensa acumulada ao longo do tempo. O robô interage com o ambiente, observando estados e realizando ações, recebendo feedback positivo ou negativo em resposta a suas ações.  

O aprendizado por reforço requer um sistema de recompensas para indicar o desempenho em uma tarefa. 

Conclusão:

Dentre as diferentes abordagens de aprendizado, o que temos em comum são os dados aos quais a IA precisa ser exposta para aprender. 

Ao pensar em uma solução de IA é importante refletir sobre o tipo de treinamento e quais dados serão usados para a solução em questão. 

Podemos adquirir soluções de IA treinadas com dados públicos e endereçar vários problemas. Mas com os dados privados temos a possibilidade de criar soluções de IA específicas a um contexto, e ter a possibilidade de uso estratégico por trazer diferenciação no que diz respeito à capacidade da IA.  

No caso dos negócios, é importante refletir sobre os dados: 

  • Quais dados a empresa possui? 
  • Quais são gerados pelos clientes e processos do negócio? 
  • Como os dados públicos podem complementar os dados internos da empresa? 
  • Qual é a capacidade da empresa de avaliar seus dados e explorar possibilidades de uso? 
  • Como selecionar as características mais relevantes dos dados disponíveis? 
  • Quais tecnologias são usadas para capturar, manter e disponibilizar os dados? 

E no seu caso, como sua organização está considerando os dados, que são ativos tão preciosos nesta era da IA? 

Rodrigo Carvalho é Gerente de Programação Sênior na V8.TECH.
Mais de 20 anos de experiência profissional em Gestão, TI e Telecomunicações. Graduado em Engenharia de Computação pela UNICAMP, com pós-graduação em administração pela FIA.