Aprendizado de máquina automatizado - Automated machine learning
Parte de uma série sobre |
Aprendizado de máquina e mineração de dados |
---|
Aprendizado de máquina automatizado ( AutoML ) é o processo de automatizar as tarefas de aplicação do aprendizado de máquina a problemas do mundo real. O AutoML cobre o pipeline completo, desde o conjunto de dados bruto até o modelo de aprendizado de máquina implantável. O AutoML foi proposto como uma solução baseada em inteligência artificial para o desafio cada vez maior de aplicar o aprendizado de máquina. O alto grau de automação do AutoML permite que não especialistas façam uso de modelos e técnicas de aprendizado de máquina sem exigir que se tornem especialistas em aprendizado de máquina. Automatizar o processo de aplicação de aprendizado de máquina de ponta a ponta também oferece as vantagens de produzir soluções mais simples, criação mais rápida dessas soluções e modelos que geralmente superam os modelos projetados à mão. O AutoML foi usado para comparar a importância relativa de cada fator em um modelo de predição.
Comparação com a abordagem padrão
Em um aplicativo típico de aprendizado de máquina, os profissionais têm um conjunto de pontos de dados de entrada a serem usados para treinamento. Os dados brutos podem não estar em uma forma que todos os algoritmos possam ser aplicados a eles. Para tornar os dados passíveis de aprendizado de máquina, um especialista pode ter que aplicar apropriado pré-processamento de dados , engenharia de recurso , extração de características e de seleção de métodos. Após essas etapas, os profissionais devem realizar a seleção do algoritmo e a otimização do hiperparâmetro para maximizar o desempenho preditivo de seu modelo. Cada uma dessas etapas pode ser desafiadora, resultando em obstáculos significativos para o uso do aprendizado de máquina.
O AutoML simplifica drasticamente essas etapas para não especialistas.
Alvos de automação
O aprendizado de máquina automatizado pode atingir vários estágios do processo de aprendizado de máquina. As etapas para automatizar são:
-
Preparação e ingestão de dados (de dados brutos e formatos diversos)
- Detecção de tipo de coluna ; por exemplo, booleano, numérico discreto, numérico contínuo ou texto
- Detecção de intenção de coluna; por exemplo, destino / rótulo, campo de estratificação , recurso numérico, recurso de texto categórico ou recurso de texto livre
- Detecção de tarefas; por exemplo, classificação binária , regressão , agrupamento ou classificação
-
Engenharia de recursos
- Seleção de recursos
- Extração de recursos
- Meta aprendizagem e transferência de aprendizagem
- Detecção e tratamento de dados distorcidos e / ou valores ausentes
- Seleção de modelo
- Otimização de hiperparâmetros do algoritmo de aprendizagem e caracterização
- Seleção de pipeline sob restrições de tempo, memória e complexidade
- Seleção de métricas de avaliação e procedimentos de validação
- Verificação de problemas
- Detecção de vazamento
- Detecção de configuração incorreta
- Análise dos resultados obtidos
- Criação de interfaces de usuário e visualizações
Veja também
Referências
Leitura adicional
- "Ferramentas AutoML de código aberto: AutoGluon, TransmogrifAI, Auto-sklearn e NNI" . Bizety . 2020-06-16.