Folha de Truques e Dicas do Algoritmo de Machine Learning para o estruturador do Azure Machine Learning

A Folha de Truques e Dicas do Algoritmo do Azure Machine Learning ajuda-o a escolher o algoritmo certo do estruturador para um modelo de análise preditiva.

Nota

Designer suporta dois tipos de componentes, componentes pré-criados clássicos (v1) e componentes personalizados (v2). Estes dois tipos de componentes NÃO são compatíveis.

Os componentes pré-criados clássicos fornecem componentes pré-criados principalmente para o processamento de dados e tarefas tradicionais de machine learning, como regressão e classificação. Este tipo de componente continua a ser suportado, mas não terá novos componentes adicionados.

Os componentes personalizados permitem-lhe moldar o seu próprio código como um componente. Suporta a partilha de componentes entre áreas de trabalho e criação totalmente integrada nas interfaces Studio, CLI v2 e SDK v2.

Para novos projetos, sugerimos vivamente que utilize um componente personalizado, que é compatível com o AzureML V2 e continuará a receber novas atualizações.

Este artigo aplica-se a componentes pré-criados clássicos e não é compatível com a CLI v2 e o SDK v2.

O Azure Machine Learning tem uma grande biblioteca de algoritmos da classificação, sistemas recomendadores, clustering, deteção de anomalias, regressão e famílias de análise de texto . Cada um deles foi concebido para resolver um problema de machine learning diferente.

Para obter mais informações, veja Como selecionar algoritmos.

Transferir: Folha de Truques e Dicas do Algoritmo de Machine Learning

Transfira a folha de truques e dicas aqui: Machine Learning Algorithm Cheat Sheet (11x17 in.)

Folha de Truques e Dicas do Algoritmo de Machine Learning: saiba como escolher um algoritmo de Machine Learning.

Transfira e imprima a Folha de Truques e Dicas do Algoritmo de Machine Learning no tamanho dos tablóides para a manter à mão e obter ajuda para escolher um algoritmo.

Como utilizar a Folha de Truques e Dicas do Algoritmo de Machine Learning

As sugestões oferecidas nesta folha de truques e dicas de algoritmos são regras aproximadas de polegar. Alguns podem ser dobrados, e outros podem ser flagrantemente violados. Esta folha de truques e dicas destina-se a sugerir um ponto de partida. Não tenha medo de executar uma concorrência frente a frente entre vários algoritmos nos seus dados. Não há simplesmente nenhum substituto para compreender os princípios de cada algoritmo e o sistema que gerou os seus dados.

Cada algoritmo de machine learning tem o seu próprio estilo ou preconceito indutivo. Para um problema específico, vários algoritmos podem ser adequados e um algoritmo pode ser mais adequado do que outros. Mas nem sempre é possível saber antecipadamente, que é o melhor ajuste. Em casos como estes, vários algoritmos são listados em conjunto na folha de truques e dicas. Uma estratégia adequada seria experimentar um algoritmo e, se os resultados ainda não forem satisfatórios, experimente os outros.

Para saber mais sobre os algoritmos no estruturador do Azure Machine Learning, aceda à Referência de algoritmos e componentes.

Tipos de machine learning

Existem três categorias principais de machine learning: aprendizagem supervisionada, aprendizagem não supervisionada e aprendizagem por reforço.

Aprendizagem supervisionada

Na aprendizagem supervisionada, cada ponto de dados é etiquetado ou associado a uma categoria ou valor de interesse. Um exemplo de uma etiqueta categórica é atribuir uma imagem como um "gato" ou um "cão". Um exemplo de uma etiqueta de valor é o preço de venda associado a um carro usado. O objetivo da aprendizagem supervisionada é estudar muitos exemplos etiquetados como estes e, em seguida, conseguir fazer predições sobre pontos de dados futuros. Por exemplo, identificar novas fotografias com o animal correto ou atribuir preços de venda precisos a outros carros usados. Este é um tipo de machine learning popular e útil.

Aprendizagem não supervisionada

Na aprendizagem não supervisionada, os pontos de dados não têm etiquetas associadas. Em vez disso, o objetivo de um algoritmo de aprendizagem não supervisionado é organizar os dados de alguma forma ou descrever a sua estrutura. A aprendizagem não supervisionada agrupa dados em clusters, tal como o K-means, ou encontra diferentes formas de analisar dados complexos para que pareçam mais simples.

Aprendizagem por reforço

Na aprendizagem por reforço, o algoritmo pode escolher uma ação em resposta a cada ponto de dados. É uma abordagem comum na robótica, em que o conjunto de leituras de sensores a certa altura é um ponto de dados e o algoritmo tem de escolher a próxima ação do robô. Também é uma opção natural para aplicações da Internet das Coisas. O algoritmo de aprendizagem também recebe um sinal de recompensa pouco tempo depois, indicando quão boa foi a decisão. Com base neste sinal, o algoritmo modifica a sua estratégia para obter a recompensa mais alta.

Passos seguintes