O aprendizado de máquina é um campo da ciência da computação que dá aos sistemas de computador a capacidade de "aprender" (ou seja, melhorar progressivamente o desempenho em uma tarefa específica) com dados, sem serem explicitamente programados.
O nome Aprendizado de máquina foi cunhado em 1959 por Arthur Samuel. Evoluído a partir do estudo de reconhecimento de padrões e teoria de aprendizado computacional em inteligência artificial, o aprendizado de máquina explora o estudo e a construção de algoritmos que podem aprender e fazer previsões sobre os dados - tais algoritmos são superados seguindo instruções de programa estritamente estáticas, fazendo previsões ou decisões baseadas em dados , 2 através da construção de um modelo a partir de entradas de amostra. O aprendizado de máquina é empregado em uma variedade de tarefas de computação em que projetar e programar algoritmos explícitos com bom desempenho é difícil ou inviável; os aplicativos de exemplo incluem filtragem de e-mail, detecção de intrusos de rede ou insiders mal-intencionados trabalhando em direção a uma violação de dados, reconhecimento óptico de caracteres (OCR), aprendizado de classificação e visão computacional.
O aprendizado de máquina está intimamente relacionado (e frequentemente se sobrepõe a) estatísticas computacionais, que também se concentram na criação de previsões por meio do uso de computadores. Tem fortes laços com a otimização matemática, que entrega métodos, teoria e domínios de aplicação para o campo. O aprendizado de máquina às vezes é confundido com mineração de dados, onde o último subcampo se concentra mais na análise exploratória de dados e é conhecido como aprendizado não supervisionado. vii O aprendizado de máquina também pode não ser supervisionado e ser usado para aprender e estabelecer perfis comportamentais básicos para várias entidades e, em seguida, ser usado para encontrar anomalias significativas.
No campo da análise de dados, o aprendizado de máquina é um método usado para criar modelos e algoritmos complexos que se prestam à previsão; no uso comercial, isso é conhecido como análise preditiva. Esses modelos analíticos permitem que pesquisadores, cientistas de dados, engenheiros e analistas "produzam decisões e resultados confiáveis e repetíveis" e revelem "percepções ocultas" por meio do aprendizado de relacionamentos históricos e tendências nos dados.
O aprendizado de máquina eficaz é difícil porque é difícil encontrar padrões e, como resultado, muitas vezes não há dados de treinamento suficientes disponíveis. Os programas de aprendizado de máquina muitas vezes falham na entrega.