A ciência de dados converte dados em informação/insights aplicando técnicas da inteligência artificial e de “machine learning”. Este campo tem recebido muita atenção ultimamente, resultando numa série de técnicas possíveis para resolver problemas. Nesta formação será gradualmente aprofundado o uso do Python e do “stack” do Azure para aplicar “machine learning” aos dados da organização.
Este curso tem como destinatários programadores e analistas de dados que pretendem recorrer ao “stack” do Azure para aplicar técnicas de “machine learning” a dados.
Os participantes deverão estar familiarizados com técnicas de utilização de Pyhton no sentido de explorar dados e “insights” com recurso ao Azure e a “machine learning”.
Os participantes devem ter conhecimentos gerais de arquitetura de gestão de dados e alguma experiência com inteligência de negócios ou análise de dados no geral.
(não existem exames)
Introdução ao “machine learning”
Antes que o ML possa ser aplicado os seus principais conceitos devem ser discutidos.
• Aprendizagem supervisionada versus não supervisionada
• Metodologia de “machine learning”
• Preparação de dados
• Classificação, regressão e agrupamento
• Avaliação de modelo
• Serviços cognitivos
• ML automatizado nos serviços do Azure ML
• Trabalhar com o Azure ML Designer
Ferramentas para “machine learning” no Azure
Nesta secção veremos as diferentes ferramentas disponíveis para o “machine learning” no Microsoft Azure.
• Visão geral do “machine learning” no Azure
• Modelos pré-treinados
• Aprendizagem por transferência
• Abordagens Gráficas
• Abordagens de codificação
Primeiros passos com Python
Serão abordados neste módulo os fundamentos do Python.
• Apresentação da linguagem de programação Python
• Ambientes Python
• Desenvolvimento interativo com notebooks Azure
• Variáveis e objetos
• Estruturas de dados comuns: listas, tuplos, conjuntos e dicionários
• Funções
• Criação e uso de classes
Introdução ao Azure Machine Learning
O “machine learning” numa máquina local para um pequeno conjunto de dados é possível, contudo a sua execução em conjuntos de dados maiores ou em técnicas que consomem mais CPU pode tornar-se um desafio. Um outro problema é implantar um modelo: como podemos usar facilmente o modelo resultante noutros aplicativos? O Azure Machine Learning ajuda a responder a estas perguntas. Neste capítulo, são abordados os princípios básicos do Azure Machine Learning. Discutiremos os componentes e a arquitetura, criaremos e ligaremos a um espaço de trabalho com Python e veremos como criar recursos de computação.
• Porquê Azure Machine Learning?
• Componentes e arquitetura do Azure Machine Learning
• Criar um espaço de trabalho do Azure Machine Learning
• “Compute” configuração
• Manipulações de dados com “Pandas”
Processamento de dados com SciPy
Em ciência de dados é crucial lidar com tabelas: carregar, manipular, verificacar qualidade de dados, etc. os dataframes podem ajudar e neste módulo são inspecionados os dois pacotes Python mais importantes para manipulação de dados: Numpy e Pandas.
• Python numérico: Numpy
• Estruturas de dados numpy
• Pandas DataFrames
• Carregando dados com pandas
• Manipulações de dados com Pandas
“Machine learning” com scikit-learn
Muitos problemas de negócios podem ser resolvidos por técnicas básicas de “machine learning”. Neste módulo, as abordagens de “machine learning” mais comuns, como regressão linear e florestas aleatórias, são implementadas, bem como a inspeção de modelo.
• Pré-processamento de dados específicos de “machine learning”: normalização, padronização, codificação one-hot
• Classificação usando árvores de decisão, regressão logística e máquinas de vetores de suporte
• Ajuste do modelo: trabalhando com hiper-parâmetros
• Construção de modelos de regressão com regressão linear, SVM e redes neurais
• Aprendizagem não supervisionada: Clustering
Treino e implantação de modelos no Azure Machine Learning
Neste capítulo, continuaremos com o Azure Machine Learning. Como o essencial foi abordado, podemos explorar a parte do “machine learning”. Veremos como criar testes nos quais podemos registar os resultados de diferentes tentativas de treino de um modelo. Veremos como treinar modelos usando diferentes cálculos e pipelines. Depois de avaliar os diferentes modelos, o melhor modelo pode ser implantado como um serviço da web.
• Configurar computações e datastores
• Criação e consulta de testes
• Criação e registo de imagens
• Implantar imagens como serviços da web
Introdução ao Deep Learning
De todas as técnicas de “machine learning”, há uma que se torna popular para problemas mais desafiadores: várias camadas de redes neurais, mais conhecidas como “deep learning”. Para problemas como reconhecimento de imagem, compreensão de fala, etc., este é o caminho a percorrer. Mas, de um ponto de vista matemático, esta técnica é muito desafiadora. Neste módulo, são apresentados os fundamentos do “deep learning”.
• De redes neurais ao aprendizado profundo
• Visão geral das estruturas de aprendizado profundo
• Primeiros passos com a estrutura Keras