Python and Spark for Big Data and Machine Learning

curso 4522

Proporcionar uma visão geral dos principais algoritmos de Machine Learning e, de forma crítica, discutir como aplicá-los usando ferramentas Open Source, tais como Spark e Python; Entregar ao aluno um RoadMap por meio da transmissão de conhecimentos a respeito das áreas: Ciência de Dados, Machine Learning e Processamento de Alto Desempenho. 

40h

Curso na modalidade presencial, live class ou agile class

Faz parte da formação

Python para Big Data

Após fazer este curso você estará preparado para:

  • Aplicar técnicas de mapeamento/redução nos dados;
  • Extrair e carregar tabelas a partir de arquivos, bases de dados e outras fontes (ETL);
  • Preparar infraestrutura para trabalhar com APIs de Machine Learning em Python;
  • Acelerar o processamento de grandes bases de dados;
  • Usar os principais algoritmos de Machine Learning com Python e suas APIs;
  • Trabalhar com Pyspark;
  • Planejar e implementar um projeto de Big Data para Análise e Visualização de Dados;
  • Aplicar os princípios de Ciência de Dados, Machine Learning e Big Data;

Porque fazer este curso na 4Linux

Veja o que nossos clientes alunos e
empresas falam deste curso

Aluno que realizou o treinamento Python And Spark for Big Data and Machine Learning

Realizei o curso Python and Spark for Big Data and Machine Learning na 4Linux e me ajudou bastante a entender os conceitos de uma forma geral sobre o assunto. Gostei muito do treinamento, do instrutor do curso que durante o treinamento foi muito prestativo e bem didático enviou conteúdo extra para estudos.

Gustavo R. Liberado
Aluno

O treinamento atendeu as minhas expectativas, tive algumas dificuldades, mas saí do treinamento com uma visão diferente da área e com planos para aumentar o meu conhecimento sobre o assunto.Eu recomendo o treinamento, acho que ele oferece um conteúdo essencial para quem deseja iniciar na área.

Hebert Souza Santos
Aluno

Após concluir o curso e atualizar meu currículo consegui uma vaga em uma excelente empresa, além de todo o conhecimento esse curso. As aulas ministradas para todos, do mais ao menos experiente, todos podiam aprender e contribuir. Foi uma experiência incrível, espero poder realizar mais cursos com a 4Linux.

Letícia Ramos
Aluna

Conteúdo programático

  • Python para Big Data
  • Jupyter Notebook
  • Google Colab

  • O modelo de programação MapReduce
  • Introdução à Programação funcional com Python: Funções Lambda em Python
  • Trabalhando com grafos em Python
  • Numpy
  • Pandas

  • Tipos de Variáveis
  • Normalização de Dados com Python
  • Visualização de Dados com Python (Matplotlib, Searborn, Bokeh)
  • Medidas de similaridade

  • Introdução à Estatística Descritiva
  • Média, Mediana, Desvio Padrão, Variância
  • Teorema de Bayes e Inferência Bayesiana
  • Teste Estatístico de Hipótese
  • Exemplo: Executando um Teste A/B

  • Operações básicas com DataFrames
  • Operações avançadas com DataFrames
  • Operações com Dados Faltantes e Datas

  • Introdução a Machine Learning

  • Overview dos Algoritmos de Machine Learning

  • K-nearest neighbors – kNN

  • Construção de Pipeline de Machine Learning com modelo CRISP DM

  • Introdução a Sistemas de Recomendação e Filtros Colaborativos

  • Regressão Linear

  • Regressão Logística x kNN – Avaliação de Modelos

  • Fundamentos de Redes Neurais Artificiais

  • Regressão Logística x kNN – Avaliação de Modelos

  • Introdução a Processamento Natural de Linguagem (Modelos n-grams)

  • Word2Vec com Gensim

  • Clusterização usando Kmeans

  • Classificação usando Naive Bayes

  • Classificação usando Árvores de Decisão e Random Forest

  • Classificação usando Support Vector Machine

  • Introdução ao Spark Mllib

  • Tokenização de documentos de textos para tarefas de classificação

  • Regressão Logística com Spark Mllib

  • KNN com Spark Mllib

  • Spark Streaming

  • Introdução a Deep Learning

  • Redes Neurais Convolucionais

  • Redes Neurais Recorrentes

  • Introdução ao TensorFlow

  • Conhecendo a base de dados MNIST

  • Aplicação Prática de Redes Neurais MLP para Reconhecimento de Imagem

  • Aplicação Prática de Redes Neurais Convolucionais para Reconhecimento de Imagem

  • Aplicação Prática de Redes Neurais Recorrentes para Análise de Sentimentos

  • A revolução das GPUs em Machine Learning

  • Arquitetura Cuda e Modelo de Programação em GPU

  • Introdução ao Numba

  • Comparação de desempenho entre Numpy, Numpy assíncrono e Numpy com Numba em Operações estatísticas

  • Conhecendo os principais frameworks Python para Machine Learning que usam GPUs

Gostaria de tirar dúvidas ou receber uma proposta?
Fale com a gente.

Conheça os diferenciais da 4Linux
Cursos inovadores com foco na empregabilidade

Preparatório para as principais certificações.

Aulas do tipo ‘mão na massa’

Metodologia IT Experience. Vivenciando o mercado de trabalho dentro da sala de aula.

Blended Learning

Mix de aulas presencial e online, com uso intenso de tecnologias.

Olhar no futuro

Ensinamos novas tecnologias que o mercado de trabalho irá contratar.

Implementar projetos e ensinar

Nos torna únicos no mercado. Sabemos o que é relevante e precisa ser ensinado.

Nem consultores, nem instrutores

CONSTRUTORES = CONSultores + insTRUTORES

Curso presencial ou online?
Turmas noturnas, diurnas ou aos finais de semana?

Temos vários horários e modalidades para atender sua disponibilidade.

Próximas turmas

Formas de pagamento

Cartão de crédito

Parcelado em até 12 vezes sem juros

Transferência bancária

Pagamento à vista e com desconto

Boleto bancário

Entrada mais saldo em até 6 vezes sem juros

Pronto para transformar sua carreira com o poder do open software?

Preencha o formulário.

Te enviaremos datas, preços e mais informações do curso.
Preencha para receber datas e valores:

Compartilhe essa página

Compartilhar no facebook
Compartilhar no twitter
Compartilhar no linkedin
Compartilhar no pinterest
Compartilhar no whatsapp

Download do Conteúdo Programático

Pré-requisitos do aluno

Para acompanhar o curso, o aluno deve saber utilizar computadores e inicializar uma máquina virtual com VirtualBox

Pré-requisitos computacionais para o curso EAD

É necessário que o aluno tenha um computador (Notebook ou Desktop) com no mínimo 8GB com suporte a 64bits, pois será necessário emular máquinas virtuais para realizar os laboratórios práticos, e tenha instalado VirtualBox Instalado com Extention Pack (Linux/Windows/Mac OS X)

Pré-requisitos In Company

Sala equipada com Projetor, Quadro branco ou Cavalete Flip Chart;

Acesso à internet por banda larga, utilizando Rede Ethernet ou Wireless;

Caso exista algum proxy ou bloqueio na rede, a 4Linux deverá ser informada para providenciar com antecedência o download dos arquivos necessários.

Pré-requisitos do aluno

Pré-eequisitos Computacionais Presencial/EAD/EAD AO VIVO

Pré-requisitos In Company