Próximas Turmas

  • Frequência: Segunda e Quarta
  • Horário: 18:00/21:00h
  • Término Previsto: 24/03/2025
  • Modalidade: Presencial/online
  • Professor: Sergio Luiz
Investimento:

Entrada: R$ 548,86 + até 36x de R$ 210,24 (2.99% a.m.) no boleto
ou no cartão de crédito ou 12xR$415,8

Realizar matrícula

O que você vai aprender nesse curso

O curso de Cientista de dados – Python e R formação completa tem como objetivo apresentar as linguagens de programação Python e R voltadas para a construção de análises descritivas, modelos estatísticos e modelos preditivos. O curso vai abordar conceitos básicos e avançados das tecnologias.

No primeiro módulo do curso teremos conceitos da linguagem Python como: variáveis, funções, estruturas de controles, loops, condicionais e orientação a objetos e na  linguagem R: Variáveis, loops, condicionais, vetores, matrizes e dataframes. 

No segundo módulo vamos dar início aprendendo a fazer acesso a dados via arquivos e banco de dados, continuaremos o estudo iniciando os conceitos de probabilidade e estatística

No módulo final entraremos nos conceitos de Machine learning e Deep learning efetuando os treinamentos supervisionadas e não supervisionados, criaremos os modelos e faremos as avaliações de desempenho. 

Após toda essa jornada o aluno estará apto para entender os conceitos básicos das linguagens Python e R e analisar e construir seus próprios modelos preditivos, assim podendo dar início a sua carreira como cientista de dados.

Nenhum pré-requisito é necessário.

Conteúdo do curso

Introdução a programação em Python (12 horas)

  • Softwares
    • Linguagem Python 3.6 / 3.7
    • IDE Pycharm
  • Lógica de programação
    • Introdução
      • Variáveis
      • Tipos de dados
      • Int
      • Float
      • String
      • Boolean
      • Nomenclatura de variáveis
      • Executando o código
      • Criando algoritmos
    • Operadores
      • Relacionais
      • Lógicos
    • Estruturas
      • Condicionais
      • IF
      • ELSE
      • ELIF
      • Repetição
      • WHILE
      • FOR
      • Instrução break
    • Manipulação de string
      • Convertendo listas em Strings
      • Strings Maiúsculas e minúsculas
      • Verificação em String
      • Contagem em String
      • Dividindo String
    • Coleções
      • Criando
      • Acessando
      • Inicializando
      • Varrendo
      • Fatiando
      • Listas
      • Dicionários
      • Tuplas
    • Funções
      • Não Retornáveis
      • Retornáveis
      • Parametrizadas
      • Recursividade
      • Funções lambda
    • Orientação a objetos
      • Classes
      • Métodos
      • Atributos
      • Relacionamento
      • Construtores
      • Encapsulamento
      • Sobrescrita
    • Trabalhando com arquivos
      • Criando
      • Acessando
      • Gravando dados em arquivos
      • Lendo dados do arquivo

Introdução a análise de dados em python (12 horas)

  • Instalação e softwares
    • Python 3.6 / 3.7
    • Plataforma anaconda
    • IDE jupyter / spider
  • Numpy
    • Introdução a biblioteca
    • Array VS python list
    • Eficiência com NumPy
    • Slicing Arrays
    • Matrizes com listas
    • Matrizes com NumPy
    • Operações com matrizes
    • Visualizando dados com matplotlib
    • Inserindo elementos em um array
    • Adicionando elementos ao final de um array
    • Deletando elementos do array
    • Titile em um array
    • Dividindo um array
    • Arrays de zeros e uns

 

  • Biblioteca Pandas
    • Series
    • DataFrame
    • Index
    • Datasets
    • Datasets com db.py
    • Datasets com CSV / Excel
    • Filtro em um DataFrame
    • Dados Categóricos
    • Dados perdidos em um dataset
    • Operações de agregação e agrupamento
    • Joins
    • Pivot tables
    • Visualização com matplotlib
    • Series Temporais

 

  • Biblioteca matplotlib
    • Gráficos
    • Barra
    • Linha
    • Dispersão
    • Seaborn
    • Customizando
    • Histograma e Gráfico de Pizza

 

  • Análise de dados via banco de dados POSTGRESQL
    • Instalação do PostgreSQL
    • Configuração
    • Construindo a estrutura de dados (tabelas)
    • Efetuando consultas
    • Analisando as consultas via Numpy e pandas
    • agrupamento
    • Contagens
    • Pivotagem
    • Filtros
    • Rankeamento

Estatística, Machine Learning e Deep Learning com python (16 horas)

  • Regressão Linear
    • Simples
    • Múltiplas
    • Logísticas
    • Entendo o método dos mínimos quadrados
  • Machine learning
    • Classificação
    • Correlação de laplaciana
    • Naive Bayes – scikit-learn
    • Naive Bayes – Iris dataset
    • Naive Bayes – credit dataset
    • Naive Bayes

 

  • Aprendizado baseado em arvores (Tree)

 

 

  • Introdução
  • Conceito
  • Arvores com scikit-learn
  • Arvores com scikit-learn Iris dataset
  • Random Forest
  • Random Forest scikit-learn

 

  • Maquina de vetor de suporte (SVM)
    • Introdução
    • Conceito
    • Linear x não linear
    • SVM scikit-learn
    • SVM scikit-learn Iris dataset
    • SVM credit dataset
  • Aprendizado baseado em instancia (KNN)
    • Introdução ao KNN
    • Funcionamento
    • Calculando a distância euclidiana
    • Distancia euclidiana e distancia Manhattan
    • Determinação da classe
    • Vantagens e desvantagens
    • Implementação do KNN – python
    • Implementação do KNN - sklearn
    • Implementação do KNN – sklearn e NumPy
    • Utilizando o model selection e score
    • KNN com sklearn – Dataset Iris
    • KNN - Regressão
    • Introdução a Regressão com KNN
    • Implementação da Regressão com KNN
    • Regressão com sklearn
    • Erro quadrático médio
    • Regressão em um datasets

 

  • Apriori (Aprendizagem não supervisionada)
    • Introdução
    • Conceito
    • Suporte, confiança e lift
    • Regras de associação
    • Regras de associação base de compras

 

  • Agrupamento (k-means)
    • Introdução
    • Calculo da distancia
    • Inicialização
    • Iris dataset

 

  • Deep learning
    • Redes Neurais
      • Conceito
      • Pratica
      • Exemplos
    • Redes neurais artificiais
      • Conceito
      • Prática
      • Exemplos
    • Conhecendo a rede perceptron
      • Processo de treinamento em perceptron
      • Algoritmo de treinamento em perceptron
      • Implementação da perceptron
      • Camadas ocultas
      • Calculo do erro, pesos, e bias.
      • Backpropagation, taxa de aprendizagem e momento
      • Ajustes dos pesos
      • Redes com pybrain
      • Redes scikit-learn
      • Redes scikit-learn Iris dataset

Introdução a análise de dados em R (16 Horas)

  • Linguagem R
    • Baixando e configurando o R
      • RStudio
    • Introdução ao R
      • Vetores
      • Matrizes
      • Arrays
      • Data frames
      • Listas
      • Funções
    • Importação de dados
      • Arquivos de texto
      • Csv
      • Acessando banco de dados
      • Executando rotinas 
    • Introdução a Estatística
      • Amostragem
      • Medidas de Centralidade e Variabilidade
      • Probabilidade
      • Distribuição Binomial
      • Distribuição Normal
      • Distribuição de Poisson
      • Intervalos de Confiança
      • Testes de Hipótese
    • Introdução a Regressão Linear
      • Correlação
      • Regressão Linear - Previsão
      • Regressão Linear – Residual
      • Outliers e Extrapolação
      • Regressão múltipla
      • Cálculos e fórmulas
      • Regressão logística 
    • Series Temporais
      • Introdução
      • Componentes de Uma Serie Temporal
      • Decomposição
      • Previsão
    • Machine Learning
      • Classificação com naive Bayes
      • Arvore decisão rpart
      • Aprendizado baseado em instancia (KNN)
      • Agrupamentos
      • Regra de associação
      • Regra de associação com apriori
      • Regras de associação com Eclad
    • Gráficos e dashboards
      • Histograma
      • Densidade
      • Dispersão
      • Dispersão com legendas
      • Split da tela
      • Boxplot
      • Usando lattice
      • Gráfico 3D com lattice
    • Redes Neurais e Deep Learning
    • Deep Learning
      • Conceito
      • Pratica
      • Exemplos
    • Redes neurais artificiais
      • Conceito
      • Prática
      • Exemplos
    • Conhecendo a rede perceptron
    • Processo de treinamento em perceptron
    • Algoritmo de treinamento em perceptron
    • Implementação da perceptron
    • Redes neurais com sklearn
    • Mineração de texto
      • Introdução
      • Conceito
      • Criação do corpus
      • Geração da nuvem de palavras
      • Matriz de freqüência
    • Finalização e definição de projeto (opcional)
      • Escolha do dataset do projeto
      • Pode ser aplicado no mundo real
      • Aplicar suposições
      • Gráficos
      • KNN
      • Apresentação e conclusão do curso