Próximas Turmas
- Frequência: Segunda e Quarta
- Horário: 18:00/21:00h
- Término Previsto: 24/03/2025
- Modalidade: Presencial/online
- Professor: Sergio Luiz
Entrada: R$ 548,86 + até 36x de R$ 210,24 (2.99% a.m.) no boleto
ou no cartão de crédito ou 12xR$415,8
O que você vai aprender nesse curso
O curso de Cientista de dados – Python e R formação completa tem como objetivo apresentar as linguagens de programação Python e R voltadas para a construção de análises descritivas, modelos estatísticos e modelos preditivos. O curso vai abordar conceitos básicos e avançados das tecnologias.
No primeiro módulo do curso teremos conceitos da linguagem Python como: variáveis, funções, estruturas de controles, loops, condicionais e orientação a objetos e na linguagem R: Variáveis, loops, condicionais, vetores, matrizes e dataframes.
No segundo módulo vamos dar início aprendendo a fazer acesso a dados via arquivos e banco de dados, continuaremos o estudo iniciando os conceitos de probabilidade e estatística.
No módulo final entraremos nos conceitos de Machine learning e Deep learning efetuando os treinamentos supervisionadas e não supervisionados, criaremos os modelos e faremos as avaliações de desempenho.
Após toda essa jornada o aluno estará apto para entender os conceitos básicos das linguagens Python e R e analisar e construir seus próprios modelos preditivos, assim podendo dar início a sua carreira como cientista de dados.
Nenhum pré-requisito é necessário.
Conteúdo do curso
Introdução a programação em Python (12 horas)
- Softwares
- Linguagem Python 3.6 / 3.7
- IDE Pycharm
- Lógica de programação
- Introdução
- Variáveis
- Tipos de dados
- Int
- Float
- String
- Boolean
- Nomenclatura de variáveis
- Executando o código
- Criando algoritmos
- Operadores
- Relacionais
- Lógicos
- Estruturas
- Condicionais
- IF
- ELSE
- ELIF
- Repetição
- WHILE
- FOR
- Instrução break
- Manipulação de string
- Convertendo listas em Strings
- Strings Maiúsculas e minúsculas
- Verificação em String
- Contagem em String
- Dividindo String
- Coleções
- Criando
- Acessando
- Inicializando
- Varrendo
- Fatiando
- Listas
- Dicionários
- Tuplas
- Funções
- Não Retornáveis
- Retornáveis
- Parametrizadas
- Recursividade
- Funções lambda
- Orientação a objetos
- Classes
- Métodos
- Atributos
- Relacionamento
- Construtores
- Encapsulamento
- Sobrescrita
- Trabalhando com arquivos
- Criando
- Acessando
- Gravando dados em arquivos
- Lendo dados do arquivo
- Introdução
Introdução a análise de dados em python (12 horas)
- Instalação e softwares
- Python 3.6 / 3.7
- Plataforma anaconda
- IDE jupyter / spider
- Numpy
- Introdução a biblioteca
- Array VS python list
- Eficiência com NumPy
- Slicing Arrays
- Matrizes com listas
- Matrizes com NumPy
- Operações com matrizes
- Visualizando dados com matplotlib
- Inserindo elementos em um array
- Adicionando elementos ao final de um array
- Deletando elementos do array
- Titile em um array
- Dividindo um array
- Arrays de zeros e uns
- Biblioteca Pandas
- Series
- DataFrame
- Index
- Datasets
- Datasets com db.py
- Datasets com CSV / Excel
- Filtro em um DataFrame
- Dados Categóricos
- Dados perdidos em um dataset
- Operações de agregação e agrupamento
- Joins
- Pivot tables
- Visualização com matplotlib
- Series Temporais
- Biblioteca matplotlib
- Gráficos
- Barra
- Linha
- Dispersão
- Seaborn
- Customizando
- Histograma e Gráfico de Pizza
- Análise de dados via banco de dados POSTGRESQL
- Instalação do PostgreSQL
- Configuração
- Construindo a estrutura de dados (tabelas)
- Efetuando consultas
- Analisando as consultas via Numpy e pandas
- agrupamento
- Contagens
- Pivotagem
- Filtros
- Rankeamento
Estatística, Machine Learning e Deep Learning com python (16 horas)
- Regressão Linear
- Simples
- Múltiplas
- Logísticas
- Entendo o método dos mínimos quadrados
- Machine learning
- Classificação
- Correlação de laplaciana
- Naive Bayes – scikit-learn
- Naive Bayes – Iris dataset
- Naive Bayes – credit dataset
- Naive Bayes
- Aprendizado baseado em arvores (Tree)
- Introdução
- Conceito
- Arvores com scikit-learn
- Arvores com scikit-learn Iris dataset
- Random Forest
- Random Forest scikit-learn
- Maquina de vetor de suporte (SVM)
- Introdução
- Conceito
- Linear x não linear
- SVM scikit-learn
- SVM scikit-learn Iris dataset
- SVM credit dataset
- Aprendizado baseado em instancia (KNN)
- Introdução ao KNN
- Funcionamento
- Calculando a distância euclidiana
- Distancia euclidiana e distancia Manhattan
- Determinação da classe
- Vantagens e desvantagens
- Implementação do KNN – python
- Implementação do KNN - sklearn
- Implementação do KNN – sklearn e NumPy
- Utilizando o model selection e score
- KNN com sklearn – Dataset Iris
- KNN - Regressão
- Introdução a Regressão com KNN
- Implementação da Regressão com KNN
- Regressão com sklearn
- Erro quadrático médio
- Regressão em um datasets
- Apriori (Aprendizagem não supervisionada)
- Introdução
- Conceito
- Suporte, confiança e lift
- Regras de associação
- Regras de associação base de compras
- Agrupamento (k-means)
- Introdução
- Calculo da distancia
- Inicialização
- Iris dataset
- Deep learning
- Redes Neurais
- Conceito
- Pratica
- Exemplos
- Redes neurais artificiais
- Conceito
- Prática
- Exemplos
- Conhecendo a rede perceptron
- Processo de treinamento em perceptron
- Algoritmo de treinamento em perceptron
- Implementação da perceptron
- Camadas ocultas
- Calculo do erro, pesos, e bias.
- Backpropagation, taxa de aprendizagem e momento
- Ajustes dos pesos
- Redes com pybrain
- Redes scikit-learn
- Redes scikit-learn Iris dataset
- Redes Neurais
Introdução a análise de dados em R (16 Horas)
- Linguagem R
- Baixando e configurando o R
- RStudio
- Introdução ao R
- Vetores
- Matrizes
- Arrays
- Data frames
- Listas
- Funções
- Importação de dados
- Arquivos de texto
- Csv
- Acessando banco de dados
- Executando rotinas
- Introdução a Estatística
- Amostragem
- Medidas de Centralidade e Variabilidade
- Probabilidade
- Distribuição Binomial
- Distribuição Normal
- Distribuição de Poisson
- Intervalos de Confiança
- Testes de Hipótese
- Introdução a Regressão Linear
- Correlação
- Regressão Linear - Previsão
- Regressão Linear – Residual
- Outliers e Extrapolação
- Regressão múltipla
- Cálculos e fórmulas
- Regressão logística
- Series Temporais
- Introdução
- Componentes de Uma Serie Temporal
- Decomposição
- Previsão
- Machine Learning
- Classificação com naive Bayes
- Arvore decisão rpart
- Aprendizado baseado em instancia (KNN)
- Agrupamentos
- Regra de associação
- Regra de associação com apriori
- Regras de associação com Eclad
- Gráficos e dashboards
- Histograma
- Densidade
- Dispersão
- Dispersão com legendas
- Split da tela
- Boxplot
- Usando lattice
- Gráfico 3D com lattice
- Redes Neurais e Deep Learning
- Deep Learning
- Conceito
- Pratica
- Exemplos
- Redes neurais artificiais
- Conceito
- Prática
- Exemplos
- Conhecendo a rede perceptron
- Processo de treinamento em perceptron
- Algoritmo de treinamento em perceptron
- Implementação da perceptron
- Redes neurais com sklearn
- Mineração de texto
- Introdução
- Conceito
- Criação do corpus
- Geração da nuvem de palavras
- Matriz de freqüência
- Finalização e definição de projeto (opcional)
- Escolha do dataset do projeto
- Pode ser aplicado no mundo real
- Aplicar suposições
- Gráficos
- KNN
- Apresentação e conclusão do curso
- Baixando e configurando o R