Próximas Turmas
Nenhuma turma disponível no momento
Entre em contato para informar seu interesseO que você vai aprender nesse curso
O curso de Cientista de dados – Python e R tem como objetivo apresentar as linguagens Python E R voltadas unicamente para análise de dados. Iremos abordar análises descritivas, modelos estatísticos e modelos preditivos.
No primeiro módulo faremos analises descritivas utilizando o Numpy e Pandas (dataframe) no Python, no R utilizaremos os conceitos de vetores, matrizes e dataframes, acesso a dados via arquivos e banco de dados.
No segundo módulo iremos falar de conceitos de probabilidade e estatística como: distribuições e regressões.
No módulo final entraremos nos conceitos de Machine learning e Deep learning efetuando os treinamentos supervisionadas e não supervisionados, criaremos os modelos e faremos as avaliações de desempenho.
Após toda essa jornada o aluno estará apto para entender os conceitos básicos das linguagens Python e R e analisar e construir seus próprios modelos preditivos, assim podendo dar início a sua carreira como cientista de dados.
Pré-requisitos: Lógica de programação e banco de dados (conceitos iniciais)
Conteúdo do curso
Estatística, Machine Learning e Deep Learning com python (16 horas)
- Configurando o Ambiente Python
- Baixando e instalando Python 3.6/ 3.7
- Instalação do anaconda
- IDE Jupyter
- IDE Spyder
- Introdução a programação
- Tipos de dados
- Tipagem dinâmica
- Strings
- Listas
- Dicionários
- Tuplas
- Escrita e leitura de arquivos
- Funções blocos
- Classes e métodos
- Analise de dados
- Numpy
- Introdução a biblioteca
- Array VS python list
- Eficiência com NumPy
- Slicing Arrays
- Matrizes com listas
- Matrizes com NumPy
- Operações com matrizes
- Visualizando dados com matplotlib
- Inserindo elementos em um array
- Adicionando elementos ao final de um array
- Deletando elementos do array
- Titile em um array
- Dividindo um array
- Arrays de zeros e uns
- Biblioteca Pandas
- Series
- DataFrame
- Index
- Datasets
- Datasets com db.py
- Datasets com CSV / Excel
- Filtro em um DataFrame
- Dados Categóricos
- Dados perdidos em um dataset
- Operações de agregação e agrupamento
- Joins
- Pivot tables
- Visualização com matplotlib
- Series Temporais
- Biblioteca Matplotlib
- Gráficos
- Barra
- Linha
- Dispersão
- Seaborn
- Customizando
- Histograma e Gráfico de Pizza
- Regressão Linear
- Linear simples
- Entendo o método dos mínimos quadrados
- Machine learning
- Naive Bayes
- Introdução
- Classificação
- Correlação de laplaciana
- Naive Bayes – scikit-learn
- Naive Bayes – Iris dataset
- Naive Bayes – credit dataset
- Naive Bayes
- Aprendizado baseado em arvores (Tree)
- Naive Bayes
- Numpy
- Introdução
- Conceito
- Arvores com scikit-learn
- Arvores com scikit-learn Iris dataset
- Random Forest
- Random Forest scikit-learn
- Maquina de vetor de suporte (SVM)
- Introdução
- Conceito
- Linear x não linear
- SVM scikit-learn
- SVM scikit-learn Iris dataset
- SVM credit dataset
- Aprendizado baseado em instancia (KNN)
- Introdução ao KNN
- Funcionamento
- Calculando a distância euclidiana
- Distancia euclidiana e distancia Manhattan
- Determinação da classe
- Vantagens e desvantagens
- Implementação do KNN – python
- Implementação do KNN - sklearn
- Implementação do KNN – sklearn e NumPy
- Utilizando o model selection e score
- KNN com sklearn – Dataset Iris
- KNN - Regressão
- Introdução a Regressão com KNN
- Implementação da Regressão com KNN
- Regressão com sklearn
- Erro quadrático médio
- Regressão em um datasets
- Apriori (Aprendizagem não supervisionada)
- Introdução
- Conceito
- Suporte, confiança e lift
- Regras de associação
- Regras de associação base de compras
- Agrupamento (k-means)
- Introdução
- Calculo da distancia
- Inicialização
- Iris dataset
- Deep learning
- Redes Neurais
- Conceito
- Pratica
- Exemplos
- Redes neurais artificiais
- Conceito
- Prática
- Exemplos
- Conhecendo a rede perceptron
- Processo de treinamento em perceptron
- Algoritmo de treinamento em perceptron
- Implementação da perceptron
- Camadas ocultas
- Calculo do erro, pesos, e bias.
- Backpropagation, taxa de aprendizagem e momento
- Ajustes dos pesos
- Redes com pybrain
- Redes scikit-learn
- Redes scikit-learn Iris dataset
Introdução a análise de dados em R (16 Horas)
- Baixando e configurando o R
- RStudio
- Introdução ao R
- Vetores
- Matrizes
- Arrays
- Data frames
- Listas
- Funções
- Importação de dados
- Arquivos de texto
- Csv
- Acessando banco de dados
- Executando rotinas
- Introdução a Estatística
- Amostragem
- Medidas de Centralidade e Variabilidade
- Probabilidade
- Distribuição Binomial
- Distribuição Normal
- Distribuição de Poisson
- Intervalos de Confiança
- Testes de Hipótese
- Introdução a Regressão Linear
- Correlação
- Regressão Linear - Previsão
- Regressão Linear – Residual
- Outliers e Extrapolação
- Regressão múltipla
- Cálculos e fórmulas
- Regressão logística
- Series Temporais
- Introdução
- Componentes de Uma Serie Temporal
- Decomposição
- Previsão
- Machine Learning
- Classificação com naive Bayes
- Arvore decisão rpart
- Aprendizado baseado em instancia (KNN)
- Agrupamentos
- Regra de associação
- Regra de associação com apriori
- Regras de associação com Eclad
- Gráficos e dashboards
- Histograma
- Densidade
- Dispersão
- Dispersão com legendas
- Split da tela
- Boxplot
- Usando lattice
- Gráfico 3D com lattice
- Redes Neurais e Deep Learning
- Deep Learning
- Conceito
- Pratica
- Exemplos
- Redes neurais artificiais
- Conceito
- Prática
- Exemplos
- Conhecendo a rede perceptron
- Processo de treinamento em perceptron
- Algoritmo de treinamento em perceptron
- Implementação da perceptron
- Redes neurais com sklearn
- Mineração de texto
- Introdução
- Conceito
- Criação do corpus
- Geração da nuvem de palavras
- Matriz de freqüência
- Finalização e definição de projeto (opcional)
- Escolha do dataset do projeto
- Pode ser aplicado no mundo real
- Aplicar suposições
- Gráficos
- KNN
- Apresentação e conclusão do curso