Machine Learning e Data Science com Linguagem Python e R.

Carga horária: 44hs

Objetivo:

Data Science é o estudo de dados de informações de um determinado negócio para extração de conhecimentos para tomada de decisões dentro de uma empresa através de um conjunto de dados, seja em um Big Data ou em um banco de dados tradicional. O machine learning é um conjunto de regras e procedimentos usados para que os computadores possam tomar decisões baseadas em dados históricos sem que sejam explicitamente programados. Para iniciar no curso será necessário um bom conhecimento de lógica de programação, estatística e probabilidade, conhecimento básico de SQL (extração de dados de modelos) e conhecimento das linguagens Python e R(estarão no curso). Durante o curso serão abordados os algoritmos mais comuns para predição e classificação de modelos e uso das bibliotecas voltadas para o estudo de machine learning. Após o termino do curso o aluno terá conhecimento para entrar na carreira de cientista de dados.

Pré-requisito: Logica de Programação com orientação a Objetos

Próximas turmas

Frequência Horário Início Término Valor
Segunda, Quarta e Sexta 18:00/22:00h 22/08/2018 17/09/2018 6xR$240,00
Sábado 09:00/13:00h 01/09/2018 10/11/2018 6xR$240,00

Ementa:

 

o   Configurando o Ambiente Para o Python

·         Baixando e instalando o python 3.5

·         Instalação do jupyter-notebook

·         Instalando dependências

·         Instalando pip

·         Instalando virtualenv

·         Baixando a ide pycharm

§  Configurando a ide

§  Configurando o ambiente virtual

§  Instalando o django no ambiente

§  Criando um projeto django

§  Configurando o projeto

§  Iniciando o projeto

o   Instalação do R

·         Baixando e configurando o R

·         Usando o visual Studio Code

 

o   Introdução a programação e tipos de dados em Python e R

·         Tipos de dados

·         Tipagem dinâmica

·         Strings

·         Listas

·         Dicionários

·         Tuplas

·         Condicionais

·         Repetições

·         Funções

·         Blocos de Programação

·         blocos Condicionais

·         Blocos de Repetição

o   Arquivos

·         Geração de arquivos

·         Leitura e Gravação

·         Processamento de um arquivo

·         Permissões em arquivos

o   Introdução a Estatística no R

·         Amostragem

·         Medidas de Centralidade e Variabilidade

·         Probabilidade

·         Distribuição Binomial

·         Distribuição Normal

·         Distribuição de Poisson

·         Intervalos de Confiança

·         Testes de Hipótese

·         Distribuição t de Student

·         Anova

·         Qui Quadrado

o   Bibliotecas no Python para Data Science e Machine Learning

·         Biblioteca NumPy

§  Introdução a biblioteca

§  Array VS python list

§  Eficiência com NumPy

§  Slicing Arrays

§  Matrizes com listas

§  Matrizes com NumPy

§  Operações com matrizes

§  Visualizando dados com matplotlib

§  Inserindo elementos em um array

§  Adicionando elementos ao final de um array

§  Deletando elementos do array

§  Titile em um array

§  Dividindo um array

§  Arrays de zeros e uns

§  Indexação booleana

§  Carregando dados do arquivo com NumPy

§  Lendo CSV com NumPy

§  Analisando um dataset com NumPy

·         Biblioteca Pandas

§  Series

§  DataFrame

§  Index

§  Datasets

§  Datasets com db.py

§  Datasets com CSV / Excel

§  Filtro em um DataFrame

§  Dados Categóricos

§  Dados perdidos em um dataset

§  Operações de agregação e agrupamento

§  Joins

§  Pivot tables

§  Visualização com matplotlib

§  Series Temporais

·         Biblioteca Matplotlib

§  Gráficos

§  Barra

§  Linha

§   Dispersão

§  Seaborn

§  Customizando

§  Histograma e Gráfico de Pizza

·         Regressão Linear

§  Linear simples

§  Entendo o método dos mínimos quadrados

 

o   Introdução a Regressão Linear no R

·         Correlação

·         Regressão Linear - Previsão

·         Regressão Linear – Residual

·         Outliers e Extrapolação

·         Regressão múltipla

·         Cálculos e fórmulas

·         Regressão logística

o   Series Temporais no Python e R

·         Introdução

·         Componentes de Uma Serie Temporal

·         Decomposição

·         Previsão

o   Redes Neurais e Deep Learning no Python e R

·         Deep Learning

§  Conceito

§  Pratica

§  Exemplos

·         Redes neurais artificiais

§  Conceito

§  Prática

§  Exemplos

·         Conhecendo a rede perceptron

·         Processo de treinamento em perceptron

·         Algoritmo de treinamento em perceptron

·         Implementação da perceptron

·         Redes neurais com sklearn

 

o   Machine Learning

·         Introdução

·         Aplicações

·         Conceitos

§  No R

·         Classificação com naive Bayes

·         Arvore decisão rpart

·         Aprendizado baseado em instancia (KNN)

·         Agrupamentos

·         Regra de associação

·         Regra de associação com apriori

·         Regras de associação com Eclad

·          

·         No Python

·         Tipos de aprendizado

o   Aprendizado supervisionado

o   Aprendizado não supervisionado

o   Técnicas de aprendizado

o   Obtendo datasets

·         KNN- Classificação

o   Introdução ao KNN

o   Funcionamento

o   Calculando a distância euclidiana

o   Distancia euclidiana e distancia Manhattan

o   Determinação da classe

o   Vantagens e desvantagens

o   Implementação do KNN – python

o   Implementação do KNN - sklearn

o   Implementação do KNN – sklearn e NumPy

o   Utilizando o model selection e score

o   KNN com sklearn – Dataset Iris

·         KNN - Regressão

o   Introdução a Regressão com KNN

o   Implementação da Regressão com KNN

o   Regressão com sklearn

o   Erro quadrático médio

o   Regressão em um datasets

 

o   Finalização e definição de projeto

·         Escolha do dataset do projeto

·         Pode ser aplicado no mundo real

·         Aplicar suposições

·         Gráficos

·         KNN

 

·         Apresentação e conclusão do curso