Super Academia Data Science - 5 cursos em 1
Tudo sobre Data Science reunido em um único lugar - Python, Visualização no Python, R e WEKA
What you will learn
Entendendo o R
Primeiros passos com o R
Objetos no R
Tipos de objetos: Matrizes, Listas
Identificação de valores faltantes e especiais
Salvar uma workspace
Acesso pelo R-studio
Entendimento dos diferentes tipos de pacotes
Trabalhando com leitura de arquivos externos
Lendo um arquivo na web
Selecionando dados
Gráficos (análise de dados e apresentação)
Tipos de gráficos: Histogramas, Ramo e Folha, Box-plot, Gráfico de dispersão,Gráfico de barras, Setores
Variáveis qualitativas: Nominais e Ordinais
Análise univariada e bivariada
Teste de uma distribuição normal
Comparação de duas médias
Regressão linear simples
Mineração de dados com o R
Instalação do R-studio e R
Vetores,Data frames,Funções
Workspace do r(área de trabalho)
Leitura de uma workspace
Pacotes do R
Uso dos comandos library, intall package,require
Leitura através do R-studio
Sumarizando dados
Uso dos conectores lógicos
Exportando gráficos
Programação: Comando FOR, Criando funções pelo R-studio, Uso de Estatísticas
Variáveis quantitativas: Discretas e Continuas
Teste de hipóteses
Teste chi-quadrado para aderência
Comparação de médias múltiplas pelo teste de Tukey
Regressão linear múltipla
Uso do Google Vis ( biblioteca gráfica do Google)
Desenvolver programas usando a linguagem Python
Manipular estruturas condicionais
Mineração de arquivos com Python
Manipular estruturas de repetição
Realizar operações matemáticas usando Python
Manipular strings
Realizar operações lógicas
Python
Visualizar de dados com Python
Conhecer a biblioteca MATPLOTLIB PYPLOT
Construir gráficos de linhas, barras, dispersão e boxplot
Contexto da Mineração de Dados - Descoberta de conhecimento em banco de dados, Aplicações práticas
Entender o impacto da mineração de dados, Quais são os dados de entrada e saída na Mineração de Dados
Aprender as técnicas de Mineração de Dados (Conceitos Básicos, Aprendizado de Máquina)
Trabalhar com as técnicas: CLASSIFICAÇÃO, INDUÇÃO DE REGRAS, REGRAS DE ASSOCIAÇÃO, AGRUPAMENTO(CLUSTER) , REDES NEURAIS
Utilizar os algoritmos: ÁRVORES DE DECISÃO, APRIORI, KMEANS,ETC
Aprendizado Bayesiano (Operacionalização do conhecimento minerado e sua interpretação)
Validação do conhecimento descoberto
Aprendendo a utilizar o WEKA: uma ferramenta Java para Classificação, Associação, Clustering e Previsão
Explanação de Interfaces Visuais para interpretação e divulgação do conhecimento (Mineração Visual)
Entendimento e apresentação sobre MINERAÇÃO VISUAL- uso da biblioteca D3js
Trabalhando Widget: Color, Distributions, Pivot Table
Trabalhando Widget: Feature Statistics, Data Sample
Trabalhando com Widget: Paint Data
Trabalhando com Widget: Outliers ,Scatter Plot
Trabalhando com: Create Class
Trabalhando com: Select By data index
Trabalhando com: Edit Domain
Trabalhando com: Freeviz
Trabalhando com: Árvore de Decisão
Trabalhando com: Árvore de Decisão
Trabalhando com: Cluster - Imagens
Description
As grandes empresas estão em busca de profissionais que saibam tratar e trabalhar dados, permitindo que novos insights sejam descobertos e aplicados ao seu negócio.
Criamos a SUPER ACADEMIA DATA SCIENCE para facilitar a sua necessidade de aprender as tecnlogias que estão atualmente sendo utilizadas pelas corporações. Destacamos PYTHON, R e WEKA neste cenário
R
No Nosso curso de Linguagem R o objetivo principal é permitir que aspectos básicos com ênfase no entendimento da linguagem R como sua estrutura e a forma de operação sejam compreendidos. O curso foi preparado e estruturado para que desde o iniciante até o mais avançado em técnicas estatísticas aprenda a trabalhar com a ferramenta R. O material pode ser acompanhado utilizando o R instalado em outros sistemas operacionais, tal como Windows ou Linux.
Durante o curso, o aluno terá que assistir as videoaulas e praticar diretamente no seu computador.
A ementa sumarizada é:
O que é a Linguagem R, Instalação da Ferramenta, Aprimoramento do Uso do R-Studio, Entendimento do Uso dos Objetos no R (Vetor, Matriz, Data Frame, Lista e Funções),Uso de Pacotes no R, Leitura de Arquivos no R, Sumarizando Dados, Gráficos com o R, Análise Estatística e o Uso Geral da Estatística, Uso de componentes como Mineração de Dados e o GOOGLE VIS.
Todo o curso de Linguagem R tem MATERIAL PRÓPRIO, um texto com tudo passo a passo, único e bem articulado.
Você entenderá os algoritmos e poderá praticar com suas bases de dados, seja arquivo texto ou banco de dados.
ORANGE
O ORANGE é uma das poucas ferramentas de mercado, totalmente construida em python, que o analista de dados pode trabalhar de forma totalmente visual, com um amplo aspecto de atendimento a diversas demandas na área de mineração de dados por meio do uso de algoritmos de Machine Learning.
ASPECTOS PRESENTES:
Aprendizado de máquina de código aberto e visualização de dados para iniciantes e especialistas. Fluxos de trabalho de análise de dados interativos com uma grande caixa de ferramentas
execute análise de dados simples com visualização inteligente de dados. Explore distribuições estatísticas, gráficos de dispersão ou mergulhe mais fundo com árvores de decisão, agrupamentos hierárquicos. Até seus dados multidimensionais podem se tornar sensíveis em 2D, especialmente com classificações e seleções inteligentes de atributos.
Exploração interativa de dados para análise qualitativa rápida com visualizações limpas. A interface gráfica do usuário permite que você se concentre na análise exploratória de dados em vez codificação, enquanto padrões inteligentes tornam extremamente fácil a criação rápida de protótipos de um fluxo de trabalho de análise de dados. Coloque widgets na tela, conecte-os, carregue seus conjuntos de dados e colete os insights!
Use vários complementos disponíveis no Orange para extrair dados de fontes de dados externas.
WEKA
Atualmente, a mineração de dados se mostra fundamental para a descoberta de novas informações e conhecimento, formatados em regras e padrões, a partir de grandes bases de dados. Nesta perspectiva, torna-se importante o desenvolvimento de um raciocínio crítico acerca dos principais conceitos, problemas e algoritmos relacionados à área de mineração de dados. Esta abordagem visa uma sintonia com as tendências empregadas atualmente no mercado no uso desta tecnologia de modo a preparar o futuro profissional a avaliar e, sobretudo, facilitar seu entendimento no emprego de metodologias e tecnologias avançadas.
O curso aborda o tema Mineração de Dados, através de aulas práticas e teóricas, utilizando-se de técnicas avançadas de descoberta de conhecimento, os quais provém a capacidade de descobrir novas informações, formatadas em regras e padrões, oriundas da análise de grandes bases de dados. Nesta perspectiva, o desenvolvimento de um raciocínio crítico acerca dos principais conceitos, problemas e algoritmos relacionados a área de Mineração de Dados é a principal habilidade adquirida por quem conclui o curso.
O conteúdo visto é praticado na ferramenta WEKA, que é gratuita e de fácil entendimento.
São 6 laboratórios totalmente práticos que você pode realizar durante o curso, detalhados e explicados passo a passo.
Você entenderá os algoritmos e poderá praticar com suas bases de dados, seja arquivo texto ou banco de dados.
Contará com um Framework integrado que apresenta os resultados estatísticos.
PYTHON
Neste curso você também verá Python. Python é uma linguagem de programação de alto nível que vem sendo adota em todas as grandes universidades do mundo todo. Neste curso você aprenderá conceitos básicos da linguagem Python, como estruturas condicionais e de repetição, manipulação de strings, listas e arquivos. Tudo isso apresentado com uma metodologia simples, direta e sem enrolação.