Orange , R e Weka - Estatística, Data Mining e Visualização
Trabalhe com dados utilizando algoritmos de Machine Learning e muitas informações visuais
What you will learn
Entendendo o R
Instalação do R-studio e R
Primeiros passos com o R
Uso do help
Objetos no R
Tipos de objetos
Vetores
Matrizes
Data frames
Listas
Funções
Identificação de valores faltantes e especiais
Workspace do r(área de trabalho)
Salvar uma workspce
Leitura de uma workspace
Acesso pelo R-studio
Pacotes do R
Entendimento dos diferentes tipos de pacotes
Uso dos comandos library, intall package,require
Trabalhando com leitura de arquivos externos
Leitura através do R-studio
Lendo um arquivo na web
Sumarizando dados
Selecionando dados
Uso dos conectores lógicos
Gráficos (análise de dados e apresentação)
Exportando gráficos
Tipos de gráficos: Histogramas, Ramo e Folha, Box-plot, Gráfico de dispersão,Gráfico de barras, Setores
Programação: Comando FOR, Criando funções pelo R-studio, Uso de Estatísticas
Variáveis qualitativas: Nominais e Ordinais
Variáveis quantitativas: Discretas e Continuas
Análise univariada e bivariada
Teste de hipóteses
Teste de uma distribuição normal
Teste chi-quadrado para aderência
Comparação de duas médias
Comparação de médias múltiplas pelo teste de Tukey
Regressão linear simples,Regressão linear múltipla
Mineração de dados com o R
Uso do Google Vis (biblioteca gráfica do Google)
Machine Learning
Agrupamento, descoberta de grupos em dados
Classificação e modelagem preditiva
Algoritmos de Mineração
Análise Estatística
Trabalhando Widget: Color, Distributions, Pivot Table
Trabalhando Widget: Feature Statistics, Data Sample
Trabalhando com Widget::Paint Data
Trabalhando com Widget::Outliers ,Scatter Plot
Trabalhando com : Create Class
Trabalhando com :Select By data index
Trabalhando com :Edit Domain
Trabalhando com: Freeviz
Trabalhando com: Árvore de Decisão
Trabalhando com: Cluster - Imagens
Trabalhando com: Correlação
Trabalhando com: Cluster – K-means
Contexto da Mineração de Dados - Descoberta de conhecimento em banco de dados, Aplicações práticas
Entender o impacto da mineração de dados, Quais são os dados de entrada e saída na Mineração de Dados
Aprender as técnicas de Mineração de Dados (Conceitos Básicos, Aprendizado de Máquina)
Trabalhar com as técnicas: CLASSIFICAÇÃO, INDUÇÃO DE REGRAS, REGRAS DE ASSOCIAÇÃO, AGRUPAMENTO(CLUSTER) , REDES NEURAIS
Utilizar os algoritmos: ÁRVORES DE DECISÃO, APRIORI, KMEANS,ETC
Aprendizado Bayesiano (Operacionalização do conhecimento minerado e sua interpretação)
Validação do conhecimento descoberto
Aprendendo a utilizar o WEKA: uma ferramenta Java para Classificação, Associação, Clustering e Previsão
Explanação de Interfaces Visuais para interpretação e divulgação do conhecimento (Mineração Visual)
Entendimento e apresentação sobre MINERAÇÃO VISUAL- uso da biblioteca D3js
Description
As grandes empresas estão em busca de profissionais que saibam tratar e trabalhar dados, permitindo que novos insights sejam descobertos e aplicados ao seu negócio.
Pensando nesta necessidade que é cada vez mais crescente, colocamos juntas três(3) das principais ferramentas de mercado no tratamento de dados e na descoberta de informações.
DATA MINING:
Atualmente, a mineração de dados se mostra fundamental para a descoberta de novas informações e conhecimento, formatados em regras e padrões, a partir de grandes bases de dados. Nesta perspectiva, torna-se importante o desenvolvimento de um raciocínio crítico acerca dos principais conceitos, problemas e algoritmos relacionados à área de mineração de dados. Esta abordagem visa uma sintonia com as tendências empregadas atualmente no mercado no uso desta tecnologia de modo a preparar o futuro profissional a avaliar e, sobretudo, facilitar seu entendimento no emprego de metodologias e tecnologias avançadas.
O curso aborda o tema Mineração de Dados, através de aulas práticas e teóricas, utilizando-se de técnicas avançadas de descoberta de conhecimento, os quais provém a capacidade de descobrir novas informações, formatadas em regras e padrões, oriundas da análise de grandes bases de dados. Nesta perspectiva, o desenvolvimento de um raciocínio crítico acerca dos principais conceitos, problemas e algoritmos relacionados a área de Mineração de Dados é a principal habilidade adquirida por quem conclui o curso.
Todo o conteúdo visto é praticado na ferramenta WEKA, que é gratuita e de fácil entendimento.
São 6 laboratórios totalmente práticos que você pode realizar durante o curso, detalhados e explicados passo a passo.
ORANGE:
É uma das poucas ferramentas de mercado, totalmente construida em python, que o analista de dados pode trabalhar de forma totalmente visual, com um amplo aspecto de atendimento a diversas demandas na área de mineração de dados por meio do uso de algoritmos de Machine Learning.
ASPECTOS PRESENTES:
Aprendizado de máquina de código aberto e visualização de dados para iniciantes e especialistas. Fluxos de trabalho de análise de dados interativos com uma grande caixa de ferramentas
execute análise de dados simples com visualização inteligente de dados. Explore distribuições estatísticas, gráficos de dispersão ou mergulhe mais fundo com árvores de decisão, agrupamentos hierárquicos. Até seus dados multidimensionais podem se tornar sensíveis em 2D, especialmente com classificações e seleções inteligentes de atributos.
Exploração interativa de dados para análise qualitativa rápida com visualizações limpas. A interface gráfica do usuário permite que você se concentre na análise exploratória de dados em vez codificação, enquanto padrões inteligentes tornam extremamente fácil a criação rápida de protótipos de um fluxo de trabalho de análise de dados. Coloque widgets na tela, conecte-os, carregue seus conjuntos de dados e colete os insights!
Use vários complementos disponíveis no Orange para extrair dados de fontes de dados externas.
Este curso é o ROADMAP ONE, que contempla a base para iniciar os seus projetos de mineração de dados. Contará ainda com o ROADMAP TWO que dará ênfase aos algoritmos de machine learning mais complexos.
R:
R é um ambiente computacional e uma linguagem de programação que vem progressivamente se especializando em manipulação, análise e visualização gráfica de dados. Na atualidade é considerado o melhor ambiente computacional para essa finalidade. O ambiente está disponível para diferentes sistemas operacionais: Unix/Linux, Mac e Windows.
Foi criado originalmente por Ross Ihaka e por Robert Gentleman no departamento de Estatística da Universidade de Auckland, Nova Zelândia. Posteriormente, foi desenvolvido pelo esforço colaborativo de pessoas em vários locais do mundo
Todo o curso de Linguagem R tem MATERIAL PRÓPRIO, um texto com tudo passo a passo, único e bem articulado.
Agora vamos a descrição do nosso curso de Linguagem R. O objetivo principal do curso é permitir que aspectos básicos com ênfase no entendimento da linguagem R como sua estrutura e a forma de operação sejam compreendidos. O curso foi preparado e estruturado para que desde o iniciante até o mais avançado em técnicas estatísticas aprenda a trabalhar com a ferramenta R. O material pode ser acompanhado utilizando o R instalado em outros sistemas operacionais, tal como Windows ou Linux.
Durante o curso, o aluno terá que assistir as videoaulas e praticar diretamente no seu computador.
A ementa sumarizada é:O que é a Linguagem R, Instalação da Ferramenta, Aprimoramento do Uso doR-Studio, Entendimento do Uso dos Objetos no R (Vetor, Matriz, Data Frame, Lista e Funções),Uso de Pacotes no R, Leitura de Arquivos no R, Sumarizando Dados, Gráficos com o R, Análise Estatística e o Uso Geral da Estatística, Uso de componentes como Mineração de Dados e o GOOGLE VIS.
Venha e junte-se aos seus colegas.
QUEM SOU EU:
- Profissional da área de dados há 15 anos.
- Tenho Mais de 8 anos na área EAD.
- Sou professor de pós-graduação na área de dados há mais de 8 anos.
SEJA MAIS UM ALUNO DESTE CLUBE QUE NÃO PARA DE CRESCER!