Analise com Text Mining e Plot Gráficos com GGPLOT2 - no R
Conheça como analisar textos diversos e produza gráficos e infográficos na linguagem R
What you will learn
Processo de obtenção de informações importantes de um texto
Recuperação de informações, extração de dados, aprendizado de máquina, estatísticas e linguística computacional
Agrupamento de texto, extração de conceito/entidade, produção de taxonomias granulares, análise de sentimentos
Nuvem de Palavras
Corpus
Tokenização
Tokens
Frequência de Palavras
Stopwords
Processo de Text Mining
Utilização de pacotes: BiocManager, rvest, stringr,lexiconPT,widyr, ggraph, igraph, tibble
Utilização de pacotes: TM, tidyr, ggplot2, SnowballC, dplyr, tidytext, wordcloud, RColorBrewer
Ajustes e transformação nos textos: radicais, eliminação de espaços em branco, palavras indesejadas
Criação de Matriz Termo Documento
Correlação entre textos, palavras mais ditas, associação entre palavras
Análise de Sentimento
Web scraping
Comandos: VCorpus, inspect, meta, lapply, tm_map, stopwords, documentTermMatrix, findFreqTerms
Comandos: FindAssocs, bind_tf_idf, count, arrange, filter, geom_col, unnest_tokens, anti_join, pairwise_cor
Comandos: Inner_join, group_by, summarize, mutate, barchart, str_c, str_detect, str_subset, str_which, str_count, str_replace_all
Comandos: Tolower, removePunctuation, removeNumbers, stripWhitespace, stemDocument
Estudo de Ngrams, em especial Bigrams
Definição sobre a construção de gráficos e infográficos
Uso do R Studio Packages
Uso do R graph gallery
Uso do R package GGPLOT2
Trabalhando no R Studio Cloud
Visualizando dados no GGPLOT2
Camadas gráficas geom()
Componente ggplot e suas camadas
mapping, aes, dentre outros componentes
Tipos de formas geométricas
geom_point, geom_boxplot, geom_histogram
geom_bar, geom_hline,geom_abline
geom_violin,geom_tile,geom_area,geom_segment
grid arrange - união de gráficos, geração de infográficos
Utilizando GGPLOT2 e DPLYR
Gráficos Diferenciados: Connect scatterplot, 2d Density Plot, Wordcloud, Lollipop
Gráficos Diferenciados: Treemap, Donut, Setores(pizza). Dedograma,Circular Packing
Interações nos gráficos com PLOTLY
geom_polygon, geom_text,geom_rect,geom_label
Why take this course?
Uma das áreas mais pujantes nas grandes empresas hoje em dia é a construção de algoritmos de machine learning e o uso de descoberta de dados por ferramentas visuais. Para este curso trago estas duas grandes novidades, o uso de Mineração de texto com a linguagem R que é a base para o estudo de PNL e identificação de tokens (palavras) com correlação dentro de textos e a construção de gráficos pelo uso do R GGPLOT2 que transforma os resultados de seus dados processados em belas imagens para tomada de decisão.
O Text Mining será por meio da leitura de arquivos de texto de diversos assuntos e análises serão criadas para entendermos: qual a correção entre os textos, qual é a análise de sentimento entre os texto, quais as palavras mais relevantes e que identificam o texto, enfim, fazer uma análise sintática e morfológica das informações contidas no texto.
Já o uso do R GGPLOT2 é algo que vai além de execução de scripts dentro da linguagem R, é a forma mais prática de geração de resultados utilizando gráficos de barras, setores, pontos, wordcloud, dentre muitos outros na resolução de seus problemas.
Por isso, convido você a vir comigo trabalhar com dados, fazer uma imersão completa nestes dois grandes treinamentos que estão reunidos em um único, participar ativamente das atividades que trabalhamos passo a passo.
Sou profissional da área de dados há mais de 15 anos, e possuo conhecimento principalmente na construção de projetos ligados a área de dados.
Aguardo você!