Omega Data Academy

Mineração de Textos Avançado

1 Estudante inscritos
0
0 avaliações
  • Descrição
  • Currículo
  • Reviews
  • Grade
cnj-mineracao-de-textos-avancado

Descrição do Curso

O curso Mineração de Textos Avançado explora técnicas e práticas essenciais de processamento de linguagem natural (NLP) para análise profunda de textos. Ao longo de 40 horas, oferecidas em formato EAD (mesclando atividades assíncronas e síncronas), o programa abrange desde abordagens clássicas de extração e pré-processamento até métodos contemporâneos de tradução, embedding e uso de large language models. As aplicações práticas serão desenvolvidas com R e Python, proporcionando uma visão abrangente das bibliotecas e ferramentas disponíveis para tarefas de análise textual.

Perfil do Ingressante

O curso destina-se a profissionais e estudantes que possuam conhecimentos básicos em R e Python, interessados em aprimorar suas habilidades de análise de dados textuais. É recomendado que o(a) ingressante esteja familiarizado(a) com conceitos de manipulação de dados, aprendizado de máquina e, idealmente, já tenha tido contato inicial com técnicas de pré-processamento de texto. O principal motivador é adquirir competências para realizar análises textuais robustas e solucionar problemas práticos de classificação, clustering, modelagem de tópicos e outras aplicações em NLP.

Perfil do Egresso

Ao concluir o curso, o(a) profissional estará apto(a) a aplicar técnicas avançadas de mineração de textos em ambientes de R e Python, compreendendo desde aspectos básicos de pré-processamento até a implementação de soluções com large language models. Será capaz de conduzir análises de sentimentos, classificação, agrupamento de documentos, tradução automática, extração de entidades e sumarização de textos, atuando de forma versátil em projetos que demandem compreensão e manipulação de conteúdo textual em grande escala, no setor acadêmico ou corporativo.

Objetivos do Curso

  • Capacitar na extração e manipulação de dados textuais, com foco em formatos comuns (PDF, XML, JSON).
  • Desenvolver competências em análise de sentimentos, classificação de documentos e modelagem de tópicos.
  • Aprender a utilizar metodologias avançadas de tradução, embedding, extração de entidades e análise gramatical.
  • Integrar soluções em R e Python, aplicando bibliotecas populares (NLTK, spaCy, scikit-learn, tm, tidytext, tidymodels).
  • Explorar recursos de large language models, ampliando as possibilidades de geração e análise de textos.

Instrutor

  • Luis Gustavo Silva e Silva
    Doutor e Mestre em Estatística pela Universidade Federal de Minas Gerais (UFMG), desenvolvendo pesquisas em modelagem e visualização de texto (COWORDS). Atuou no setor privado como cientista de dados e como Pesquisador Associado na UFMG em projetos de estatísticas de saúde e sociais. Possui experiência em projetos envolvendo Hadoop, aprendizado de máquina e processamento de dados de saúde. Atualmente cientista de dados na FAO, dedica-se à aplicação de técnicas avançadas de mineração de texto para aprimorar estatísticas oficiais, contando com extensa experiência em R, Python e ambientes de processamento distribuído.
Grade details
Curso:
Estudante:
Enrollment date:
Course completion date:
Grade:
Grade Points
Grade Range
Exams:
Sign in to account to see your Grade
Compartilhar
Obter curso
Disponível neste planos:
Detalhes do curso
Duração 10 semanas
Lições 18
Quizzes 1
Nível Intermediário