Processamento de Big Data em R e Python

Instrutor

14 Estudantes inscritos

Descrição
Currículo
Grade

Descrição do Curso

O curso Processamento de Big Data em R e Python oferece uma abordagem abrangente sobre as principais técnicas e ferramentas para lidar com grandes volumes de dados, apresentando práticas aplicáveis a diferentes ecossistemas de Big Data. Com uma carga horária de 40 horas em formato EAD (aulas assíncronas e síncronas), o programa integra conhecimentos de SQL e NoSQL, infraestruturas de processamento distribuído (como Apache Spark) e estratégias para manipular dados não estruturados (XML, JSON). Por meio de atividades práticas, os participantes aprenderão a gerenciar e processar grandes bases de dados, potencializando análises em escala e facilitando a tomada de decisões em setores diversos.

Perfil do Ingressante

O curso destina-se a profissionais e estudantes que possuam conhecimento inicial em SQL, R e Python, e queiram aprofundar suas habilidades de processamento e análise de dados em larga escala. É indicado para quem já domina fundamentos de linguagem de programação e manipulação de dados, e deseja aplicar esses conhecimentos em cenários de Big Data, nos quais a eficiência e a escalabilidade do processamento são fatores cruciais.

Perfil do Egresso

Ao concluir o curso, o(a) egresso(a) será capaz de utilizar bancos de dados relacionais e não relacionais de forma integrada, empregando técnicas em R e Python para organizar, transformar e analisar grandes quantidades de dados. Além disso, terá conhecimentos para configurar e executar análises em ambientes distribuídos, como o Apache Spark, dominando formatos e tecnologias amplamente adotados no mercado (Parquet, Kafka, ElasticSearch, entre outros). Dessa forma, o(a) profissional estará apto(a) a propor soluções eficientes para problemas que demandem escalabilidade e velocidade no processamento de dados, atuando em análise de dados, ciência de dados ou engenharia de dados.

Objetivos do Curso

Apresentar fundamentos de infraestrutura para Big Data, incluindo SQL, NoSQL e Apache Spark.
Capacitar no uso de ferramentas em R para manipular, transformar e analisar grandes bases de dados (dtplyr, data.table, dbplyr, sparklyr).
Demonstrar como Python pode ser empregado para lidar com Big Data, abrangendo conexões com bancos de dados SQL/NoSQL, a biblioteca datatable, PySpark e formatos como XML/JSON.
Explorar tecnologias adicionais relevantes, como DuckDB, Kafka, ElasticSearch e Parquet.
Aprofundar conhecimentos de manipulação de dados não estruturados, consolidados em XML e JSON, visando desempenho e escalabilidade.

Instrutores

Anderson Ara
Graduado em Estatística (2009) e Mestre em Estatística (2011) pela Universidade Federal de São Carlos (UFSCar), Doutor em Estatística (2016) pelos Programas de Pós-Graduação em Estatística e em Ciência da Computação (PPGEst-UFSCar e PPG-CC-UFSCar). Professor Adjunto na Universidade Federal do Paraná (UFPR), atua no Departamento de Estatística em temas de Aprendizado Estatístico de Máquina, Inferência Estatística e Métodos Computacionais. Tem orientado e publicado em periódicos da área e possui experiência em projetos multidisciplinares de pesquisa e desenvolvimento tecnológico.

Informações Gerais