O curso Processamento de Big Data em R e Python oferece uma abordagem abrangente sobre as principais técnicas e ferramentas para lidar com grandes volumes de dados, apresentando práticas aplicáveis a diferentes ecossistemas de Big Data. Com uma carga horária de 40 horas em formato EAD (aulas assíncronas e síncronas), o programa integra conhecimentos de SQL e NoSQL, infraestruturas de processamento distribuído (como Apache Spark) e estratégias para manipular dados não estruturados (XML, JSON). Por meio de atividades práticas, os participantes aprenderão a gerenciar e processar grandes bases de dados, potencializando análises em escala e facilitando a tomada de decisões em setores diversos.
O curso destina-se a profissionais e estudantes que possuam conhecimento inicial em SQL, R e Python, e queiram aprofundar suas habilidades de processamento e análise de dados em larga escala. É indicado para quem já domina fundamentos de linguagem de programação e manipulação de dados, e deseja aplicar esses conhecimentos em cenários de Big Data, nos quais a eficiência e a escalabilidade do processamento são fatores cruciais.
Ao concluir o curso, o(a) egresso(a) será capaz de utilizar bancos de dados relacionais e não relacionais de forma integrada, empregando técnicas em R e Python para organizar, transformar e analisar grandes quantidades de dados. Além disso, terá conhecimentos para configurar e executar análises em ambientes distribuídos, como o Apache Spark, dominando formatos e tecnologias amplamente adotados no mercado (Parquet, Kafka, ElasticSearch, entre outros). Dessa forma, o(a) profissional estará apto(a) a propor soluções eficientes para problemas que demandem escalabilidade e velocidade no processamento de dados, atuando em análise de dados, ciência de dados ou engenharia de dados.
Anderson Ara
Graduado em Estatística (2009) e Mestre em Estatística (2011) pela Universidade Federal de São Carlos (UFSCar), Doutor em Estatística (2016) pelos Programas de Pós-Graduação em Estatística e em Ciência da Computação (PPGEst-UFSCar e PPG-CC-UFSCar). Professor Adjunto na Universidade Federal do Paraná (UFPR), atua no Departamento de Estatística em temas de Aprendizado Estatístico de Máquina, Inferência Estatística e Métodos Computacionais. Tem orientado e publicado em periódicos da área e possui experiência em projetos multidisciplinares de pesquisa e desenvolvimento tecnológico.