16/05/24
7 min de leitura
Preparação Técnica para Entrevistas na área de Dados: Frequências de stacks nas vagas de dados da Impulso
Paulo DalpianSe você está se preparando para uma entrevista na área de Dados, é essencial ter um sólido domínio das tecnologias e ferramentas em alta demanda no mercado. Com base em nossa análise das vagas disponíveis, compilamos uma lista de algumas das stacks mais frequentemente requisitadas e trouxemos algumas dicas sobre como se preparar para se destacar durante o processo de entrevista. O gráfico a seguir mostra as 16 habilidades mais requisitadas, em ordem decrescente, que extraímos de nosso histórico de vagas em Dados. É importante notar que essa lista lida principalmente com hard skills (aquelas mais focadas em habilidades rígidas como matemática, codificação, estatística e lógica). Mas é sempre importante lembrar que a carreira em Dados também exige muito de nossas soft skills (aquelas habilidades mais sociais, como trabalhar em grupo, liderar, falar em público, comunicar e difundir relatórios).
1. Python:
Python é uma linguagem de programação fundamental para qualquer profissional de dados. Certifique-se de estar confortável com os conceitos básicos da linguagem, como manipulação de dados, estruturas de controle e bibliotecas populares como Pandas e NumPy.
Alguns recursos para estudar e aprender mais sobre Python:
edX (https://www.edx.org/): Cursos grátis de Python de universidades como MIT e Harvard.
SoloLearn (https://www.sololearn.com/pt/): Um app que oferece tutoriais de Python, testes avaliativos, e uma comunidade de pessoas em suas jornadas de aprendizado.
Aula de Python do Google (https://developers.google.com/edu/python?hl=pt-br): Um curso grátis para pessoas com um pouquinho de experiência em programação e que queiram aprender Python.
Automate the Boring Stuff with Python (https://automatetheboringstuff.com/): Um livro de Al Sweigart, disponível online de forma gratuita, focado em projetos de Python para iniciantes.
YouTube: Há muitos tutoriais de Python no Youtube, indo do nível iniciante ao avançado. Busque por “Tutorial em Python” e muitos vídeos serão oferecidos. Lembre-se de buscar vídeos bem avaliados (likes) e com bastante visualizações para achar materiais bem difundidos e julgados positivamente.
Documentação oficial do Python (https://docs.python.org/pt-br/3/): Quando em dúvida, vá para a documentação! A documentação oficial do Python está disponível em Português Brasileiro, e pode ajudar a tirar dúvidas ou entender o conceito fundamental por trás de funções e métodos.
Kaggle (https://www.kaggle.com/): Aqui você encontra uma comunidade de cientistas de dados em todos os níveis – além de oferecer Notebooks de Python gratuitos, tutoriais, e bases de dados para praticar.
2. AWS:
A computação em nuvem é onipresente na indústria de tecnologia, e a Amazon Web Services (AWS) é uma das principais provedoras. Familiarize-se com os serviços essenciais da AWS, como S3, EC2 e Redshift, e saiba como eles são usados para construir soluções escaláveis de dados. Alguns recursos gratuitos para aprender AWS incluem:
AWS Free Tier: É possível praticar nos serviços da AWS usando o nível gratuito (Free Tier). Ele provê acesso limitado aos serviços de EC2, S3, Lambda e mais. Isso permite experimentar sem custos.
Documentação da AWS Documentation: A página de documentação da AWS tem muitos artigos com as explicações dos serviços e de sua implementação.
Canal do YouTube da AWS: Procure no YouTube pelas playlists ou vídeos específicos que cubram os tópicos relacionados ao EC2, S3, Lambda, e outros serviços da AWS. Os vídeos do canal da AWS frequentemente incluem demonstrações e tutoriais.
Comunidade e fóruns da AWS: Você pode se engajar com a comunidade da AWS por meio de fóruns como o Stack Overflow, o Subreddit da comunidade de AWS (r/aws) e os fóruns de desenvolvedores da AWS. Lá, você pode perguntar, trocar experiências e aprender com outras pessoas que também trabalham com serviços da AWS.
3. MongoDB:
Como um banco de dados NoSQL amplamente utilizado, o MongoDB é uma habilidade valiosa para qualquer engenheiro de dados. Pratique modelagem de dados, consultas e operações de CRUD nesta plataforma. Você pode encontrar a versão da comunidade (grátis) para fazer self-host ou usar o Atlas comunitário também! Mais informações aqui: https://www.mongodb.com/pt-br/products/self-managed/community-edition
4. SQL:
Apesar da ascensão de bancos de dados NoSQL, o SQL continua sendo uma habilidade crucial. Certifique-se de compreender os fundamentos do SQL, incluindo consultas complexas, junções e otimização de consultas. Tente chegar no ponto em que seja fácil para você explicar para o que serve uma CTE (Common Table Expression), qual a diferença entre Where e Having, o que é uma Window Function, e como montar uma subquery. 🙂
5. MySQL:
MySQL é um dos sistemas de gerenciamento de banco de dados relacionais mais populares. Esteja preparado para demonstrar sua experiência em modelagem de dados, administração e consultas avançadas.
6. Data Engineering:
A engenharia de dados desempenha um papel vital na construção e manutenção de pipelines de dados robustos. Esteja pronto para discutir seus projetos anteriores relacionados à ingestão, processamento e armazenamento de dados em larga escala. Aqui há sinergia com o AWS e com SQL. Compreender como consultas em bancos distintos, preparação e disponibilização dos dados podem funcionar em conjunto com essas outras ferramentas será um ganho inestimável.
7. Azure:
A Microsoft Azure é outra plataforma de computação em nuvem amplamente adotada. Explore os serviços principais do Azure, como Azure Data Lake, Azure SQL Database e Azure Databricks.
PostgreSQL é um sistema de gerenciamento de banco de dados relacional poderoso e de código aberto. Certifique-se de estar confortável com sua administração, consultas avançadas e otimização de desempenho.
Além disso, algumas outras stacks importantes incluem:
Terraform: Ferramenta para provisionamento de infraestrutura como código.
Scala: Linguagem de programação amplamente utilizada em projetos de big data.
S3: Serviço de armazenamento de objetos da AWS.
Redis: Banco de dados em memória utilizado para caching e armazenamento de dados temporários.
Kafka: Plataforma de streaming distribuído para processamento de eventos em tempo real.
Data Science e Data Analysis: Habilidades essenciais para extrair insights significativos dos dados. Aqui se incluem soft skills (como apresentações, falar em público, trabalhar em equipe) e hard skills (estatística, matemática, análise de gráficos, etc).
Cientista de Dados: Conhecimentos avançados em estatística, aprendizado de máquina e visualização de dados.
Dicas para Preparação:
Estude os fundamentos teóricos de cada tecnologia, além de praticar em projetos práticos.
Revise casos de uso comuns e esteja preparado para discutir como você os abordaria.
Pratique resolução de problemas através de plataformas online de desafios de programação.
Esteja preparado para discutir projetos anteriores e como suas habilidades foram aplicadas.
Mantenha-se atualizado com as últimas tendências e desenvolvimentos na área de dados.
Dois pontos importantes:
Não espere estar perfeitamente pronto(a) para uma entrevista, sempre haverá novos caminhos para evoluir, então se candidate e continue evoluindo.
Se tiver dúvidas ou feedbacks sobre esse conteúdo, acesse o nosso Discord. Estou lá no canal “dados”.
Boa sorte!