Impulsojunte-se à Impulso

16/05/24

7 min de leitura

Preparação Técnica para Entrevistas na área de Dados: Frequências de stacks nas vagas de dados da Impulso

Paulo DalpianPaulo Dalpian

Se você está se preparando para uma entrevista na área de Dados, é essencial ter um sólido domínio das tecnologias e ferramentas em alta demanda no mercado. Com base em nossa análise das vagas disponíveis, compilamos uma lista de algumas das stacks mais frequentemente requisitadas e trouxemos algumas dicas sobre como se preparar para se destacar durante o processo de entrevista. O gráfico a seguir mostra as 16 habilidades mais requisitadas, em ordem decrescente, que extraímos de nosso histórico de vagas em Dados. É importante notar que essa lista lida principalmente com hard skills (aquelas mais focadas em habilidades rígidas como matemática, codificação, estatística e lógica). Mas é sempre importante lembrar que a carreira em Dados também exige muito de nossas soft skills (aquelas habilidades mais sociais, como trabalhar em grupo, liderar, falar em público, comunicar e difundir relatórios).

1. Python:
Python é uma linguagem de programação fundamental para qualquer profissional de dados. Certifique-se de estar confortável com os conceitos básicos da linguagem, como manipulação de dados, estruturas de controle e bibliotecas populares como Pandas e NumPy.
Alguns recursos para estudar e aprender mais sobre Python:

edX (https://www.edx.org/): Cursos grátis de Python de universidades como MIT e Harvard.
SoloLearn (https://www.sololearn.com/pt/): Um app que oferece tutoriais de Python, testes avaliativos, e uma comunidade de pessoas em suas jornadas de aprendizado.
Aula de Python do Google (https://developers.google.com/edu/python?hl=pt-br): Um curso grátis para pessoas com um pouquinho de experiência em programação e que queiram aprender Python.
Automate the Boring Stuff with Python (https://automatetheboringstuff.com/): Um livro de Al Sweigart, disponível online de forma gratuita, focado em projetos de Python para iniciantes.
YouTube: Há muitos tutoriais de Python no Youtube, indo do nível iniciante ao avançado. Busque por “Tutorial em Python” e muitos vídeos serão oferecidos. Lembre-se de buscar vídeos bem avaliados (likes) e com bastante visualizações para achar materiais bem difundidos e julgados positivamente.
Documentação oficial do Python (https://docs.python.org/pt-br/3/): Quando em dúvida, vá para a documentação! A documentação oficial do Python está disponível em Português Brasileiro, e pode ajudar a tirar dúvidas ou entender o conceito fundamental por trás de funções e métodos.
Kaggle (https://www.kaggle.com/): Aqui você encontra uma comunidade de cientistas de dados em todos os níveis – além de oferecer Notebooks de Python gratuitos, tutoriais, e bases de dados para praticar.

2. AWS:
A computação em nuvem é onipresente na indústria de tecnologia, e a Amazon Web Services (AWS) é uma das principais provedoras. Familiarize-se com os serviços essenciais da AWS, como S3, EC2 e Redshift, e saiba como eles são usados para construir soluções escaláveis de dados. Alguns recursos gratuitos para aprender AWS incluem:

AWS Free Tier: É possível praticar nos serviços da AWS usando o nível gratuito (Free Tier). Ele provê acesso limitado aos serviços de EC2, S3, Lambda e mais. Isso permite experimentar sem custos.
Documentação da AWS Documentation: A página de documentação da AWS tem muitos artigos com as explicações dos serviços e de sua implementação.
Canal do YouTube da AWS: Procure no YouTube pelas playlists ou vídeos específicos que cubram os tópicos relacionados ao EC2, S3, Lambda, e outros serviços da AWS. Os vídeos do canal da AWS frequentemente incluem demonstrações e tutoriais.
Comunidade e fóruns da AWS: Você pode se engajar com a comunidade da AWS por meio de fóruns como o Stack Overflow, o Subreddit da comunidade de AWS (r/aws) e os fóruns de desenvolvedores da AWS. Lá, você pode perguntar, trocar experiências e aprender com outras pessoas que também trabalham com serviços da AWS.

3. MongoDB:
Como um banco de dados NoSQL amplamente utilizado, o MongoDB é uma habilidade valiosa para qualquer engenheiro de dados. Pratique modelagem de dados, consultas e operações de CRUD nesta plataforma. Você pode encontrar a versão da comunidade (grátis) para fazer self-host ou usar o Atlas comunitário também! Mais informações aqui: https://www.mongodb.com/pt-br/products/self-managed/community-edition

4. SQL:
Apesar da ascensão de bancos de dados NoSQL, o SQL continua sendo uma habilidade crucial. Certifique-se de compreender os fundamentos do SQL, incluindo consultas complexas, junções e otimização de consultas. Tente chegar no ponto em que seja fácil para você explicar para o que serve uma CTE (Common Table Expression), qual a diferença entre Where e Having, o que é uma Window Function, e como montar uma subquery. 🙂

5. MySQL:
MySQL é um dos sistemas de gerenciamento de banco de dados relacionais mais populares. Esteja preparado para demonstrar sua experiência em modelagem de dados, administração e consultas avançadas.

6. Data Engineering:
A engenharia de dados desempenha um papel vital na construção e manutenção de pipelines de dados robustos. Esteja pronto para discutir seus projetos anteriores relacionados à ingestão, processamento e armazenamento de dados em larga escala. Aqui há sinergia com o AWS e com SQL. Compreender como consultas em bancos distintos, preparação e disponibilização dos dados podem funcionar em conjunto com essas outras ferramentas será um ganho inestimável.

7. Azure:
A Microsoft Azure é outra plataforma de computação em nuvem amplamente adotada. Explore os serviços principais do Azure, como Azure Data Lake, Azure SQL Database e Azure Databricks.

PostgreSQL é um sistema de gerenciamento de banco de dados relacional poderoso e de código aberto. Certifique-se de estar confortável com sua administração, consultas avançadas e otimização de desempenho.

Além disso, algumas outras stacks importantes incluem:

Terraform: Ferramenta para provisionamento de infraestrutura como código.
Scala: Linguagem de programação amplamente utilizada em projetos de big data.
S3: Serviço de armazenamento de objetos da AWS.
Redis: Banco de dados em memória utilizado para caching e armazenamento de dados temporários.
Kafka: Plataforma de streaming distribuído para processamento de eventos em tempo real.
Data Science e Data Analysis: Habilidades essenciais para extrair insights significativos dos dados. Aqui se incluem soft skills (como apresentações, falar em público, trabalhar em equipe) e hard skills (estatística, matemática, análise de gráficos, etc).
Cientista de Dados: Conhecimentos avançados em estatística, aprendizado de máquina e visualização de dados.

Dicas para Preparação:
Estude os fundamentos teóricos de cada tecnologia, além de praticar em projetos práticos.
Revise casos de uso comuns e esteja preparado para discutir como você os abordaria.
Pratique resolução de problemas através de plataformas online de desafios de programação.
Esteja preparado para discutir projetos anteriores e como suas habilidades foram aplicadas.
Mantenha-se atualizado com as últimas tendências e desenvolvimentos na área de dados.

Dois pontos importantes:

Não espere estar perfeitamente pronto(a) para uma entrevista, sempre haverá novos caminhos para evoluir, então se candidate e continue evoluindo.
Se tiver dúvidas ou feedbacks sobre esse conteúdo, acesse o nosso Discord. Estou lá no canal “dados”.

Boa sorte!

Nós usamos cookies para melhorar sua experiência no site. Ao aceitar, você concorda com nossa Política de Privacidade

Assine nossa newsletter

Toda semana uma News com oportunidades de trabalho, conteúdos selecionados, eventos importantes e novidades sobre o Mundo da Tecnologia.

Pronto, em breve você vai receber novidades 👍