Machine Learning / IA (Python) do Zero à Primeira Vaga
Um caminho possível (não o único), no seu ritmo: conceitos matemáticos, código prático, e projetos reais. Ajuste sem culpa.
Antes de começar (premissas)
- Ponto de partida: zero técnico real em ML (Python intermediário é bônus, mas não obrigatório).
- Ritmo: 3 a 5h por dia. Consistência e experimento valem mais que velocidade.
- Stack alvo: Python, NumPy, Pandas, Scikit-learn, TensorFlow ou PyTorch, Jupyter, Git.
- IA/ML desde a semana 1 como exploração prática, não teórica no vácuo.
- Portfólio é tudo: 3 a 4 projetos reais (não Kaggle pronto) valem mais que cursos finitos.
- Mês 12-14 é buffer: se chegar pronto antes, ótimo; se precisar mais tempo para projects, ajusta sem culpa.
- Habilidade matemática cresce com prática, não com lecionar equações: aprenda fazendo.
Trilha de IA (paralela)
Usa Claude/ChatGPT para entender por trás da equação, debugar código estranho, explicar por que um modelo não converge.
GitHub Copilot ou Claude Code pro boilerplate, imports, formatação. Mas você entende, refaz e explica cada linha.
IA ajuda a explorar correlações, gerar hipóteses, criar novas features. Você valida e entende.
Scripts que testam variações de modelos, hiperparâmetros e features automaticamente. Você aprende vendo padrões.
Pipeline automatizado: preparação -> treinamento -> avaliação -> deploy. IA ajuda com CI/CD, monitoramento, versioning.
O caminho, parada por parada
- Semana 1
Setup, Python hardcore e primeiro notebook
Ambiente pronto, Python fluente, e a mente aberta pra matemática prática.
Recursos, projetos e entregável
Nível 1 começa aqui: IA como tutor.
Recursos (PT-BR)
- Documentação oficial do Python em PT-BR
- Curso Python para Ciência de Dados, Flávio Corvaro
- NumPy quickstart
Projetos pra fixar
Marco: Ambiente rodando, primeiro notebook com dados, Jupyter fluente.
- Mês 1 (Semanas 2-4)
Fundamentos de dados com Pandas e estatística básica
Manipulação de dados do mundo real: limpeza, exploração, agregações.
Recursos, projetos e entregável
Nível 1 sólido. Peça para explicar por trás de correlação, desvio padrão, distribuições.
Entregável: 5 mini-projetos de EDA (exploração) em notebooks
Recursos (PT-BR)
- Pandas documentation
- 10 Minutos com Pandas em PT-BR
- StatQuest com Josh Starmer, YouTube (correlação, distribuição, Z-score)
Projetos pra fixar
Marco: Lê um CSV, limpa, explora, faz 3 perguntas com dados e responde com gráficos.
- Mês 2 (Semanas 5-8)
Introdução a Scikit-learn e regressão linear
Primeiro modelo supervisionado: entender overfitting, validação, métricas reais.
Recursos, projetos e entregável
Nível 1-2: explique os passos, IA explica a matemática se travar.
Entregável: 3 modelos regressivos com validação no portfólio
Recursos (PT-BR)
- Scikit-learn getting started
- Hands-On Machine Learning (caps 1-3, via biblioteca)
- ML Mastery, Jason Brownlee (regressão linear)
Projetos pra fixar
Marco: Treina um modelo, avalia em dados unseen, entende overfitting e métricas.
- Mês 3 (Semanas 9-12)
Classificação e árvores de decisão
Problemas binários/multiclasse, feature importance, primeiros padrões emergentes.
Recursos, projetos e entregável
Nível 2: Cursor/Claude Code no fluxo, você escreve o pipeline.
Entregável: Sistema de classificação no portfólio (ex: detecção de fraude, diagnóstico)
Recursos (PT-BR)
- Scikit-learn classification guide
- Curso Aprenda Machine Learning em 7 dias (semana 3)
- Intuitive Explanations of Confusion Matrix, StatQuest
Projetos pra fixar
Marco: Treina 3+ modelos, explica trade-off entre métricas, diagnostica classe com recall baixo.
- Mês 4-5 (Semanas 13-20)
Feature engineering e ensemble (primeiros projetos maiores)
Transformar dados brutos em features que modelos entendem bem.
Recursos, projetos e entregável
Nível 3: IA sugere hipóteses sobre features, você experimenta e valida.
Entregável: 2 projetos com feature engineering robusto e notebook explicativo
Recursos (PT-BR)
- Feature Engineering for Machine Learning, Alice Zheng
- XGBoost documentation
- Kaggle Learn: Feature Engineering track
Projetos pra fixar
Marco: Cria features que melhram modelo, explica por quê, usa ensemble com hiperparâmetros sintonizados.
- Mês 6 (Semanas 21-24)
Deep learning: redes neurais e TensorFlow/Keras
Imagens, séries temporais, redes convolucionais e RNNs básicas.
Recursos, projetos e entregável
Nível 3-4: IA ajuda com arquitetura e debugging de treinamento.
Entregável: 3 modelos deep + 1 CNN em produção (local)
Recursos (PT-BR)
- TensorFlow documentation
- Keras guide
- Fast.ai (lesson 1-3, visão computacional)
- Deep Learning Specialization resumido, Coursera
Projetos pra fixar
Marco: Treina CNN com transfer learning, entende overfitting, consegue prever série temporal com LSTM.
- Mês 7 (Semanas 25-28)
PyTorch, modelos maiores e experimentação avançada
Mais controle, custom layers, modelos modernos, ablation studies.
Recursos, projetos e entregável
Nível 4: IA ajuda automatizar experimentos, testar variações.
Entregável: 1 projeto com ablation ou comparação de arquiteturas
Recursos (PT-BR)
- PyTorch tutorials
- HuggingFace documentation
- Attention is All You Need paper (overview, não álgebra)
Projetos pra fixar
Marco: Escreve modelo customizado, entende attention, faz ablation clara.
- Mês 8-9 (Semanas 29-36)
Projeto integrador 1: ponta a ponta com deploy local
Unificar: dados -> features -> modelo -> avaliação -> aplicação pronta.
Recursos, projetos e entregável
Nível 4-5: automação de pipeline, logging, monitoramento.
Entregável: Projeto fullstack ML deployado localmente (API + frontend ou CLI)
Recursos (PT-BR)
Projetos pra fixar
Marco: Projeto do zero ao deploy local, README que explica decisões, modelo versionado, pipeline reproduzível.
- Mês 10-11 (Semanas 37-44)
Projeto integrador 2: profundidade em um eixo
Escolher um eixo: visão (detecção de objetos), NLP, series temporais, MLOps ou domínio específico.
Recursos, projetos e entregável
Nível 5: automação avançada de experimentação, pipeline CI/CD pro ML.
Entregável: Projeto com arquitetura mais sofisticada no eixo escolhido
Recursos (PT-BR)
- YOLO documentação (se visão)
- NLP with Transformers (Hugging Face)
- Time Series Forecasting with Prophet
- Practical MLOps, Noah Gift
Projetos pra fixar
Marco: Domina um eixo, modelo sofisticado, paper/blog post ou apresentação explicando abordagem.
- Mês 12-14 (Buffer)
Portfólio, habilidades blandas e preparação para mercado
Polimento, comunicação, redes, primeiras oportunidades.
Recursos, projetos e entregável
Consolidar habilidades de IA adquiridas, usar em entrevistas técnicas.
Entregável: Portfólio pronto (GitHub + LinkedIn + site pessoal), 1 blog post técnico ou vídeo
Recursos (PT-BR)
- Comunidade Machine Learning Brasil no Slack
- PyData Brasil, eventos e networking
- Towards Data Science (PT), Medium
Projetos pra fixar
Marco: Pronto para processo seletivo, portfólio que conversa, rede formada.
Checklist final
Princípios
- Erre muito: errar é entender. Cada erro é um padrão que nunca mais faz.
- Matemática cresce com prática: não precisa memorizar fórmulas, só entender intuição.
- Dados são tudo: garbage in, garbage out. Gaste mais tempo em EDA do que em tuning.
- Validação honesta: se treina em tudo, não aprende em nada. Test set é sagrado.
- Portfolio > Certificados: construir bate diploma. Mostre o que fez.
- Comunidade acelera: pergunte, aprenda com outros, compartilhe.
- Honestidade em uncertainty: 'não sei' + plano é melhor que fazer algo arbitrário.
- Reprodutibilidade é profissionalismo: código que roda em outro PC, seedado, documentado.