Skip to content

Notas de aulas do Programa Desenvolve na trilha de Dados

Notifications You must be signed in to change notification settings

mbaliu-treino/Desenvolve

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Desenvolve

Notas de aulas do Programa Desenvolve na trilha de Dados. A formação é composta dos seguintes temas e carga horária prevista:

  • Ciência de dados: 310 h
  • Business Intelligence: 250 h
  • Soft Skills: 65 h
  • Metodologia Ágil: 50 h

A seguir seguem os repositórios do portfólio organizados por temas (EM CONSTRUÇÃO):

DATA SCIENCE

O que é Data Science? É o conjunto de metodologias e processos para extração de informações dos dados, abrangendo todas as etapas de limpeza dos dados, exploração, formulação de modelos. É comum compreender este campo de estudo como a intersecção dos campos da estatística, da ciência da computação e do conhecimento do negócio.

COMPUTAÇÃO

É o campo de estudo de técnicas, metodologias e instrumentos de aplicação da tecnologia na informatização dos processos e processamento de dados baseados na computador. Aqui são usadas técnicas de estruturas dados dentro dos computadores (como os Bancos de Dados ou estruturas no Python, como os dicionários), ferramentas para operacionalizá-los (as linguagens de programação) e de formas de comunicação entre máquinas (os acessos através APIs).

ANÁLISE DE DADOS

A análise de dados objetiva obter informações e até mesmo conhecimento a partir dos dados brutos. Ela é composta por diversas ferramentas e estratégias que auxiliam a obter insights/informações do comportamento para auxiliar a tomada de decisões, ou seja, é a base da estratégia de negócio data-driven. Basicamente fazem parte deste campo a análise exploratória dos dados, análise estatística e visualização.

ESTATÍSTICA

MACHINE LEARNING

Machine Learning é o termo usado para a capacidade de um equipamento de usar dados passados para realizar análises preditivas através da identificação de padrões nos dados. Um modelo de ML é um algorítmo, já treinado com dados, preparado para realizar predições para futuros eventos/registros. A qualidade do modelo é a resultado do conjunto de: da qualidade dos dados usados para treinamento, das transformações dos dados e da estratégia de aprendizagem estatística. As principais etapas são: entedimento dos dados, pré-processamento/tratamento, construção do modelo, validação do modelo e deploy (disponibilização).

PRE-PROCESSAMENTO - TRANSFORMAÇÕES

MODELOS DE MACHINE LEARNING

CLASSIFICAÇÃO

REGRESSÃO

  • Regressão Linear: testando relações e prevendo resultados (modelo preditivo)
  • Regressão Linear: técnicas avançadas de modelagem (transformações)

NÃO-SUPERVISIONADOS

DEPLOY

A etapa de deploy é o momento de transformação do modelo de desenvolvimento para o modelo de operação. Então o foco deixa de ser a exploração invetigativa e passa a ser a disponibilização do modelo por outros usuários. Este campo, pela relação com a cultura DevOps, chama-se de MLOps.

VALIDAÇÃO

APLICAÇÕES E SOLUÇÕES

DEEP LEARNING

NLP

Processamento de Linguagem Natural (PLN) ou, do inglês, Natural Language Processing (NLP), é uma área de estudo que combina ciência da computação, linguística e inteligência artificial para possibilitar que uma máquina possa compreender automaticamente frases escritas ou faladas por humanos, esta são chamadas de Linguagem Natural.

VISÃO COMPUTACIONAL

A Visão Computacional é uma área de estudo da inteligência artificial destinada que as imagens consigam compreender imagens ou vídeos, possibilitando a identificação de objetos, a descrição da imagem e de seus objetos, atribuição de tags pertinentes, a segmentação etc. Costumam realizar a aprendizagem através de Deep Learning e Redes Neurais Convolucionais.

URBAN DATA SCIENCE

METODOLOGIA ÁGIL

O método Ágil é uma metodologia de gestão de projetos que surge como uma alternativa método clássico Waterfall.