Este programa é constituído por três módulos fundamentais e um módulo avançado em deep learning, concebido para transformar engenheiros com formação nas áreas das tecnologias da informação em Data Scientists.
6 out 2020 a 11 jan 2021
5 200 EUR
140 horas
Data Science, aplicação paradigmática das técnicas mais promissoras da Inteligência Artificial e Machine Learning, destaca-se como a tecnologia chave para a transformação digital, tendo a própria profissão de Data Scientist sido considerada pela Harvard Business Review (2012) como The Sexiest Job of the 21st Century.
Mesmo neste novo contexto de pandemia, o Data Science mantém e reforça o seu papel vital nas organizações, ao transformar dados em informação. É esta transformação que permite a descoberta de modelos capazes de prever e antecipar comportamentos, tanto de clientes como de competidores, e que dá às organizações o suporte necessário à tomada informada de decisões, de modo a melhor preparar a sua atividade presente e futura.
O Programa de Especialização em DaSh é constituído por três módulos fundamentais e um módulo avançado em deep learning, concebido para transformar engenheiros com formação nas áreas das tecnologias da informação em Data Scientists. Transformação esta baseada na aquisição dos conhecimentos necessários e suficientes ao desenho e concepção de projetos de descoberta de informação em grandes quantidades de dados.
Este programa, em formato online, é composto por uma componente teórica, ocupando aproximadamente um terço do horário presencial, e uma componente laboratorial, a ocupar os restantes dois terços do horário. O trabalho prático, tanto laboratórios como projetos, serão realizados em Python, assim como os seus pacotes dedicados à ciência de dados, nomeadamente o pandas, matplotlib e sklearn, sendo acompanhado pelos formadores, que discutirão individualmente com cada grupo o trabalho já realizado, e potenciais caminhos a seguir.
• Identificar visualmente perfis de dados;
• Conhecer e aplicar as técnicas mais recentes de classificação, clustering, descoberta de padrões e deteção de anomalias, em particular de deep learning;
• Escolher e aplicar as abordagens mais adequadas de preparação de dados;
• Avaliar a qualidade dos modelos descobertos.
Licenciados ou Mestrados em Eng. Informática, Eng. Eletrotécnica, Matemática Aplicada e Computação, ou com experiência equivalente, sem formação prévia em Ciência de Dados.
Os pré-requisitos para a realização deste curso são os seguintes:
• Fluência na escrita de programas básicos em Python e noções de programação orientada a objetos; noções básicas ao nível da utilização de bases de dados;
• Funções de distribuição e densidade de probabilidades, estimadores elementares e testes de significância;
• Matrizes, operações sobre matrizes, determinantes e valores próprios.
Cláudia Antunes
claudia.antunes@tecnico.ulisboa.pt
Preço: 5200€
Este valor inclui:
• Acesso à plataforma de aprendizagem online do Técnico+;
• Diploma e Certificado.
Reduções e Condições Especiais (não cumulativas):
– Particulares: 10%
– Rede de Parceiros do Instituto Superior Técnico : 20%
– Colaboradores do Instituto Superior Técnico: 10%
– Condições para Associações e protocolos empresariais
Para mais informações contacte catarinagcarvalho@tecnicomais.pt
Condições de Financiamento
O ISA FJN é um apoio da Fundação José Neves para potenciar o acesso à educação, através da atribuição de bolsas de estudo aos participantes, que lhes permitam pagar as propinas no início do programa. Saiba mais sobre o ISA ou candidate-se aqui)
Nota: o número de vagas para este tipo de financiamento é limitado
Horário: 2ª e 4ª-feira, 18h30/21h30 e sábado, 09h00/12h00
* a partir de dia 15 de maio (início do Módulo de Deep Learning), as aulas serão apenas aos sábados
Formato: Online
Módulo | Formador | ECTS |
---|---|---|
1.Módulo I - Introdução à Ciência de Dados e Análise Exploratória |
| |
Duração: 18h Módulo Fundamental • Data Science, KDD process Este módulo apresenta os conceitos básicos da área, e descreve os processos e princípios fundamentas da análise de dados e descoberta de informação. São ainda desmistificadas as relações entre Inteligência Artificial, Aprendizagem e Ciência de Dados, e descritas as diferentes perspetivas de análise exploratória de dados (data profiling). Nomeadamente, são abordadas a dimensionalidade, distribuição, dispersão e granularidade dos dados, dando particular importância à exploração dos diferentes elementos gráficos para representação e sumarização dos mesmos. Serão usados os pacotes pandas e matplotlib. | ||
Módulo 2 - Classificação |
| |
Duração: 60h Módulo Fundamental • Classification Este módulo conjuga as várias técnicas de treino de modelos de classificação sobre dados tabulares, com as diferentes técnicas de preparação e transformação de dados mais adequadas. Para além da apresentação dos cinco paradigmas de classificação (Baeysianos, analogistas, simbolistas, conexionistas e evolucionistas), são descritas as abordagens mais atuais de combinação de modelos (ensembles) e discutidas as medidas e estratégias de avaliação dos modelos encontrados. Em termos de preparação de dados, são aplicadas as operações de escala (normalization e standardization), imputação de missing values, a dummificação de variáveis, a seleção, extração e reengenharia de variáveis (feature selection, feature extraction and feature engineering), assim como as técnicas de balanceamento de dados. Será usado o pacote pandas, matplotlib e sklearn. | ||
Módulo 3 - Análise Não-Supervisionada |
| |
Duração: 30h Módulo Fundamental • Clustering Este módulo aborda as técnicas fundamentais de clustering, descoberta de padrões e deteção de anomalias, acompanhada pela discussão das medidas de avaliação mais adequadas a cada caso. Serão usados os pacotes pandas, matplotlib, sklearn apyori e prefixspan. | ||
Módulo 4 – Deep Learning |
| |
Duração: 30h Módulo Avançado
Este módulo introduz a aprendizagem baseada em redes neuronais profundas, abordando as questões da regularização, treino e otimização das redes. Introduzindo ainda os dois modelos principais das redes profundas – as redes convulsionais (CNNs) e as redes recorrentes (RNNs), discutindo as diferentes aplicações de sucesso das mesmas, assim como a explicabilidade daquelas redes. |
A avaliação consiste em projetos nos módulos I, II e III e em laboratórios de Deep Learning.
Os projectos consistirão na exploração de dois conjuntos de dados, tendo como objetivo a descoberta da informação possível. Serão desenvolvidos em Python, com os pacotes de data science (pandas, matplotlib, seaborn e sklearn).
ECTS: 10
Preencha a ficha de candidatura acima e envie para info@tecnicomais.pt, juntamente com os documentos pedidos. O candidato será depois notificado, pela equipa do Técnico+, se a sua candidatura foi aceite e como pode proceder à inscrição no curso.