Jornada em Ciência de Dados


01 a 05 de fevereiro de 2021


'
AVISO: Os certificados de participação, para os inscritos na Jornada em Ciência de Dados, serão emitidos e encaminhados até fim de março.



SOBRE O EVENTO


O tratamento do dilúvio de dados sendo produzido pelas ciências e por bilhões de usuários de serviços de Internet globais se apresenta como um dos grandes desafios para a atual sociedade do conhecimento. Apresentado de forma geral como um vetor de múltiplas facetas, o fenômeno ainda está sendo interpretado pelos cientistas e vem impulsionando iniciativas em diversas áreas.

Nas ciências, o dilúvio apareceu como a expressão de uma nova maneira de investigação, incitando biólogos, astrônomos, bioquímicos, e demais pesquisadores em diversas áreas científicas, a enfrentarem problemas computacionais na chamada e-ciência, que se tornam barreiras para as suas descobertas. Na indústria, o dilúvio de dados aparece em sintonia com o ambiente de computação em nuvem, provendo escalabilidade e tolerância a falhas, em ambientes computacionais cada vez mais complexos e de tamanho proporcional ao desafio. Na setor governamental, há oportunidade de se debruçar sobre imensas bases de dados do setor público com vistas a gerar planejamento mais eficiente bem como novos serviços que possam melhorar o atendimento ao cidadão.



Novas profissões especializadas no trato e, principalmente, na análise e interpretação de grandes volumes de dados, surgiram trazendo o método científico para o setor empresarial. Neste contexto, observa-se que a demanda por profissionais com formação de cientista de dados é crescente no eixo ciência-indústria-governo. Esse profissional tem uma expectativa de formação tipicamente sólida em ciência da computação e aplicações, modelagem, estatística, analítica e matemática, além do conhecimento mínimo do domínio de aplicação, dada a atuação intrinsecamente interdisciplinar. A Jornada de Ciência de Dados tem por objetivo apresentar um resumo das áreas envolvidas nesta nova disciplina projetando o LNCC como instituição nacional de referência nesta área. Adicionalmente, propõe-se organizar um Workshop de 1 dia (6a feira, 05/02/2020) onde representantes do governo, academia e indústria discutirão os desafios na área e perspectivas de projetos conjuntos.

Organização

  • Artur Ziviani - LNCC
  • Eduardo Soares Ogasawara - CEFET-RJ
  • Fabio André Machado Porto - LNCC

Importante

  • Inscrições nas atividades da Jornada em Ciências de Dados acontecerão no período de 01 de dezembro de 2020 a 05 de janeiro de 2021 na aba Incrições.
  • Formato da apresentação dos minicursos: Os minicursos serão ministrados na forma síncrona/online, pela plataforma Zoom, em data e horários específicos para cada minicurso.
  • Informações detalhadas da programação encontram-se abaixo. Toda a programação da Jornada em Ciência de Dados será gravada e disponibilizada, após o encerramento do Programa de Verão 2021, no canal YouTube do LNCC.




PROGRAMAÇÃO





WORKSHOP EM CIÊNCIA DE DADOS (05/02/2021)


O Workshop contará com sessões técnicas proferidas por palestrantes convidados com duração de 30 minutos e palestras plenárias de 1 hora de duração. Contará, igualmente, com um painel de discussão sobre os desafios da área e possibilidade de projetos conjuntos. Espera-se uma participação diversificada contemplando governo, academia e indústria.

Abertura e visão geral das atividades de Ciência de Dados no LNCC
  • Apresentadores: Artur Ziviani (LNCC) e Fabio Porto (LNCC)
  • Horário: 09:00h - 09:30h
[Keynote 1] Inteligência Artificial para quantificação do dano pulmonar pelo COVID-19
  • Apresentador: Felipe Kitamura (DASA)
  • Horário: 09:30h - 10:30h
  • Resumo: Uma das grandes dúvidas no atendimento de pacientes com COVID-19 é saber quem vai precisar de internação, ou de ventilação mecânica, ou mesmo quem irá evoluir para óbito. Com o uso de modelos de Machine Learning é possível utilizar dados clínicos, laboratoriais e de exames de imagem para predizer desfechos clínicos nesses pacientes. Nessa apresentação falaremos do case da Dasa em que utilizamos a quantificação do dano pulmonar pela tomografia computadorizada de tórax para prever quais pacientes iriam evoluir de forma grave.
  • Biografia: Médico e Mestre em Genética/Biotecnologia pela Universidade Federal de Juiz de Fora. Neurorradiologista e Doutor em Radiologia Clínica, com foco em Inteligência Artificial, pela Universidade Federal de São Paulo. Coordenador do Laboratório de IA da Dasa. Co-chair do Sub-comitê de Educação em Machine Learning da Society for Imaging Informatics in Medicine (SIIM), Organizador do desafio de Machine Learning da Radiological Society of North America (RSNA) para detecção de Tromboembolismo Pulmonar no Kaggle.
[Keynote 2] A ferramenta COVID-19 Borescope e uma análise dos padrões de mobilidade humana durante a pandemia
  • Apresentador: Antonio Augusto de Aragão Rocha (IC/UFF)
  • Horário: 11:00h - 12:00h
  • Resumo: COVID-19 é uma pandemia global que infectou seres humanos em todos os países do mundo. A falta de distanciamento físico, isolamento social, uso de máscara e mecanismos que permitissem a realização de um rastreamento de contato eficaz são alguns dos principais fatores que contribuíram para a disseminação do COVID-19 e o transformou em uma pandemia global. Para mitigar a propagação da doença, a maioria dos países ao redor do mundo implementou vários níveis de confinamento. Embora as imposições de confinamento tenham sido eficazes na redução da taxa de propagação, elas não foram capazes de conter a doença e as infecções continuam a aumentar em muitos países ao redor do mundo. Em muitos desses países, temos visto recentemente as novas ondas de contaminação, com o aumento em todos os indicadores, o que tem levado a muitas cidades e países voltarem a impor restrições de mobilidade. Por tudo isso, é inegável que ainda há uma necessidade urgente de compreender a fundo os efeitos dessas restrições sobre os padrões de mobilidade, para que se possam ser integrados de forma eficaz nas políticas governamentais de gestão e controle da pandemia. Neste palestra, apresento: (i) o COVID-19 Borescope, uma ferramenta gráfica, interativa, escalável e otimizada que permite realizar uma análise inteligente de dados geo-temporais de mobilidade da população, a partir de registro de conexões de dispositivos na rede celular, e correlacionar com os dados de infecção por COVID-19 disponibilizados pelas agências de saúde; e, (ii) uma análise dos dados de uso da rede celular desde as fases de pré-confinamento, durante o confinamento e após esse período para compreender e modelar os padrões de mobilidade humana durante a pandemia, e avaliar dentre outras coisas, o efeito do isolamento social na mobilidade da população do Rio de Janeiro.
  • Biografia: Antonio Guto Rocha é professor do IC/UFF, com doutorado na COPPE/UFRJ e pós-doutorado pela UMass-Amherst. Tem interesse e trabalhos nas áreas de Redes de Computadores, Sistemas Distribuídos, Segurança em Sistemas Computacionais e Ciência de Dados. Ele tem artigos em importantes conferências e periódicos internacionais, sendo alguns deles premiados, incluindo os de melhores artigos no ACM/CoNEXT 2009, SBRC 2007 WPerformance 2004, 2012 e 2014. Em 2014 foi ainda agraciado com o prêmio Jovem Cientista do Estado do Rio de Janeiro. Membro dos comitês tecnicos da RNP, CT-Mon e CT-Blockchain. Atualmente coordena, dentre outros, os projetos Network Borescope, COVID-19 Borescope e BrumadinhoCoin.
[Keynote 3] O Uso da Inteligência Artificial no Combate à COVID-19 para o Suporte ao Diagnóstico por Imagem e para a Previsão do Comportamento da Pandemia e Seus Impactos sobre a População e a Economia
  • Apresentador: Erick Giovani Sperandio Nascimento (SENAI-Cimatec)
  • Horário: 13:30h - 14:30h
  • Resumo: No mundo inteiro, a disseminação exponencial da COVID-19 traz enormes desafios para os governos, sociedade, indústria, serviços de saúde pública e para a economia de uma forma geral. Para controlar a propagação da doença é fundamental identificar o maior número possível de casos suspeitos para definir estratégias adequadas de isolamento, contingenciamento e tratamento. A tomada de decisões precisa ser ágil e baseada em informações corretas e cientificamente comprovadas. Os testes laboratoriais patogênicos são o “Golden Standard” para diagnóstico da COVID-19. Ampliar a realização destes testes na escala demandada é um desafio que precisa ser superado. Testes consomem tempo, recursos e nem sempre estão disponíveis. Métodos adicionais de avaliação e gerenciamento de pacientes infectados pelo Sars-Cov-2 são necessários. Nas unidades de saúde, os mecanismos de triagem e acompanhamento da evolução da doença são fundamentais. À medida que a COVID-19 se espalha, os médicos e demais profissionais de saúde enfrentam pressões significativas para fornecer um diagnóstico eficaz, rápido e preciso aos pacientes. Muitas vezes a falta de especialistas, de insumos, ou a pressão extrema a que são submetidos leva à redução da eficiência do serviço. No âmbito governamental, gestores igualmente pressionados recebem muitas informações e precisam tomar decisões estratégicas quanto a que medidas devem ser tomadas para frear a propagação da doença, avaliando cenários muito dinâmicos, que se alteram a cada momento. Em um ambiente de alta complexidade como esse, o uso de sistemas inteligentes com suporte computacional de alta performance é de fundamental importância para auxiliar médicos e gestores a combater a doença e a formular políticas públicas adequadas e realizar as suas atividades de forma eficiente, diminuindo ao máximo o impacto na saúde das pessoas, ao mesmo tempo em que se busca minimizar o impacto dessas medidas sobre a economia, que também afeta a sociedade como um todo. Deste modo, este projeto apresenta os resultados da utilização de aprendizagem de máquina profunda e de supercomputação para o desenvolvimento e aprimoramento de duas ferramentas de essencial relevância nesse contexto: a primeira para o suporte ao diagnóstico da COVID-19 a partir de exames de imagem por tomografia computadorizada (TC) e Raio-X (RX); e a segunda para o suporte à decisão estratégica e governamental para prever a evolução da pandemia e da economia a partir de cenários de estabelecimento de medidas de contigenciamento, buscando um cenário que minimize os impactos da pandemia no número de casos confirmados e mortes ao mesmo tempo em que se busca minimizar também os impactos dessas medidas sobre a economia, utilizando como base os dados de casos confirmados, taxa de mortalidade, variáveis macroeconômicas e os resultados obtidos pelas medidas de contenção adotadas por outros países, pelo Brasil e por 12 estados brasileiros. Foi desenvolvida uma interface Web para acesso público aos serviços providos pelas ferramentas desenvolvidas no projeto. Os resultados alcançados em ambas as ferramentas mostram como que a Inteligência Artificial (IA) associada à supercomputação podem ser grandes aliadas no combate a essa pandemia, permitindo não somente a utilização e aplicação dessa metodologia no cenário atual de pandemia da COVID-19, como também em possíveis cenários futuros de novas pandemias que a humanidade venha a enfrentar.
  • Biografia: Prof. Erick é pesquisador e professor de IA, HPC e Modelagem Computacional no Campus Integrado de Manufatura e Tecnologia - SENAI CIMATEC, Bahia. Atualmente coordena, lidera e participa de projetos de P&D nas áreas de IA, modelagem computacional e supercomputação aplicadas a diferentes setores da indústria tais como Óleo e Gás, Saúde, Manufatura Avançada, Energias Renováveis e Ciências Atmosféricas, orientando alunos de graduação, mestrado e doutorado. É pesquisador líder do Centro de Referência em Inteligência Artificial do SENAI CIMATEC. Além disso, ele é instrutor certificado do NVIDIA Deep Learning Institute (DLI), NVIDIA DLI University Ambassador, e pesquisador líder de IA do NVIDIA/CIMATEC AI Joint Lab, o primeiro da América Latina dentro do programa mundial do NVIDIA AI Technology Center (NVAITC). Também atua como pesquisador do Centro de Supercomputação para a Inovação Industrial (CS2i) e do Instituto SENAI de Inovação para Automação (ISI Automação), ambos do SENAI CIMATEC.
[Sessão técnica] Trabalhos em andamento no DEXL/LNCC e CEFET-RJ
  • Horário: 15:00h - 17:30h
  • Rafael Pereira (DEXL/LNCC): "Tackling the open set problem using a scalable approach"
  • Matheus Ribeiro Furtado de Mendonça (DEXL/LNCC): "Efficient Information Diffusion in Time-Varying Graphs through Deep Reinforcement Learning"
  • Daniel Nascimento Ramos da Silva (DEXL/LNCC): "Aprendizado de Representação para Completação Fora De Amostra em Grafos de Conhecimento"
  • Claudio Daniel Tenório de Barros (DEXL/LNCC): "Digital Twins and Beyond"
  • Rocio Zorrilla (DEXL/LNCC): "On Spatio-Temporal Predictive Query Processing: A Methodology for Shape-Based Domain Discretization and Temporal Models"
  • Antonio José de Castro Filho (CEFET-RJ): "Mineração de Sequências Restritas no Espaço e no Tempo"
  • Lais Baroni (CEFET-RJ): "Detecção de anomalias usando funções do modo intrínseco"
Breve encerramento
  • Horário: 17:30h - 17:45h



MINICURSOS



[MC-CD01] Ciências de Redes

[MC-CD02] Análise de Dados

[MC-CD03] Algoritmos e Modelos de Programação para Big Data

[MC-CD04] Deep Learning