Big Data “refere-se a um fenômeno tecnológico surgido desde meados da década de 1980. À medida que os computadores melhoraram em capacidade e velocidade, maiores possibilidades de armazenamento e processamento também geraram novos desafios.
Novas ferramentas analíticas, incluindo as introduzidas neste curso, desde então, foram desenvolvidos para resolver esses desafios na gestão desses conjuntos de dados fenomenalmente grandes.
Este curso apresenta o Modelo de Dados Dimensionais Distribuídos Dinâmicos (D4M), um avanço na programação de computadores que combina teoria de grafos, álgebra linear e bancos de dados para resolver problemas associados a Big Data.
Pesquisa, mídia social, colocação de anúncio, mapeamento, rastreamento, filtragem de spam, detecção de fraude, comunicação sem fio, descoberta de drogas e bioinformática, todos tentam encontrar itens de interesse em grandes quantidades de dados.
Este curso ensina uma abordagem de processamento de sinal para esses problemas combinando algoritmos de gráfico algébrico linear, teoria de grupo e projeto de banco de dados. Essa abordagem foi implementada em software.
A aula começará com uma série de problemas práticos, introduzirá a teoria apropriada e, em seguida, aplicará a teoria a esses problemas.
Professores: Dr. Jeremy Kepner é chefe e fundador do MIT Lincoln Laboratory Supercomputing Center (LLSC). Ele também é fundador do MIT-Air Force AI Accelerator.
Dr. Vijay Gadepally é um cientista sênior e investigador principal do Laboratório Lincoln do Instituto de Tecnologia de Massachusetts (MIT) e trabalha em estreita colaboração com o Laboratório de Ciência da Computação e Inteligência Artificial (CSAIL).
Licença: Jeremy Kepner, and Vijay Gadepally. RES.LL-005 Mathematics of Big Data and Machine Learning. January IAP 2020. Massachusetts Institute of Technology: MIT OpenCourseWare, https://ocw.mit.edu. License: Creative Commons BY-NC-SA.