Título: AnalÃtica De Dados Com Hadoop: Uma Introdução Para Cientistas De Dados
Autor: Benjamin Bengfort
Sinopse: Pronto Para Usar Técnicas Estatísticas E De Aprendizado De Máquina (machine Learning) Em Grandes Conjuntos De Dados? Este Guia Prático Mostra Por Que O Ecossistema Do Hadoop é Perfeito Para Essa Tarefa. Em Vez De Ter Como Foco A Implantação, As Operações Ou O Desenvolvimento De Softwares Geralmente Associados à Computação Distribuída, Você Se Concentrará Nas Análises Particulares Que Poderá Fazer, Nas Técnicas De Armazém De Dados (data Warehousing) Oferecidas Pelo Hadoop E Em Fluxos De Trabalho De Alta Ordem Que Esse Framework é Capaz De Gerar. Os Cientistas E Os Analistas De Dados Aprenderão A Usar Diversas Técnicas Que Variam Da Escrita De Aplicações Mapreduce E Spark Com Python Ao Uso De Modelagem Avançada E Gerenciamento De Dados Com Spark Mllib, Hive E Hbase. Você Também Conhecerá Os Processos Analíticos E Os Sistemas De Dados Disponíveis Para Desenvolver E Conferir Eficácia Aos Produtos De Dados Capazes De Lidar Com – E Que, Na Verdade, Exigem – Quantidades Enormes De Dados. • Entenda Os Conceitos Principais Do Hadoop E Do Processamento Em Cluster. • Utilize Padrões De Projeto E Algoritmos Analíticos Paralelos Para Criar Jobs De Análise De Dados Distribuídos. • Adquira Conhecimentos Sobre Gerenciamento De Dados, Mineração E Armazém De Dados Em Um Contexto Distribuído Usando Apache Hive E Hbase. • Utilize Sqoop E Apache Flume Para Entrada De Dados A Partir De Bancos De Dados Relacionais. • Programe Aplicações Hadoop E Spark Complexas Com Apache Pig E Spark Dataframes. • Utilize Técnicas De Aprendizado De Máquina, Como Classificação, Clustering E Filtragem Colaborativa, Com A Mlib Do Spark.
Editora: Novatec
Páginas: 31
Ano: 2016
Edição:
Linguagem: pt
ISBN: 8575225219
ISBN13: 9788575225219
Informações do autor não encontradas.