Öppna kurser

Introduktion till Big Data

Lär dig att använda analysverktyg och tekniker inom Big Data som hjälper er att ta bättre affärsbeslut genom denna introduktionskurs till Big Data. Under utbildningen får du lära dig sätt att lagra data som möjliggör effektiv bearbetning och analys, Du får kunskaperna du behöver för att lagra, hantera, bearbeta och analysera stora mängder ostrukturerade data för att skapa en lämplig data lake.

Utbildningsmål

Efter genomgången kurs ska deltagarna kunna:

  • Lagra, bearbeta och analysera ostrukturerade data
  • Välja rätt sätt att lagra Big Data för skilda datauppsättningar
  • Använda Hadoop för att bearbeta och få insikter från stora datamängder
  • Ställa frågor till stora datauppsättningar med Pig och Hive
  • Planera och implementera en Big Data-strategi i er verksamhet

Förkunskaper

Rekommenderad erfarenhet:

  • Praktisk erfarenhet av Microsoft Windows-plattformen

Detaljerat kursinnehåll

Introduktion till Big Data

Definiera Big Data

  • De fyra dimensionerna av Big Data: volym, hastighet, variation, trovärdighet
  • Introduktion av Storage, MapReduce och Query Stack

Leverera affärsfördelar med Big Data

  • Etablera hur viktigt Big Data är för verksamheten
  • Klara utmaningen med att extrahera användbar data
  • Integrera Big Data med traditionell data

Lagra Big Data

Analysera kännetecken för din data

  • Välja datakällor för analys
  • Eliminera överflödig data
  • Etablera vilken roll NoSQL ska ha

Översikt över Big Data–lager

  • Datamodeller: nyckelvärde, diagram, dokument, spaltfamilj
  • Hadoop Distributed File System
  • HBase
  • Hive
  • Cassandra
  • Hypertable
  • Amazon S3
  • BigTable
  • DynamoDB
  • MongoDB
  • Redis
  • Riak
  • Neo4J

Välja Big Data–lager

  • Välja rätt datalager baserat på kännetecken för din data
  • Överföra kod till data
  • Implementera flerspråkiga datalösningar
  • Anpassa affärsmål till rätt datalager

Bearbeta Big Data

Integrera olika datalager

  • Mappa data till programmeringsramverket
  • Anluta till och extrahera data från lager
  • Omvandla data för bearbetning
  • Dela upp data i underavdelningar som en förberedelse för Hadoop MapReduce

Använda Hadoop MapReduce

Skapa komponenterna i Hadoop MapReduce–jobb
Distribuera databearbetning över serverfarmar
Genomföra Hadoop MapReduce–jobb
Övervaka framstegen för arbetsflöden

Byggstenarna i Hadoop MapReduce

  • Skilja ut Hadoop–bakgrundsprogram
  • Utforska Hadoop Distributed File System
  • Välja en lämplig modell för genomförande: lokal, pseudodistribuerad och helt distribuerad

Hantera strömmande data

  • Jämföra modeller för bearbetning i realtid
  • Använda Storm för att extrahera livehändelser
  • Blixtsnabb bearbetning med Spark & Shark

Verktyg och tekniker för att analysera Big Data

Utvinna Hadoop MapReduce–jobb med Pig

  • Kommunicera med Hadoop på Pig Latin
  • Utföra kommandon med hjälp av Grunt Shell
  • Förenkla bearbetning på hög nivå

Ställa ad hoc–frågor till Big Data med Hive

  • Spara data i Hive MegaStore
  • Ställa frågor med HiveQL
  • Utforska Hive–filformat

Skapa affärsvärde utifrån extraherad data

  • Utvinna data med Mahout
  • Visualisera bearbetade resultat med rapporteringsverktyg
  • Ställa frågor i realtid med Impala

Utveckla en Big Data–strategi

Definiera en Big Data–strategi för din organisation

  • Etablera Big Data–behoven
  • Uppnå affärsmål med rätt data i rätt tid
  • Utvärdera kommersiella Big Data–verktyg
  • Hantera förväntningar i organisationen

Möjliggöra analytisk innovation

  • Fokusera på betydelsen för verksamheten
  • Ringa in problemet
  • Välja rätt verktyg
  • Uppnå resultat i tid

Implementera en Big Data–lösning

  • Välja lämpliga återförsäljar– och värdlösningar
  • Balansera kostnader mot affärsvärde
  • Ligga före kurvan