Öppna kurser
Introduktion till Big Data
Lär dig att använda analysverktyg och tekniker inom Big Data som hjälper er att ta bättre affärsbeslut genom denna introduktionskurs till Big Data. Under utbildningen får du lära dig sätt att lagra data som möjliggör effektiv bearbetning och analys, Du får kunskaperna du behöver för att lagra, hantera, bearbeta och analysera stora mängder ostrukturerade data för att skapa en lämplig data lake.
Utbildningsmål
Efter genomgången kurs ska deltagarna kunna:
- Lagra, bearbeta och analysera ostrukturerade data
- Välja rätt sätt att lagra Big Data för skilda datauppsättningar
- Använda Hadoop för att bearbeta och få insikter från stora datamängder
- Ställa frågor till stora datauppsättningar med Pig och Hive
- Planera och implementera en Big Data-strategi i er verksamhet
Förkunskaper
Rekommenderad erfarenhet:
- Praktisk erfarenhet av Microsoft Windows-plattformen
Detaljerat kursinnehåll
Introduktion till Big Data
Definiera Big Data
- De fyra dimensionerna av Big Data: volym, hastighet, variation, trovärdighet
- Introduktion av Storage, MapReduce och Query Stack
Leverera affärsfördelar med Big Data
- Etablera hur viktigt Big Data är för verksamheten
- Klara utmaningen med att extrahera användbar data
- Integrera Big Data med traditionell data
Lagra Big Data
Analysera kännetecken för din data
- Välja datakällor för analys
- Eliminera överflödig data
- Etablera vilken roll NoSQL ska ha
Översikt över Big Data–lager
- Datamodeller: nyckelvärde, diagram, dokument, spaltfamilj
- Hadoop Distributed File System
- HBase
- Hive
- Cassandra
- Hypertable
- Amazon S3
- BigTable
- DynamoDB
- MongoDB
- Redis
- Riak
- Neo4J
Välja Big Data–lager
- Välja rätt datalager baserat på kännetecken för din data
- Överföra kod till data
- Implementera flerspråkiga datalösningar
- Anpassa affärsmål till rätt datalager
Bearbeta Big Data
Integrera olika datalager
- Mappa data till programmeringsramverket
- Anluta till och extrahera data från lager
- Omvandla data för bearbetning
- Dela upp data i underavdelningar som en förberedelse för Hadoop MapReduce
Använda Hadoop MapReduce
Skapa komponenterna i Hadoop MapReduce–jobb
Distribuera databearbetning över serverfarmar
Genomföra Hadoop MapReduce–jobb
Övervaka framstegen för arbetsflöden
Byggstenarna i Hadoop MapReduce
- Skilja ut Hadoop–bakgrundsprogram
- Utforska Hadoop Distributed File System
- Välja en lämplig modell för genomförande: lokal, pseudodistribuerad och helt distribuerad
Hantera strömmande data
- Jämföra modeller för bearbetning i realtid
- Använda Storm för att extrahera livehändelser
- Blixtsnabb bearbetning med Spark & Shark
Verktyg och tekniker för att analysera Big Data
Utvinna Hadoop MapReduce–jobb med Pig
- Kommunicera med Hadoop på Pig Latin
- Utföra kommandon med hjälp av Grunt Shell
- Förenkla bearbetning på hög nivå
Ställa ad hoc–frågor till Big Data med Hive
- Spara data i Hive MegaStore
- Ställa frågor med HiveQL
- Utforska Hive–filformat
Skapa affärsvärde utifrån extraherad data
- Utvinna data med Mahout
- Visualisera bearbetade resultat med rapporteringsverktyg
- Ställa frågor i realtid med Impala
Utveckla en Big Data–strategi
Definiera en Big Data–strategi för din organisation
- Etablera Big Data–behoven
- Uppnå affärsmål med rätt data i rätt tid
- Utvärdera kommersiella Big Data–verktyg
- Hantera förväntningar i organisationen
Möjliggöra analytisk innovation
- Fokusera på betydelsen för verksamheten
- Ringa in problemet
- Välja rätt verktyg
- Uppnå resultat i tid
Implementera en Big Data–lösning
- Välja lämpliga återförsäljar– och värdlösningar
- Balansera kostnader mot affärsvärde
- Ligga före kurvan