´óÊý¾ÝÓ¦Óÿª·¢¹¤³ÌʦרҵµÄºËÐĿγÌÊÇHadoop¿ò¼ÜµÄѧϰ£¬ÄÇôÕâ¸ö¿ò¼Ü¾ÍÀàËÆÓÚJavaÓ¦Óÿª·¢µÄSSH/SSM¿ò¼Ü£¬¶¼ÊÇApache»ù½ð»á»òÕ߯äËûJava¿ªÔ´ÉçÇøÍÅÌåµÄÄÜÈËÅ£ÈË¿ª·¢µÄ¹±Ï׸ø´ó¼ÒʹÓõÄÒ»ÖÖ¿ªÔ´Java¿ò¼Ü¡£ÎÒÒ»Ö±ÔÚÏòѧÉú˵JavaÓïÑÔÊÇÍõµÀ¾ÍÊÇÕâ¸öµÀÀí£¬JavaµÄºËÐÄ´úÂëÊÇ¿ªÔ´µÄ£¬ÊǾ¹ýÈ«ÇòÄÜÈËÅ£È˹²Í¬Ñ§Ï°¹²Í¬Ñз¢¹²Í¬¼ìÑéµÄ£¬ËùÒÔ˵JavaÊÇ×î¾µÃס¼ìÑéµÄÓïÑÔ£¬¶øÇÒÈκÎÈ˶¼¿ÉÒÔѧϰJavaºËÐļ¼Êõ²¢ÇÒʹÓúËÐļ¼Êõ¿ª·¢³öÏñandroidÒ»ÑùµÄϵͳºÍHadoopÒ»ÑùµÄ¿ò¼Ü¡£Èç¹û°Ñ±à³ÌµÄÊÀ½ç±È×÷Ò»¿ÃÊ÷£¬ÄÇôJavaÊǸù£¬SSHºÍHadoopÕâÑùµÄ¿ò¼Ü¶¼ÊÇËü¿ªµÃ֦ɢµÃÒ¶¡£
ÓÉÓÚ´óÊý¾ÝÓ¦Óÿª·¢¹¤³ÌʦÊÇĿǰITÅàѵ½ç×îÈÈÃŵÄרҵ£¬´óÊý¾Ý¼¼ÊõÈ˲ÅÊÇÒýÁìÖÇÄܸïÃüµÄŪ³±¶ù£¬ÊÇÖÇÄÜʱ´ú×îÖ±½ÓµÄÊÜÒæÕߣ¬ÕâÃ´ÖØÒªµÄרҵÎÒÒ»¶¨Òª¸ø´ó¼Ò½²½âµÄÏêϸ͸³¹£¬ÒÔHadoopÉú̬ȦΪÖ÷£¬½éÉÜĿǰ´óÊý¾ÝÓ¦Óü¶¿ª·¢¹¤³ÌʦÔÚ¹¤×÷µ±ÖÐËùÓõ½µÄÈ«²¿¼¼Êõ£¬½¨Òé´ó¼ÒÔÚѧϰ´óÊý¾ÝÓ¦Óÿª·¢¹¤³Ìʦרҵ֮ǰ£¬ÒªÓÐÒ»¶¨µÄJava»ù±¾Óï·¨ºÍ¿ò¼ÜµÄѧϰ¾Ñé¡£
¿ªÔ´µÄHadoop´óÊý¾Ý¿ª·¢Æ½Ì¨
hadoopÊÇÒ»¸öÄܹ»¶Ô´óÁ¿Êý¾Ý½øÐзֲ¼Ê½´¦ÀíµÄÈí¼þ¿ò¼Ü£¬hadoopÒÔÒ»ÖÖ¿É¿¿¡¢¸ßЧ¡¢¿ÉÉìËõµÄ·½Ê½½øÐÐÊý¾Ý´¦Àí£¬Óû§Ö®ËùÒÔ¿ÉÒÔÇáËɵÄÔÚhadoopÉÏ¿ª·¢ºÍÔËÐд¦Àíº£Á¿Êý¾ÝµÄÓ¦ÓÃÊý¾Ý£¬ÊÇÒòΪhadoop¾ßÓи߿ɿ¿ÐÔ¡¢¸ßÀ©Õ¹ÐÔ¡¢¸ßЧÐÔ¡¢¸ßÈÝ´íÐÔµÈÓŵ㡣
hadoop´óÊý¾ÝÉú̬ϵͳ£º
·Ö²¼Ê½Îļþϵͳ-HDFS
ÌáÆðhadoopÎļþϵͳ£¬Ê×ÏÈÏëµ½µÄÊÇHDFS£¨Hadoop Distributed File System£©£¬HDFSÊÇhadoopÖ÷ÒªµÄÎļþϵͳ£¬ÊÇHadoop´æ´¢Êý¾ÝµÄƽ̨£¬½¨Á¢ÔÚÍøÂçÉϵķֲ¼Ê½´æ´¢ÏµÍ³¡£hadoop»¹¼¯³ÉÁËÆäËûÎļþϵͳ£¬hadoopµÄÎļþϵͳÊÇÒ»¸ö³éÏóµÄ¸ÅÄHDFSÖ»ÊÇÆäÖеÄÒ»ÖÖʵÏÖ¡£
·Ö²¼Ê½¼ÆËã¿ò¼Ü-MapReduce
MapReduceÊÇÒ»ÖÖ±à³ÌÄ£ÐÍ£¬ÊÇHadoop´¦ÀíÊý¾ÝµÄƽ̨¡£ÓÃÓÚ´ó¹æÄ£Êý¾Ý¼¯£¨´óÓÚ1TB£©µÄ²¢ÐÐÔËËã¡£¸ÅÄî"Map£¨Ó³É䣩"ºÍ"Reduce£¨¹éÔ¼£©"£¬ºÍËüÃǵÄÖ÷Ҫ˼Ï룬¶¼ÊÇ´Óº¯Êýʽ±à³ÌÓïÑÔÀï½èÀ´µÄ£¬»¹ÓдÓʸÁ¿±à³ÌÓïÑÔÀï½èÀ´µÄÌØÐÔ¡£Ëü¼«´óµØ·½±ãÁ˱à³ÌÈËÔ±ÔÚ²»»á·Ö²¼Ê½²¢Ðбà³ÌµÄÇé¿öÏ£¬½«×Ô¼ºµÄ³ÌÐòÔËÐÐÔÚ·Ö²¼Ê½ÏµÍ³ÉÏ¡£
·Ö²¼Ê½¿ªÔ´Êý¾Ý¿â-Hbase
HBase – Hadoop Database,HBaseÊÇÒ»¸ö·Ö²¼Ê½µÄ¡¢ÃæÏòÁеĿªÔ´Êý¾Ý¿â¡£ÊʺÏÓڷǽṹ»¯Êý¾Ý´æ´¢£¬±£ÁôÊý¾Ý¶à¸öʱ¼ä¶Î°æ±¾¡£Hbase¼«´óµÄ·½±ãÀ©Õ¹ÁËHadoop¶ÔÓÚÊý¾ÝµÄ´¦ÀíºÍÓ¦Óá£
´óÊý¾Ý¿ª·¢Æ½Ì¨Ä£¿éÉú̬Ȧ

Hive
HiveÊÇ»ùÓÚHadoopµÄÒ»¸öÊý¾Ý²Ö¿â¹¤¾ß£¬´¦Àí½á¹¹»¯SQL²éѯ¹¦ÄÜ¡£¿ÉÒÔ½«½á¹¹»¯µÄÊý¾ÝÎļþÓ³ÉäΪһÕÅÊý¾Ý¿â±í£¬²¢Ìṩ¼òµ¥µÄsql²éѯ¹¦ÄÜ£¬¿ÉÒÔ½«sqlÓï¾äת»»ÎªMapReduceÈÎÎñ½øÐÐÔËÐв¢Ìá½»µ½¼¯ÈºÉÏÈ¥Ö´ÐС£ ÆäÓŵãÊÇѧϰ³É±¾µÍ£¬¿ÉÒÔͨ¹ýÀàSQLÓï¾ä¿ìËÙʵÏÖ¼òµ¥µÄMapReduceͳ¼Æ£¬²»±Ø¿ª·¢×¨ÃŵÄMapReduceÓ¦Ó㬲»ÓÃʹÓÃJava±à³Ì£¬Ê®·ÖÊʺÏÊý¾Ý²Ö¿âµÄͳ¼Æ·ÖÎö¡£
ѧϰHiveʱ£¬¶ÔÓÚHive QLÖеÄDDLºÍDML¾ÍÊDZØÐëÒªÕÆÎյĻù´¡£»±íµÄ¶¨Òå¡¢Êý¾Ýµ¼³öÒÔ¼°³£ÓõIJéѯÓï¾äµÄÕÆÎÕÊÇÍê³É´óÊý¾Ýͳ¼Æ·ÖÎöµÄ»ù´¡¡£Ñ§»áÕë¶ÔHive½øÐбà³Ì£ºÊ¹ÓÃJava API¿ª²Ù×÷Hive¡¢¿ª·¢Hive UDFº¯Êý¡£ÕÆÎÕºÃHive²¿·Ö¸ß¼¶µÄÌØÐÔÄÜ´ó´óÌáÉýHiveµÄÖ´ÐÐЧÂÊ¡£ÔÚÓÅ»¯¹ý³ÌÖпÉÒԺܺõĽèÖúÓÚÖ´Ðмƻ®À´½øÐзÖÎö£¬Ñ§Ï°HiveʱÐèҪעÒâHiveÐÔÄÜÓÅ»¯ÊÇÔÚÉú²úÖеÄ×îÖØÒªµÄ»·½Ú£¬ÈçºÎ½â¾öÊý¾ÝÇãбÊǹؼü£» ÊáÀíÇå³þHiveÔªÊý¾Ý¸÷¸ö±íÖ®¼äµÄ¹ØÁª¹ØÏµÒ²ÄÜÌáÉý¶ÔHiveµÄ°ÑÎÕÄÜÁ¦¡£
Pig
MapReduceÖ®Éϸ߼¶¹ý³Ì±à³Ì½Å±¾ÓïÑÔ£¬ÓÃÓÚ²éѯ´óÐͰë½á¹¹»¯Êý¾Ý¼¯¡£
Zookeeperе÷HadoopÉú̬Ȧ¸÷¸öÄ£¿é¹²Í¬¹¤×÷
´ÓÓ¢Îĺ¬ÒåÉÏÀ´¿´HadoopÊÇСÏó£¬HiveÊÇÃ۷䣬pigÊÇÖí£¬ZookeeperÊǶ¯Îï¹ÜÀíÔ±¡£ÄÇôºÜÏÔÈ»ZookeeperµÄ×÷ÓÃÊÇ·Ö²¼Ê½Ó¦ÓóÌÐòе÷·þÎñ£¬Îª¸÷¸öÄ£¿éÌṩһÖÂÐÔ·þÎñµÄ¡£
Êý¾Ýµ¼Èëµ¼³ö¿ò¼ÜSqoop
SqoopÊÇÒ»¿î¿ªÔ´µÄ¹¤¾ß£¬Ó¢Îĺ¬ÒåÊÇÏó·ò£¬¾ÍÊÇÎ¹Ñø´óÏóµÄÈË£¬Ö÷ÒªÓÃÓÚÔÚHadoop(Hive)Ó봫ͳµÄÊý¾Ý¿â(mysql¡¢postgresql...)¼ä½øÐÐÊý¾ÝµÄ´«µÝ£¬¿ÉÒÔ½«Ò»¸ö¹ØÏµÐÍÊý¾Ý¿âÖеÄÊý¾Ýµ¼½øµ½HadoopµÄHDFSÖУ¬Ò²¿ÉÒÔ½«HDFSµÄÊý¾Ýµ¼½øµ½¹ØÏµÐÍÊý¾Ý¿âÖС£
ѧϰĿ±ê£º
1.Á˽âSqoopÊÇʲô¡¢ÄÜ×öʲô¼°¼Ü¹¹ £»
2.Äܹ»½øÐÐSqoop»·¾³²¿Êð £»
3.ÕÆÎÕSqoopÔÚÉú²úÖеÄʹÓà £»
4.Äܹ»Ê¹ÓÃSqoop½øÐÐETL²Ù×÷ ¡£
Oozie
OozieµÄÓ¢Îĺ¬ÒåÊÇѱÏóÈË£¬·Ç³£ÐÎÏó£¬OozieµÄ×÷ÓÃÊÇе÷Hadoop¸÷¸öÄ£¿éÊý¾Ý´¦ÀíÈÎÎñ£¬¸øËüÃǰ²ÅÅÒ»¸ö¹¤×÷¼Æ»®¡£
Ambari
AmbariµÄÓ¢Îĺ¬Òå¿ÉÒÔÀí½âΪÀé°Ê£¬Õâ¸öÄ£¿é¿ª·¢ÕßµÄÒâ˼ÊǰÑHadoopÉú̬Ȧ»òÕßÐÎÏóµÄ½Ð×ö¶¯Îï԰ΧÆðÀ´£¬¸ºÔð¸÷¸öÄ£¿é²¿Êð°²×°£¬°æ±¾ÅäºÏ¡¢Éý¼¶¡£
´óÊý¾ÝͼÐÎչʾ¿ò¼ÜHUE
HUEÊÇCloudrea¹«Ë¾¿ªÔ´µÄ£¬ÓëHadoopÉú̬ϵͳ½ôÃܽáºÏµÄÒ»¸öWeb UIÓ¦ÓóÌÐò£¬¿ÉÒÔͨ¹ýHueÀ´²é¿´¡¢¹ÜÀíHDFSÉÏÃæµÄÎļþ£¬Í¨¹ýHue´Ó½çÃæ±àдHiveµÄSQLÓï¾ä¶ÔHive½øÐвéѯ£¬²¢Ê¹ÓÃͼ±íÖ±¹ÛµÄչʾ²éѯ½á¹û£¬¿ÉÒÔÓëOozie¼¯³É£¬Óû§´´½¨ºÍ¼à¿Ø¹¤×÷Á÷³Ì¡£
ѧϰĿ±ê£º
1.Á˽âHUEÊÇʲô¡¢ÄÜ×öʲô¼°¼Ü¹¹ £»
2.Äܹ»½øÐÐHUE»·¾³²¿Êð £»
3.ÕÆÎÕHUEÔÚÉú²úÖеÄʹÓà ¡£
Spark
SparkÊÇĿǰ×îÁ÷ÐеĴóÊý¾Ý´¦Àí¿ò¼Ü£¬ÒÔ¼òµ¥¡¢Ò×Óá¢ÐÔÄÜ×¿Ô½Öø³Æ¡£·á¸»µÄ³ÌÐò½Ó¿ÚºÍ¿âÎļþҲʹµÃSpark³ÉΪҵÄÚÊý¾Ý¿ìËÙ´¦ÀíºÍ·Ö²¼Ê½»úÆ÷ѧϰµÄ±Ø±¸¹¤¾ß¡£
ѧϰĿ±ê£º
1.Á˽âSparkµÄ×é¼þºÍÓ¦Óó¡¾° £»
2.Äܹ»²¿ÊðSpark Standaloneģʽ £»
3.Äܹ»Ê¹ÓÃSpark½øÐн»»¥Ê½¿ª·¢ £»
4.Äܹ»·¢²¼¶ÀÁ¢Ó¦ÓóÌÐò²¢Ê¹ÓÃspark-submit Ìá½» ¡£
5.ÕÆÎÕPair RDDµÄ²Ù×÷ £»
6.ÕÆÎÕPair RDDÈçºÎÓëÒ»°ãRDD½áºÏ £»
7.ÕÆÎÕRDDµÄÊä³ö²Ù×÷ £»
8.Á˽âRDDµÄ³Ö¾Ã»¯¡¢ÀÛ¼ÓÆ÷ºÍ¹ã²¥±äÁ¿ ¡£
9.ÕÆÎÕDataFrameµÄ²Ù×÷ £»
10.ÕÆÎÕ²»Í¬Êý¾ÝÔ´µÄ¼ÓÔØ·½·¨ £»
11.Á˽âUDFµÄ¶¨Òå·½·¨ ¡£
12.ÕÆÎÕSparkͼÐλ¯¹¤¾ßµÄ²é¿´ ¡£
13.Á˽âSpark StreamingµÄÌØµã £»
14.ÕÆÎÕÁ÷ʽ´¦ÀíµÄ»ù±¾²Ù×÷ £»
15.Àí½â״̬²Ù×÷ºÍ´°¿Ú²Ù×÷µÄ¸ÅÄî ¡£
16.Äܹ»¸ù¾ÝÉú²ú»·¾³Ìص㣬×éÖ¯»ùÓÚspark sql µÄÖÜÆÚÈÎÎñÍê³É»ù±¾ÈÕ־ϵͳµÄ¹¹½¨¡£
17.ÕÆÎÕ²»Í¬ÐèÇóÏÂSpark×é¼þµÄÑ¡Ôñ £»
18.ÕÆÎÕSpark²ÎÊýµ÷ÓÅ £»
19.ÕÆÎÕ¸÷×é¼þÖ®¼äµÄµ÷Óü°thrift½Ó¿ÚµÄʹÓà ¡£
20.Á˽âSpark×÷Ϊ»úÆ÷ѧϰ¹¤¾ßµÄÓÅÊÆ £»
21.Á˽â»úÆ÷ѧϰËã·¨µÄ·ÖÀà £»
22.ͨ¹ýK-meansËã·¨½øÐÐÍæ¼Ò¸¶·ÑÐÐΪ¾ÛÀà ¡£
*À©Õ¹¼¼ÄÜ£º
python¿ª·¢»ù´¡¡¢Êý¾Ý·ÖÎöÓëÊý¾ÝÍÚ¾ò
ѧϰÊý¾ÝÍÚ¾ò¹¤¾ßSklearn£¬ÊìϤÊý¾ÝÍÚ¾òÆÓËØ±´Ò¶Ë¹Ëã·¨ºÍÊý¾ÝÍÚ¾òSVM·ÖÀàËã·¨£¬²¢ÇÒ×îÖÕʹÓÃSklearnʵÏÖ±´Ò¶Ë¹ÒÔ¼°SVMËã·¨ ¡£
Storm´óÊý¾Ý·Ö²¼Ê½ÊµÊ±¼ÆËã
StormÊÇ·Ö²¼Ê½Êý¾Ý´¦ÀíµÄ¿ò¼Ü£¬Storm¿ÉÒÔ·½±ãµØÔÚÒ»¸ö¼ÆËã»ú¼¯ÈºÖбàдÓëÀ©Õ¹¸´ÔÓµÄʵʱ¼ÆË㣬StormÓÃÓÚʵʱ´¦Àí£¬¾ÍºÃ±È Hadoop ÓÃÓÚÅú´¦Àí¡£Èç¹û˵MapReduce½µµÍÁ˲¢ÐÐÅú´¦Àí¸´ÔÓÐÔ£¬StormÊǽµµÍÁ˽øÐÐʵʱ´¦ÀíµÄ¸´ÔÓÐÔ¡£
Scala±à³Ì¿ª·¢
ScalaÊÇÒ»ÖÖº¯ÊýÊ½ÃæÏò¶ÔÏóÓïÑÔ£¬ÀàËÆÓÚRUBYºÍGROOVYÓïÑÔ£¬ËüÎÞ·ì½áºÏÁËÐí¶àǰËùδÓеÄÌØÐÔÐγÉÒ»ÃŶ෶ʽÓïÑÔ£¬ÆäÖи߲㲢·¢Ä£ÐÍÊÊÓÃÓÚ´óÊý¾Ý¿ª·¢¡£¶øÍ¬Ê±ÓÖÔËÐÐÓÚJAVAÐéÄâ»úÖ®ÉÏ¡£