百姓大小事,一呼百应!

百姓网 | 百姓资讯 | 百姓知道

度假旅游

蘑菇街,网易,阿里校招offer选择?

Offer情况: 1. 蘑菇街的数据平台offer 内容:构建数据平台给其他部门数据支持 薪资:没谈 2. 网易的数据挖掘offer 内容:挖掘数据价值,进行广告推送或者其他部门数据支持 薪资:没谈 3. 阿里的数据研发offer 内容:实时数据处理 薪资:10K,你们都知道了 地点全部是在杭州个人现状:本科应数,研一研究机器学习,研二至今研究大数据,目前能力: 1. 对基本机器学习算法了解:选修了数据挖掘的课程,看了Andrew Ng的课程,看…

1 个回答

  • 羊咩 | 2017-08-02 15:51:53

    这周末去杭州的蘑菇街,网易,阿里进行了『实地考察』,得出了自己的结论和一些想法^^.
    一、周末行程
    本周末从合肥到杭州东,首先去了古墩路蘑菇街,然后去了滨江网易,最后去了阿里西溪,其中跟蘑菇街,网易相关部门的技术负责人面聊了以下问题:
    1.部门技术现状以及支撑的业务。
    2.部门技术发展方向。
    3.我来了具体会做什么?
    4.离毕业还有约一年,我该做哪些准备,以便我入职能快速入手,甚至能够充满创造性地优雅地胜任工作?(因为我毕业前无法来实习)

    二、关于我的选择
    1.选择结果
    蘑菇街-数据平台

    2.选择理由
    (1)部门技术发展方向包含加强数据平台的稳定性,易用性,统一性,以及想要与开源社区有交流;对于目前学习欲望强烈的我来说很喜欢。
    (2)HR带我把公司各层都看了看,工作的气氛,扁平的风格我喜欢。
    (3)数据平台负责人的风格我喜欢。
    (4)离西溪湿地,西湖近。

    3.深层次考虑
    (1)对比:网易的相关部门的负责人也是相当相当nice,我一直觉得我很幸运,也许能够到他们的那个位置的前提就是良好的亲和力和沟通能力吧,没什么好说的,工作的内容也是很有挑战性有意思,待遇也好;阿里和网易的园区环境也是很赞,没的说;只是个人品质决定了到哪里我都会成长得很好,而让我更兴奋的是更大的空间和可能,对系统的培训和大公司的光环提不起兴趣,于是选蘑菇街。
    (2)定位:走这么一趟,我觉得对自己的定位,以及对要走的路更加清晰了,我是一个数学转计算机的人,单纯得对用计算机解决问题感到兴奋,无论是之前的ACM,数学建模,到现在系统的构建,这个过程锻炼出了较好的学习能力,自我管理和规划能力,上乘的自律和沟通能力,属于不是凤毛麟角的顶尖实力选手,但是是一个对计算充满热爱,具有一定天赋的潜力派选手,需要蘑菇街这种快速成长的公司给我巨大的推力,一起成长;我对大数据的追寻,内心告诉我更多的是工程性方面,所以我会往工程性方面发展,而蘑菇街现阶段的发展显然对工程性的依赖会比科学性多,精妙的算法,漂亮的数学是我让我愉悦的兴趣,也不会丢,基于此,我选蘑菇街。

    三、关于目前答案和自己的一些想法。
    1.为何要这么早决定,为何不多找几家?
    (1)不多找的原因:国内只想去深圳或者杭州工作,这是我的自由吧;腾讯没太适合的,杭州就这三家,其他的简历就都没投了;国外就想去Google,Wiki,Amazon,但是时机不成熟,放弃。
    (2)早决定的原因:一直都不喜欢找工作,早点确定了就能早点回归高效编码,读论文读书读源码的熟悉状态,这样才会让我心安,比我牛逼的人太多,不想浪费时间在找工作上;而且我请假就到这个月底。

    2.第一份工作是选择大平台还是最合适的自己的?
    现在我有自己的答案了,我选择是最合适自己的;我在认真『考察』每家公司之后选择了一个最合适我自己的,这样我以后不会有任何怨言,我会全身心得投入去完美得完成我的工作;很多猎头说第一份工作是大平台的话会有利于下一份工作,我完全赞同,只是我的视角会不同,先不说我也许会在蘑菇街呆很久,假设若干年后我真的要换工作,如果我是一个具有多年大数据平台构建经验,上等学习能力,沟通协调能力,自我规划管理能力,具有相关领域影响力,等等的人,下一个公司的雇主会不要我嘛?我自信在现有基础上若干年之后能成长成为这样一个人;没有大公司的光环简历会被刷?科大的校友这么团结,若小弟以后要换工作,找个内推,应该不会很难吧--!。
    做出选择需要结合自己的性格,对自己的定位,对未来自己的规划来。大公司很大概率是很好的,有个答主说的很好,他们的关系有点像清北,985,211的关系;周边的人平均实力会有不同,大公司很大概率会更快成长成一个牛逼的人;我也不知道,我的选择会对我以后有什么影响,我知道的是,我不会后悔自己的选择,一直都是;希望大家都能做出『最好』的选择。

    3.积累和分享
    (1)我很少玩百姓知道,第一次提问,很多答案给了我很多建议,我之所以会去实地考察公司的相关部门,就是因为Uncle Special 的建议,我之所以会进一步对自己定位,是因为克里斯蒂娜酱的建议,还有很多其他建议,在此真心谢谢你们;我之前一直是一个不怎么玩社交网络的人,全身心得投入各种知识的吸收中,现在觉得把自己良好的学习能力以及执行能力与多种多样的意见结合起来,会思考得更加全面,自己的维度会更高,分享真的是一件充满意义的事情。
    (2)Michael282694 与 萧井陌 的出现让我真正得思考『积累与分享』的事情;我并不知道百姓知道上面有哪些『有名』的人,但是这两个肯定是,他们的关注者很多,答题很多;答题是一种输出,他们能够有这么多的输出,必定是有很大的积累,他们通过自己的积累帮助了很多人解答问题,进而收获了许多许多关注,这些关注也会进一步促进他们答题的欲望,也会更有动力去涉猎和积累,我觉得这种『积累---->分享----->产生影响力---->促进分享的激情------->驱使进一步积累和广泛涉猎』的循环是我缺少的,我目前还停留在积累上面,我希望像他们学习,能够做出更多的分享,产生影响力,让自己融入到互联网中,但是高质量的分享真的需要大量的积累,我得继续加油啦,因此我很佩服百姓知道上面的『名人』,他们真的很厉害,也会很快乐。
    (3).我已经迈出第一步了,有些同学私信我问题比如如何学习数据挖掘以及大数据平台(Hadoop生态系统);找工作过程中的问题; 我似乎给了他们一些很有帮助的回答,这是分享的第一步,任重而道远。我在这里的回答,是不是也是分享的一种形式?

    --------------------------------------数据挖掘与大数据学习经历-----------------------------------------
    因为很多人私信这方面的事情,所以放在这里会让更多的人看到。
    我主要分享两方面的学习经历,一个是分布式处理平台,一个是机器学习。
    【1】分布式处理平台学习经历
    一.基础
    由于数据平台都是分布式的,而且Hadoop生态系统基本都是基于Java的,所以你得具有操作系统基础,Java多线程,Java网络编程基础,有一些设计模式的基础更好,基本的算法和数据结构就不用说了。
    二.我的学习过程
    1.学习内容:因为整个大数据的处理,抽象出来无非是数据的输入,数据的处理,数据的存储,数据的服务;我因为对各个环节的很感兴趣,所以就都进行了学习。
    (1)输入:Kafka/Flume
    (2)处理:Hadoop MapReduce/Spark/Spark Streaming/Storm
    (3)存储:Hbase/Cassandra/Hazelcast/Mysql
    2.学习过程
    (1)官网上面的Tutorial以及各种介绍会先看一遍,主要是看这个工具是做什么的,怎么用,与同类产品相比,特点是什么?
    (2)实际使用,自己要做的项目,或者自己的玩具项目里面用这些工具,掌握熟练基本用法。
    (3)对做什么,怎么用有了自己的理解后,就关注其特点,比如Kafka的Consumer group的概念,Spark的内存计算的概念,这时候就要思考为什么会有这些特点,于是就需要读这些系统的论文,了解他们的设计原理,最后读源码,看看设计与源码有哪些出入,为什么会有这种trade-off,这对以后自己设计和实现都有指导意义。(google search: <system name> + " " + filetype:pdf可搜索到相应论文。)
    (4)上面的过程走过了之后,就用一本最好的相关系统的书籍(Amazon Books 分类底下搜索system name ,选择最新评价最高,当然也要看简介是否适合你)来系统化梳理自己获得的知识,与作者产生共鸣,着重其系统优化部分,因为你懂原理看了源码,对优化的原因就会很清楚。
    上面(1)~(4)基本就是我学习一个系统的过程,当然最痛苦的过程没有展示给你,那就是需要不断的深度优先学习,比如我看Spark的时候,当我看完论文之后我想看源码,但是源码是Scala写的,我就必须去学习Scala,底层的通信是用Akka实现的,我又得去学习Akka,遇到不会的就立马去学,如果不喜欢,不专注的话是相当有恐惧心理和厌烦的,如果你想学好,请克服这一点;由于最新的资料都是英文,如果想学好,请一定培养自己娴熟的英文阅读能力。
    PS:如果对底层感兴趣的话,想学习分布式计算的话,我自己是按这个road map 走的:
    What are some good resources for learning about distributed computing? Why?

    【2】机器学习经历
    一、基础
    基本的高等数学,线性代数,概率论和统计,因为我以前就是数学专业,没什么好说的,把自己学过的教材花时间复习一遍就好。
    二、我的学习过程
    1.课堂学习
    研一的时候我修了数据挖掘课程,使用的教材是《数据挖掘导论》,就是认真跟着老师把每一个算法学号,课程实验认真做。
    2.课外学习
    一本《数据挖掘导论》显然不够满足我的胃口,课下的时间我主要辅以《统计学习方法》+《机器学习实战》来学习,当然也啃掉了Andrew Ng那20集机器学习视频,不过我看的似乎是很老版本的,有机会我会再去看一遍新版视频。
    3.自己搜集的链接(未来依据的资料)
    [机器学习如何入门]机器学习该怎么入门? - 机器学习
    [机器学习学习路线]https://machinelearningmastery.com/machine-learning-roadmap-your-self-study-guide-to-machine-learning/
    [数据挖掘系统教程]数据挖掘的系统教程是怎样的,包含哪些教材? - 书籍推荐
    [数据挖掘好的教程]在数据分析、挖掘方面,有哪些好书值得推荐? - 书籍推荐
    [如何成为一名数据科学家]How can I become a data scientist?
    资料很多,根据自己的情况好好梳理一下,建立自己的学习计划

    上面大概就是我的学习过程,最重要的实践我就不展开赘述了,我很幸运都有或大或小的项目驱动,如果没有的话,就去找相关方向的实习或参加相关的比赛(kaggle + 阿里比赛)。

    加油!

* 本站部分内容来源自网络,仅作分享之用,侵删。

辉煌彩票|安全购彩