作家
登录

如何成为一名数据科学家?或许你该听听这些知名数据科学家们给出的建议

作者: 来源: 2018-03-12 14:03:57 阅读 我要评论

沙龙晃荡 | 3月31日 京东、微博拭魅战专家与你合营商量容器技巧实践!


比来,我在读Sebastian Gutierrez’s “Data Scientists at Work”这本书,他查访16个不合行业的16位数据科学家懂得他们若何大年夜理论思虑问题和若何解决实际问题,数据是如何发患咀用,并且是如斯成功。

若何成为一名数据科学家?Yann LeCun 的建议也许能给你谜底

16位受访者在若何懂得和大年夜大年夜量公共和私家企业类型的公司提取数据价值都处在前各地位,公司类型横跨方才起步的始创公司,到重要的研究机构和人道主义非盈利组织,包含大年夜量行业:告白,电子商务,电子邮件营销,企业袈淦计算,时尚业,工业互联网,互联网电视和娱乐,音乐,非营利组织,神经生物学,报纸和媒体,专业的社交收集,零售业,智能发卖和风险投资。

尤其是,Sebastia提出了开放式的问题,以便每位受访者的个性和自发的思虑过程可以或许清跋扈和精确的分享。书中涉及的大年夜颐魅者分享数据科学对他们的意义,及他们怎么懂得它的,他们的建议关于如何参加这个范畴,和他们在范畴内获得数据科学家必须深刻懂得才能成功的经验的聪明。

“针对来自数学和物理背景的同窗,我则建议他们在进修软件技能方面投入-特别是Hadoop 和R,它们是今朝最广泛应用的对象。软件工程背景的同窗应当介入机械进修的相干课程,介入真实数据的工程项目,这些都有大年夜量的免费资本。正如许多前人所说,成为数据科学家的最好方法就是大年夜事数据科学的相干工作。数据就在那边,且科学是不难以进修的,特别是数学,科学或工程背景的同窗。

在这一篇文┞仿,我想去分享这些数据科学家如下问题的最佳谜底:

你对开端进修数据科学的人有什么建议?

1 —Chirs Wiggins,纽约时报首席数据科学家,哥伦比亚应用数学专业副传授

“创造力和有心。你必须真正爱好一些事你才原意长时光的思虑它。当然,某种程度地质疑。是以这就是我爱好快士生的一个原因-五年时光足够培养摸索才能,然后你能意识到你用某些办法做某件工作的是有问题的。反复经历’冰火两重天‘的感到,犯一系列的缺点并且修复它们是很棒的工作。我想博士生经历的┞封个过程对于培养对看似精确的工作仍然抱有困惑是异常有赞助的,特别是研究范畴。我认为这是有赞助的,你可能快速地且随便马虎地走上缺点的路径,仅仅是因为第一个这条路上的相遇者看起来是言之凿凿的。

尽管这是一个令人生厌的谜底,事实是你必须具备技巧深度。数据科学不仅仅包含一个范畴,是以今朝还没有认证。机械进修方面,获得维诽谤科程度懂得很轻易。为了真正做到这一点,你须要懂得针对如今的工作,什么才是合适的对象,并且你须要深刻懂得每种对象的局限性。获得上述的经验是没用捷径的。你肯定会犯很多缺点。你可能会强行把分类问敷衍进聚类问题,或者是把聚类问题转换假设考验问题。

一旦本身测验测验一些办法,对本身的办法无比自负,但最后你意识到本身完全纰谬,经历过很多次上述的过程-你发明这须要经验的积聚,但不幸的是并没有捷径。你仅须要赓续地实践,赓续犯错,这是我乡⒚?这个范畴有若干年工作经验人的另一个原因。某些范呈攀里要成为一名专家须要很长时光。犯缺点会持续很多年的时光。几个世纪以来都是如许。有名物理学家Niels Bohr(尼尔斯.玻尔)有句名言是如许说的,他断定成为范畴内专家的方法就是犯过这个范畴的每一个可能的缺点。”

“我想说做任何工作之前,硬着头皮懂得数据的基本本质,尽管这不迷人也不有趣。换句话说,要尽力懂得是如何捕获数据,精确搞懂数据是如何定义,并且搞懂什么时刻会造成数据缺掉。如不雅数据缺掉,这是不是意谓有些器械产生变更?数据仅仅是在这种特定情况下缺掉吗?这些渺小的,奥妙数据陷阱真的会影响你。他们真的会。

你可以用现存的最复杂算法,但它是古老的,垃圾的器械。你不克不及对原始数据熟视无睹,不管你进入到建模的步调有多高兴。你须要对细节一丝不苟,在模型研发之前,你要检查基本数据的每一个细节。

跟着时光的推移,我所学到的另一件工作在一个体系情况中,混淆算法老是比单一算法的表示要好,因为不合技巧摸索科研数据模式不合方面,尤颇┞冯对是复杂的大年夜数据集。因尽管你可以单一的特别的算法,经由过程迭代达到更好的效不雅,我几乎老是留意到:混淆算法组合往往比单一算法的表示更好。”


浏览“The Unreasonable Effectiveness of Data”,一篇来自来自谷歌研究人员 : Alon Halevy, Peter Norvig和 Fernando Pereir 的经典论文。论文总结到:大年夜数据比算法更有效。全文是值得浏览的,文┞仿供给比来应用收集整合范围的数据大年夜而进步语音辨认和机械翻译的成功的查询拜访。然后是优良的测度办法,听听Monica Rogati 提到较高质量的数据大年夜数据有效。懂得和内涵化这两个不雅点,你就会在成为数据科学家的路上加倍顺畅。”

“我认为也许他们须要大年夜不雅察本身,搞清跋扈他们真正关怀什么开端。他们想要做什么?如今,数据科学是一个有点热点的话题,因而我认为有很多人想着只要他们拥有“数据科学”的头衔,那么魔力、幸福和金钱就会流向他们。所以我真的建议搞清跋扈你真正关怀的是数据科学的那块。这是你该问你本身的第一个问题。随后你应当搞明白若何精晓这块。你还要开端推敲那些可以或许发挥你这方面兴趣的工作。

3 —Yann LeCun,Facebook人工智能研究总监,纽约大年夜学数据科学/计算机科学/神经科学传授

“我经常被问到这个问题,往往我给雷同的建议。我的建议是:如不雅你是本科生,进修一门尽可能多修数学和物理课程的专业。不幸的是,并且必须是有效的课程。我接下来要说的听起来是自相抵触的,然则攻读工程学或物理学专业可能比数学、计算机科学或者是经计揭捉?专业更合适。当然,你须要进修编程,是以你须要进修大年夜量的计算机科学课程去进修编程机制。随后,完成数据科学的卒业项目。进修本科阶段的机械进修,人工智能或者是计算机视觉课相干技巧,因为你须要初步摸索这些技巧。接下来,尽可能进修接触到的数学和物理课程。尤其是会持续应用的数学课程:优化,因为你是为将来竽暌滚到的挑衅做着预备。

 1/4    1 2 3 4 下一页 尾页

  推荐阅读

  使用混合云需要考虑的三方面问题

沙龙晃荡 | 3月31日 京东、微博拭魅战专家与你合营商量容器技巧实践! 我们弗成能在一夜之间迁徙到公有云,这就是为什么混淆云对企业来说是一个很重要的理念。混淆云的理念是,你可以保存你>>>详细阅读


本文标题:如何成为一名数据科学家?或许你该听听这些知名数据科学家们给出的建议

地址:http://www.17bianji.com/lsqh/40610.html

关键词: 探索发现

乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

网友点评
自媒体专栏

评论

热度

精彩导读
栏目ID=71的表不存在(操作类型=0)