數據科學家是科技行業最受歡迎的工作之一,對於那些想要進入大數據世界的人來說,這是一個非常有利可圖的職業選擇。數據科學家需要不斷學習和發展,他們使用數字和信息來做出現實世界的決策,並轉換業務需求。各大組織都在熱切地尋找有才華的新人,根據美國勞工統計局(BLS)的數據,從2018年到2028年,就業崗位預計將增長16%。
怎樣才能成為一名優秀的數據科學家?大多數雇主和招聘人員在尋找完美候選人時優先考慮技能測試。年代成功的數據科學家也有單靠技能測試無法識別的品質。他們有很多你從書本上學不到的技能和品質。那麼,它們是什麼,你如何識別它們?
企業和招聘人員正越來越多地求助於這種招聘人才的壓力人工智能(AI)和機器學習基於(ML)的解決方案。據《衛報》報道,包括BP、Expedia和沃達豐在內的多家頂級公司正在使用一款基於ml的應用Headstart來幫助他們找到最佳候選人。Headstart使用一係列預測和上下文算法篩選候選人,並為他們匹配合適的職位。
在這篇博客中,你將遇到一些數據科學家必須具備的基本技能和品質。
頂級數據科學技能
非技術技能
- 數據的直覺
- 迭代的設計
- 統計思想
- 黑客的精神
- 創造力
- 溝通
- 數據驅動決策
- 有條理
- 團隊工作
- 求知欲和激情
技術技能
- 編程
- 定量分析
- 數學與統計知識
- 可視化技術
- 線性代數與多元分析
Excel是全球數據科學家最常用的工具之一。學習Excel for數據科學免費的beplay2018官网卓越學習學院.
快速提高數據科學技能的5個步驟
第一步-參加證書課程
從一個有抱負的數據科學家過渡到一個成熟的六位數專業人員,最難的部分是掌握所需的技能。如果你正試圖進入這個行業,最好的入門方法是熟悉最新的行業工具和實踐。
你可以上網看看數據科學項目專為希望在數據科學領域追求職業生涯並提高技能的學習者而設計。
網上有很多免費課程,其中一些是:
第二步——多讀少說
提高數據科學家技能的最快方法之一是積極閱讀和學習學術論文。網上有很多教育資源和免費的電子書,學生們可以通過閱讀來掌握基礎知識。LinkedIn是一個很棒的網站,學習者可以在這裏與數據科學專家聯係,並隨時了解最新的行業趨勢。
以下是我們推薦的幾本書,用於提高數據科學家的技能和思維:
- Think Stats: Allen B. Downey
- 赤裸裸的統計:從數據中剝離恐懼
- Python數據科學手冊:使用數據的基本工具,第1版
- 深度學習(自適應計算和機器學習係列),作者Ian Goodfellow, Yoshua Bengio和Aaron Courville
步驟3 -成為數據科學社區的活躍成員
理解人際關係很重要是很重要的。說到職業發展,了解關鍵的有影響力的人,密切關注專業人士,會給你帶來大量的社交和推薦機會。很難找到完美的工作?
你可以通過在數據科學活動或會議上與公司官員會麵來獲得這份工作。數據科學的職業軌跡不是線性的。你會發現自己從數據科學家來數據分析師以及其他流行的機器學習名稱,你的技能增長越多,獲得不同的專業。研究頂級數據科學博客,閱讀Medium、GreatLearning、KDNuggets和類似網站上的文章。如果你對某個概念感到困惑,研究不同的博客會讓你對這個主題有一個全新的視角和理解。
對於額外的挑戰,你可以寫關於數據科學主題的博客,並開始自己的博客。這是一個重溫舊概念並檢查你是否真正掌握了新概念的好方法數據科學家滑雪板lls.開設自己的博客可以向招聘人員表明你對自己的職業有多認真,並展示你在個人學習方麵的主動性。
不要忽視成為數據科學社區的活躍成員。參加您所在地區的數據科學活動,並親自露麵與同行聯係。如果你真的想要有所成就,那麼與被動地在場外學習相比,積極參與社區活動同樣重要。
步驟4 -參與開源項目
作為一名數據科學家,加入一個圍繞著你的愛好和興趣的開源項目。你會發現大多數機會潛伏在GitHub上,找到新工作的最好方法之一就是為這些工作做出貢獻。如果你想更深入地研究大數據,探索和實驗,並繼續提高你的技能,參與開源數據科學項目是所有這一切的秘密武器。
新來者可以通過將開源項目添加到他們的投資組合中來獲得相對於其他競爭對手的顯著優勢。當你不忙著為開源項目做貢獻時,你也可以在空閑時間抓取網站並建立自己的數據集。
第五步——掌握技術技能
技術技能是數據科學家用來為業務產品和服務設計用例的專用工具、編程知識和行業技術。通常,大多數數據科學家都會提高與數據可視化、統計分析等相關的技能學習如何應用機器學習和人工智能業務需求的模型。必須對軟件工程原理有一個簡單的了解,並且能夠正確地收集、組織並向非技術專家展示原始數據。
專業數據科學家使用的五大工具是R,表,Python,SQL,Hadoop學習者應該紮實掌握這些內容。對於那些認真想要提高數據科學技能的人,還建議他們具備線性代數和多變量微積分的豐富知識。了解統計思維的基礎知識將有助於有誌者在為客戶建模和設計產品時提出正確的問題。此外,數據科學家需要在數學、線性回歸和各種統計函數方麵有很強的基礎,以便編寫代碼並使機器學習模型有效地完成工作。人工智能和深度學習神經網絡處於行業機器學習創新的前沿。
十大非技術性數據科學技能
1.數據的直覺
僅僅因為應聘者有數據科學學位或數據科學認證這並不意味著他們有很好的數據直覺。具有這種品質的數據科學家非常擅長識別結構化和非結構化數據集中的模式。數據科學家的角色在不斷變化,他們現在必須了解客戶的需求以及他們組織的需求。一個好的麵試問題可以幫助你發現候選人識別數據模式的能力,那就是讓他們快速創建一個數據模式數據可視化.讓他們選擇任何他們覺得舒服的編程語言,比如Python或R,並要求他們展示他們在小數據集中挑選關鍵模式的能力。
2.迭代的設計
數據科學家需要能夠作為一個更大的團隊的一部分來工作,以交付結果。在大數據的世界裏,數據科學家提出問題,數據分析師提供答案。然後,數據科學家根據這些結果,在決定下一步之前得出結論或見解。這種迭代的設計過程對於任何IT部門的成功都是至關重要的,但並不是所有候選人都有能力以這種方式工作。
雖然從印度或其他地方的著名數據科學課程中選擇一個擁有數據科學認證的候選人是至關重要的,但你還需要一個喜歡迭代開發過程的人。在電話篩選麵試或技術麵試中,請應聘者詳細解釋他們最近參與的項目。他們是如何解決路上的障礙的?他們是如何做出改進的?這些問題的答案將有助於揭示他們是否能夠通過迭代設計的過程來改進產品。
3.統計思想
基於技能的技術麵試將告訴你候選人是否在數據科學和技術方麵有紮實的背景大數據分析並且應該表明他們是否擅長統計思維。然而,這取決於招聘人員在麵試階段檢查這一點。雖然候選人的簡曆可能會告訴你他們在海德拉巴或班加羅爾完成了數據科學課程,但這可能不會讓你很好地了解他們的溝通能力。在麵試過程中,問問你的候選人他們會如何用統計學來解決問題。例如,每個YouTube視頻的描述都包含“and”這個詞嗎?他們怎麼測試呢?他們會創作什麼樣的劇本?這個問題有助於突出求職者的統計思維能力。
4.黑客的精神
最新的研究表明,超過90%的數據科學家擁有碩士學位,因此您可以相當自信地認為,任何通過篩選階段並進入技術麵試的候選人都具有通用編程語言的基本能力,例如Python和R.然而,雖然基於技能的評估將顯示候選人對bash/命令行,SQL和Java的熟練程度,但它不會告訴你他們如何應對新的或不熟悉的編碼語言。這就是所謂的“黑客精神”:當人們找不到解決方案時,他們可以使用不熟悉的代碼或格式,甚至創建自己的工具嗎?
最優秀的數據科學家都有這種“黑客精神”和終身對學習的熱愛。他們不斷地在工作中重新培訓和學習新的編碼技能。要確定應聘者是否願意學習新技能,一個很好的麵試任務是挑戰他們,用他們不熟悉的編碼語言解釋或編寫算法或查詢是如何工作的。這個任務可以讓你深入了解他們思考、解決問題和應對新挑戰的能力,就像他們為你工作時可能會麵對的那樣。他們可能不會給出正確答案,但你可以看出他們是否有“黑客精神”,是否準備好麵對你工作場所不斷變化的挑戰。
讀也:成功數據科學家的秘密
5.創造力
創造力是任何數據科學候選人的基本素質。他們可能已經在一所著名大學完成了數據科學和大數據分析課程,但他們能夠用他們的知識來解決現實生活中的問題嗎?數據科學家經常執行數據庫運行和查詢,但要取得成功,他們還需要能夠設計新的查詢架構方法。畢竟,如果他們的結果隻是回答先前提出的問題,那麼您的組織將獲得什麼新的見解呢?這就是創造力發揮作用的地方;候選人能解決現實生活中的問題嗎?
確定這一點的最佳方法是給應聘者一個編碼挑戰,並要求他們在解決問題時大聲說出答案。這將給你機會看到他們哪裏出了問題,你將能夠實時糾正他們。這可以讓你深入了解他們的思維質量,以及他們為現有問題開發新解決方案的能力。有能力的數據科學家必須不斷設計新的策略來處理結構化和非結構化數據。
6.溝通
最重要的技能之一就是有效的商務溝通。無論是了解業務需求還是手頭的問題,還是調查涉眾以獲得更多數據,還是交流見解,數據科學家需要有說服力.數據科學家稱之為“講故事”,這意味著分析解決方案以一種清晰、簡潔和切中要點的方式進行交流,以便技術人員和非技術人員都能從中受益。數據可視化和表示工具由於其圖形吸引力和易於被組織中的所有團隊吸收,被數據科學家廣泛使用。經常被低估的是,這是最重要的技能之一,原因很簡單,如果團隊不能采取行動,所有的統計計算都是無用的。
7.數據驅動決策
沒有足夠的數據,數據科學家不會做出結論、判斷或決定。科學家們需要決定他們解決業務問題的方法,以及其他一些事情,比如從哪裏看,使用什麼工具和技術,以及如何以最有效的方式將其可視化和交流。對他們來說,最重要的是問相關的問題,即使這些問題看起來很牽強。把它想象成一個孩子探索他周圍的一切來得出結論。數據科學家也差不多。
8.有條理
數據科學家必須知道如何非常有組織。他/她要處理大量的數據,必須知道如何以係統的方式工作。這種品質會顯示出你有多擅長優先安排任務和及時解決問題。做事有條理也有助於時間管理,確保按時完成任務。
9.團隊工作
數據科學家離不開的另一個值得誇耀的東西是團隊合作。雖然看起來他們可以獨立工作,但實際上他們在不同的層麵深入參與組織。一方麵,他們必須與團隊合作,以了解他們的需求並收集反饋以達成有益的解決方案,另一方麵,他們必須與同事合作數據科學家、數據架構師等等數據工程師很好地完成任務。美國的文化數據驅動的組織永遠不會是孤立工作的數據科學團隊;相反,團隊將不得不在整個組織中灌輸相同的特征,以便最好地利用他們從各個部門獲得的見解。
10.求知欲和激情
這有點老套,但卻是事實。數據科學家對他們的工作充滿熱情,並且對使用數據來發現模式並為業務問題提供解決方案有著難以抑製的渴望。他們經常不得不處理非結構化數據,而且很少知道他們需要采取的確切步驟發現有價值的見解,導致業務增長。有時候,他們甚至沒有一個明確的問題要解決,隻是有一些錯誤的跡象。這就是他們的求知欲引導他們去探索別人沒有涉足過的領域。你不需要讀“如何像夏洛克一樣思考”,隻要問數據科學家就行了!
擁有的5大技術數據科學技能
1.編程
數據科學家將精通其中一種編程語言,比如R,Python、SAS、Hadoop等。這不僅僅是寫代碼,而是使用不同的編程環境來分析數據。在這個領域數據科學在世界各地的企業中看到前所未有的興趣和價值,對編程語言的掌握和適應不斷變化的技術的能力是數據科學家成功的關鍵。對使用編程工具的任何猶豫都可能成為依賴你的工作的公司的交易破壞者加速業務增長。
2.定量分析
這就是數據科學家工作的本質。對一個複雜的環境及其行為有一個經過計算和發自內心的理解,處理混亂和難以處理的數據,創建原型和模型來測試假設,這些都是一個工作的一部分數據科學家簡介.必須知道的概念包括如何建立預測和回歸模型,機器學習-監督和非監督學習算法,時間序列預測,數據約簡技術,神經網絡等。
3.數學與統計知識
如果沒有統計數據,數據科學家和組織的未來都是一片迷茫。如果沒有數學和統計學,就不可能根據係統在變化時的行為產生假設,對數據的變化做出統計顯著性假設,定義製定目標和衡量成功的指標,以及從數據集中得出準確的結論。如果沒有紮實的數學和統計學基礎,有效地編寫代碼或使用函數也將成為一個挑戰。
4.可視化技術
眾所周知,與文字和數字相比,人類吸收圖片形式的信息更快。工作知識數據可視化工具,如Tableau, Qlikview, Plotly或Sisense將確保數據科學家能夠自信地向技術和非技術觀眾展示見解,使他們相信自己的見解可以帶來的業務價值。熟悉可視化和向利益相關者展示引人注目的數據的原則,可以在很大程度上決定數據科學家的成功。
5.線性代數與多元分析
麵試中可能會直接問,也可能不會,但在某些時候,數據科學家可能不得不在內部構建他們的實現模型。在由數據定義的產品可以為組織帶來轉型收益的情況下尤其如此。數據科學是一個相對較新的領域,沒有固定的工作描述。因此,線性代數和多變量微積分的工作知識在開發開箱即用的模型時可以派上用場。此外,麵試官可能會用一個微積分問題嚇到你。自信的數據科學家會告訴他們加油!
結論
無論你是雇主還是招聘人員,這張成功數據科學家的技能和品質清單將讓你在尋找最佳候選人時領先一步。在招聘下一次員工時,請確保你要尋找的候選人具有良好的數據直覺、統計思維能力、“黑客精神”以及技術技能和創造力。具備這些品質的數據科學家一定能幫助你的公司蓬勃發展。