TalkingData兩萬五千美金懸賞最強大腦
2024-12-31 09:54:08
2016年7月12日——9月5日,北京騰雲天下科技有限公司(TalkingData)舉辦的全球算法大賽將在Dato公司(前GraphLab)的全程技術支持下在Kaggle線上算法大賽平臺如期舉行。無論您是資深的機器學習專家還是初出茅廬的數據科學愛好者,TalkingData都將開放給您少有的中國移動網際網路數據和真實的商業場景,並提供兩萬五千美元高額獎金,讓本次大賽成為全球大數據人才真正實現用數據創造價值的平臺。
大數據早已不再陌生,已被定義為科學探索的第四範式的它,繼幾千年前的實驗科學、數百年前的理論科學和數十年前的計算科學之後,由當今的數據爆炸孕育了數據密集型科學,將理論、實驗和計算仿真等範式統一起來。大數據已被譽為「非競爭性」生產要素,其具有「取之不盡,用之不竭」的特性,在不斷的再利用、重組和擴展中持續釋放其潛在價值,在廣泛的公開、共享中不斷創造著新的財富。
但現實是,我們目前的大數據離理想中的大數據形態還有很遠的距離。已經身處信息爆炸時代的我們,數據源與數據量從來不是問題。而真正的距離是在於我們如何去建構一個科學合理的分析模型,並相信、堅持分析模式的輸出結果。通過不斷地修正、累積各種正確的分析模型,不斷向理想形態靠近。在現今階段,對於每一個站在情境計算懸崖邊上的企業來講,能夠依據歷史和實時數據的關聯分析,滿足短線的、特定的市場需求,才是目前的當務之急。
作為中國最大的第三方移動數據平臺,TalkingData始終尋求著數量與算法的平衡,在實踐場景中挖掘學習,積累正確算法模型,向大數據理想最終形態邁步靠攏。舉例而言,目前在中國每天至少有10億臺實際使用的智能終端設備,這些用戶每次下載安裝App,都會在後臺產生一個對應的使用行為。但是絕大部分用戶都不會在使用App時上傳自己的年齡、性別等屬性信息。而如何通過用戶的行為判斷其年齡和性別,從而支持後續的產品運營或者營銷,就是一個關鍵的數據挖掘算法與情境應用問題。
更難能可貴的是,此次TalkingData將開放部分脫敏真實中國移動端用戶數據,這在網際網路相對閉塞的國內環境來講是一次突破性的創新嘗試,為中國大數據市場能更早地與成熟國際市場對接提供窗口,推動整體行業向前邁展,並在高層技術的國際交流中為國內大數據有志學者拓寬視野,增厚人才儲備。
而對於全球數據科學愛好者來說這是一個了解過中國用戶的契機,期望全球各地對數據挖掘感興趣的工程師熱情參與,為全球數以百萬計的開發者,提供更為有效的數據運營服務和數據營銷服務。此外,大賽出題形式趣味新穎,以解決真實商業問題為準,依託公司運營中可能遭遇的實際挑戰出發,立意深刻。另,本次高額的現金獎勵也成為賽事引人注目的一大亮點:
第一名:12500美金
第二名:7500美金
第三名:5000美金
比賽將於7月12日(北京時間)—— 9月6日,在全球最大算法大賽平臺Kaggle上展開角逐,並由Dato提供全程技術與推廣支持。選手將與全球50多萬機器學習愛好者們同臺PK,全程線上組隊,線上提交。最終評選結果將於9月13日通過選手在Kaggle平臺上的得分和專家評審團對算法的評估而得出,並由TalkingData與T11 Global Big Data Summit共同宣布結果。
具體時間、形式、報名等事宜請參閱大賽官方網站competition.talkingdata.com