barcode替jeff領獎(LeCun之後JeffDean離奇躺槍哥大黑人女博士)
2023-04-21 01:32:39
金磊 賈浩楠 發自 凹非寺量子位 報導 | 公眾號 QbitAI
這幾天的Twitter,真是有夠亂的。
先是深度學習三巨頭之一的Yann LeCun,因被指責為有種族歧視嫌疑的PULSE算法辯護,在經歷長達2周的唇槍舌戰後,宣布退出推特。
就在近日,谷歌 AI 掌門人 Jeff Dean 也被拖下水——因為他關注了一名與種族歧視相關的博主。
指控者是哥倫比亞大學的一位黑人女性研究員、PresGAN 作者,Adji B. Dieng (以下簡稱A姐)。
Jeff Dean這次中槍,真的很冤
與LeCun主動對PULSE事件發表觀點引來炮轟不同,可憐的Jeff Dean未置一詞,甚至都沒有圍觀這次的事件,但還是逃不過被所謂「種族主義」拖下水。
首先認識一下事件的主角:
Adji B. Dieng,來自非洲國家塞內加爾,在哥倫比亞大學讀書。主要研究方向是概率圖形建模和深度學習結合,為結構化的高維數據(如文本)設計模型。
從2017年起,Adji連續幾年在ICLR、NeurIPS等頂會參與組織workshop,主要方向是深度生成模型和結構化數據。
2018年,Adji在Facebook AI 的LeCun小組中做實習生。
2019年她獲得了谷歌AI博士獎學金。
此外,她的個人主頁上還詳細列舉了她作為女性科研人員獲得的專項榮譽和參加過的各種研討會。
那麼她又是怎麼跟Jeff Dean扯上關係的?
快速了解一下這個美國特色學術圈的爭議事件。
北京時間6月29日晚8點左右,DeepMind官方發了一條推特,預告了由DeepMind兩位科學家Mihaela Rosca和Jeff Donahue帶來GAN的普及課程。
這是一系列很基礎的科普課,主要內容是深度學習中的最常見的GAN模型,包括GAN的發展、優勢、常見GAN的不同衍生模型、和相關前沿創新。
這本身是一個再普通不過的小事,但是DeepMind隨後發布的課程Note,卻引火燒身。
課程Note是晚上8:57發布。
不到一小時,事件的主角A姐就發推@DeepMind,責問他們:
為什麼GAN的課程中沒有提到她在DeepMind的研究成果PresGAN。
她毫不客氣地指出:「難道因為我是黑人女性嗎?」、「引用我!」
這個理由著實讓中國讀者哭笑不得,事件本身根本不是有關論文抄襲不註明引用的學術不端。
而是一節科普課沒有提到她的成果,讓A姐不高興了。
隨後她又加入推特上已有的話題#CiteBlackWomen#(引用黑人女性),試圖引起更多關注。
她說自己的這篇論文,去年就公布在arXiv上,9個月來只有區區4次引用(其中一次還是她自己),就是因為她是黑人女性。假如主要研究者是一個白人男性,情況肯定大不相同。
至此,這件事還和Jeff Dean毫無關係。
但情況變化之快,轉折之突然,讓人錯愕。
加入討論的網友中有人支持她的立場,認為她的論文很有價值,不應該被遺漏;
但另一半網友認為她純屬碰瓷,研讀她的PresGAN論文,成果一般般,每天在arXiv上都有大量這樣的論文掛出來,根本沒有重要到非介紹不可的程度。
就是這個@Gwern的網友回復,引起了Adji Bousso Dieng的強烈不滿。
但是,她沒有用PresGAN本身的學術價值去反駁。她選擇揪出Gwern的「黑料」。
她翻出了一篇Gwern之前撰寫的,有關試管嬰兒技術中智力基因性狀選擇的成本研究文章,以此,她指控Gwern是一個優生主義者,所以她拒絕與Gwern進行任何對話。
解釋一下,「優生主義」是一種試圖挑選優秀遺傳性狀、改良人種的運動,希特勒領導的納粹德國尤其熱衷,並犯下了很多反人類罪行。
這個詞在西方語境下極其敏感,提出這樣的指控甚至比「種族主義」更加嚴重。
但優生學是一門正規的學科,沒有任何負面含義,這一點要弄清楚。
而這篇文章是否確定是「優生主義」,還沒有任何專家或機構評價,A姐自己也沒給出證據。
關鍵轉折出現了,A姐隨後在Gwern的關注者列表中,發現了Jeff Dean。
於是,她立刻主動@Jeff Dean,並意味深長地對Jeff Dean喊話:
你也關注了這個人,但我相信你不知道他是一個優生主義者。
這種喊話,給人一種強行要求Jeff Dean「沒病出來走兩步」的感覺……
可憐Jeff Dean,一沒發聲,二沒關注事件,三不是GAN發明者,就這樣挨了來路不明的一槍。
順便一說,GAN之父Goodfellow也關注了Gwern,A姐在「followers you know」中肯定能看到他,但她卻沒有@Goodfellow 。
目前,Jeff Dean和DeepMind都沒有回應。
但是,Jeff Dean被A姐人為置於了一個進退兩難的局面:支持她,很多同行不認可;
保持沉默或不支持,會被政治正確圍攻;
如實表達個人看法,有可能面臨和LeCun一樣的局面。
Jeff本人可能還在發愁怎麼回復,但推特網友已經吵翻了天。
截止發稿,A姐發推約40個小時左右,推特下面大概有1/3留言表示支持她,認為這是對女性對黑人嚴重的歧視。
約1/5的留言認為她論文沒價值,在碰瓷搏出位,其中一個重要觀點是,這篇PresGAN的論文仍然未經同行評審,而業內較少或不引用這樣的文章並沒有錯,不是啥事都跟種族、性別有關。
剩下的人大部分是騎牆態度,兩邊都不得罪,說一些不犯錯但沒有實質內容的話。
但確實有個別人指出了關鍵,建議A姐應該用論文本身說話,詳細說明為什麼不應該遺漏她的PresGAN,但Adji Bousso至今沒有回覆。
A姐自己隨後又發推補充,她認為DeepMind可能不是故意漏掉她的成果,但這說明人們潛意識中的歧視問題更加嚴重。
同時對於Reddit鎖帖,她表示不在乎,自己也根本不是什麼racial blur(淡化種族),她本人作為黑人女性很驕傲。
但是她一直沒就PresGAN本身做任何說明。
A姐主動拉業界大佬下水的舉動對錯先不論,她的關於PresGAN的研究到底價值幾何?
什麼是PresGAN?
那麼,PresGAN 到底是一個怎樣的研究呢?
方法的全稱叫做 Prescribed Generative Adversarial Networks,直譯過來就是「規定的GAN」。
這項研究於去年10月11日在 arXiv 上發表,時間已經長達9個月。
A姐表示,她的PresGAN在性能方面已經達到了 SOTA 水平。
PresGAN 核心改良內容包括兩點:
將噪聲添加到密度網絡的輸出中,並優化了熵調節的對抗損失。增加的噪聲使預測的對數似然性易於處理,並穩定了訓練過程。在不同數據集上評估後,發現可以減輕模式崩潰並生成具有高感知質量的樣本。
從上表的數據中可以看到,FID指標,也就是計算真實圖像和生成圖像的特徵向量之間距離的一種度量,與其它方法相比,性能是最好的。
就傳統GAN與變分自編碼器(VAE)之間的預測對數似然性而言,PresGAN縮小了性能差距,如下表所示。
圈裡人如何看待PresGAN?
在各種數據集上性能表現都到了SOTA,生成圖像效果也不錯,為什麼圈內人對這項工作不買帳呢?
Reddit 網友們,從純學術角度給出了一些見解。
首先是對PresGAN的技術本身,有網友認為:
問題出在它就是直接沿襲GAN,所以看起確實有點奇怪。
有人還po出了一個GAN大雜燴的 GitHub 項目,提出了大大疑問:
項目裡有這麼多的GAN,(你覺得)有多少就應該被引用?
然後非常犀利地評論道:
關鍵是她的論文在任何方面都不突出。我看不出這篇論文為什麼就該被引用。
對A姐提出的質疑——為什麼後出現的 BigBIGAN 會在演講中被提及,而 PresGAN 卻沒有?
有網友給出了三個理由:
BigBIGAN的結果更令人印象深刻;已被同行評議並發表在NeurIPS;是Jeff Donahue寫的,他是演講的人之一。我認為這三個都是非常合理的理由,來解釋為什麼會在演講中提到BigBIGAN,而不是PresGAN,這與種族/性別無關。
至於A姐對她論文引用量方面的抱怨,也有網友跳出來評論道:
如果大多數研究人員更關心新的研究,而不是擔心他們以前的工作有多少被引用,那他們的情況會好得多。
「This needs to stop!」
或許是隨著BLM活動的愈演愈烈,社交網絡中的機器學習圈子,最近也是瀰漫了一些別樣的味道。
有網友便「直擊七寸」地指出了這個問題。
包括Yann LeCun的事情,這種「有毒」的行為正充斥著 ML 社區。
每天都會產出大量的ML論文(難道篇篇都得被引用不成)。
而最為精闢的便是最後一句話:
不要把問題直接歸咎於種族主義和性別歧視!
網友情緒一天後爆發
就A姐事件發生一天後,廣大普通從業者們終於忍無可忍了。
一位名為yusuf-bengio的網友在Reddit的機器學習社區發帖,批駁當下機器學習圈子的8大毒瘤(toxicity problem)。帖子發出5小時,熱度已經1.2k。
這8個問題全都一針見血,毫不留情。
這其中既包括論文投稿的潛規則,也有動輒對別人群起攻之的怪像,總之這8個問題搞得機器學習社區烏煙瘴氣,其中4條直指「政治正確」。
在他看來:
1、LeCun只是理性討論,但對他的攻擊超出了合理的範圍。封殺別人、道德綁架,迫使別人沉默解決不了任何問題。
2、計算機領域少數族裔和女性比例低的問題一直存在,但是缺乏多樣性一直被當做藉口濫用,導致很多人不敢談論,怕被扣上種族主義和性別歧視的帽子,反而不利於解決問題。
3、道德標準的設定其實是美國標準,對之外地區沒有意義。
4、討論失去理性,變成了咒罵。Schmidhuber指責Hinton是小偷,Gebru說LeCun搞白人至上,Anandkumar稱Marcus性別歧視……
那麼,你覺得這些問題都是確實存在的嗎,它們又會把機器學習引向何方?
參考連結:
Reddit討論:
https://www.reddit.com/r/MachineLearning/comments/hi83sr/d_adji_bousso_dieng_calls_out_deepmind_lecture_by/
https://www.reddit.com/r/MachineLearning/comments/hiv3vf/d_the_machine_learning_community_has_a_toxicity/
論文地址:https://arxiv.org/pdf/1910.04302.pdf
— 完 —
量子位 QbitAI · 頭條號籤約作者
關注我們,第一時間獲知前沿科技動態
,