新四季網

AI系統:建立多維度向量進行數據檢測

2023-03-31 16:41:05 2

在網絡時代,虛假新聞是壓倒一切的,令人困惑。Facebook曾一度陷入虛假新聞的泥潭,不僅被指控影響美國總統選舉的結果,還被指控觸發德國政府的巨額罰款。就連以信譽著稱的BBC也不能倖免。例如,BBC北安普頓分部的Twitter帳戶就發送了這樣一條信息:  

爆料新聞:川普總統在就職典禮上受槍傷。  

10月4日,麻省理工學院的計算機科學與人工智慧實驗室(CSAIL)在其官方網站上發布了一則消息,聲稱該實驗室與卡達計算研究所的研究人員合作,開發了一個人工智慧系統,該系統能夠識別信息源的準確性,並且能夠識別p.個人政治偏見。這項研究的結果將於本月底在比利時舉行。布魯塞爾舉行的2018年自然語言處理經驗方法會議(EMNLP)正式宣布。  

研究人員使用人工智慧系統創建了一個包含1000多個新聞源的開源數據集,這些新聞源被標記為真實性和偏見分數。據說,這是相似數據集中最多的新聞源。  

研究人員寫道,打擊虛假新聞的一種(希望)方法是關注來源。儘管虛假新聞(帖子)主要通過社交媒體傳播,但它們仍然有自己的原始來源,也就是說,一種,所以如果一個網站發布了虛假新聞,那麼它很有可能在將來被發布。  

人工智慧系統的新穎之處在於它對所評估的媒體具有廣泛的上下文理解。它並不僅僅從新聞文章中提取特徵值(通過機器學習模型訓練的變量),而是考慮維基百科、社交媒體,甚至基於URL和網絡流量數據的結構來確定可信度。  

系統的支持向量(SVM)訓練用於評估事實和偏差。真實性分為:低、中、高;政治傾向分為:極左、左、中左、右、右和極右。  

該小組表示,該系統只需要檢測150篇文章,即可確定新原始碼是否可靠,在檢測新聞源是否具有高度、低度或中度真實性方面具有65%的準確率,在檢測其政治傾向是左傾、右傾還是中立方面具有70%的準確率。  

在上面顯示的文章中,AI系統從六個維度測試了文章的文本和標題。它不僅分析了文章的結構、情感和參與(在本例中是股票數量、對Facebook的反應和評論),還分析了文章的主題、複雜性、偏見和道德觀念,並計算了每個特徵值的得分,然後對一組文章進行了平均評分。  

維基百科和Twitter也被添加到人工智慧系統的預測模型中。正如研究人員所說,維基百科頁面的缺失可能表明一個網站不可信,或者說提及這個問題的政治傾向可能是諷刺的或者顯然是左傾的。此外,他們指出,信息公開不太可能。通過未經身份驗證的Twitter帳戶,或者使用沒有明確標記的新創建的帳戶,都是正確的。  

模型的最後兩個向量是URL結構和網絡流量,它們可以檢測試圖模仿可信新聞源的URL(例如,foxnews.co),參考網站的Alexa排名,該排名是根據網站的訪問總數計算的。  

該小組在MBCF(MediaBiasFactCheck)網站上對1066個新聞源進行了AI系統培訓。為了生成上述信息,研究人員在每個網站上發表了10-100篇文章(總共94814篇)。  

正如研究人員在報告中煞費苦心地介紹的那樣,並非每個特徵值都能有效地預測事實的準確性或政治偏見。例如,一些沒有維基百科網頁或Twitter檔案的網站可能發布公平可信的信息,而Alexa排名靠前的新聞來源並不總是更公平或更真實。比那些交通不那麼擁擠的人更可信。  

研究人員有一個有趣的發現:來自虛假新聞網站的文章更傾向於使用誇張和情緒化的語言,而左傾的媒體更傾向於提及公平和互惠。同時,維基百科頁面較長的出版物通常更值得信任,包含少量特殊內容的URL也是如此。字符和複雜子目錄。  

將來,研究小組打算探索人工智慧系統是否可以適應其他語言(目前只有英語培訓)以及它是否可以被訓練來檢測特定領域的偏見。他們還計劃推出一個應用程式,通過政治領域的文章自動響應新聞。  

該論文的第一作者兼博士後助理RamyBaly說:如果一個網站之前發布了虛假新聞,他們很可能會再次發布它。通過自動從這些網站抓取數據,我們希望我們的系統可以幫助找出哪些網站可以首先這樣做。  

新德裡的初創公司MetaFact使用NLP算法在新聞報導和社交媒體帖子中標記錯誤信息和偏見;SAAS平臺AdVerify。AI去年發布了測試版來分析錯誤消息、惡意軟體和其他有問題的內容,並交叉引用定期更新的資料庫,該資料庫包含數千個錯誤和合法新聞。  

如前所述,一度陷入虛假新聞的Facebook已經開始使用人工智慧工具來識別虛假新聞,最近收購了位於倫敦的初創公司Bloomsb.AI,以幫助其識別和消除虛假新聞。  

然而,一些專家不相信人工智慧能夠勝任這項任務。卡內基梅隆大學機器人研究所的科學家迪安·波默洛在接受外國媒體的採訪時告訴《邊緣》雜誌,人工智慧缺乏對語言的微妙理解,這對於識別謊言和虛假陳述至關重要。  

我們最初的目標是建立一個系統來回答,'這是假消息,是或不是,'他說,但我們很快意識到,機器學習不符合任務。  

但是人類事實檢驗員並不一定比人工智慧做得更好。今年,在保守媒體指責谷歌對他們有偏見之後,谷歌暫停了過去在谷歌新聞上貼的標籤FactCheck。  

然而,無論識別假新聞和個人偏見的最終解決方案是人工智慧系統還是人為的,或者兩者兼而有之,假新聞被消除的那一天都不會馬上到來。  

諮詢公司Gartner預測,到2022年,如果目前的趨勢保持不變,大多數發達國家將看到更多的虛假信息而不是真實信息。  

同类文章
 月球未解之謎有哪些?解密十大月球未解之謎

月球未解之謎有哪些?解密十大月球未解之謎

月球,地球的鄰居,它是環繞地球運行的一顆衛星。雖然我們每每在夜晚抬首時,可以看到月球的存在,但人類其實以月球真的很不了解。我們曾經寫過無數有關月球的詩詞,我們借月亮來抒發內心的感情,但我們卻很少以科學的態度來看待月亮,比如我們有誰去主動的了解月球未解之謎有哪些嗎?如果還不夠了解的話,今天就隨著小編一
 超乎理論30倍的超巨型怪物黑洞

超乎理論30倍的超巨型怪物黑洞

天文學家最近在一個有90億歲的星系中央發現一個超巨型黑洞,但黑洞比現時已知理論所容許的大近30倍,完全超乎想像,連天文學家都嚇得目瞪口呆。超乎理論30倍的超巨型怪物黑洞美國太空總署在2011年以史匹哲望遠鏡,在20億光年外發現星系 SAGE0536AGN,英國基爾大學和中央蘭開夏大學利用南非大望遠鏡
 科學新發現六:超級鑽石

科學新發現六:超級鑽石

基本信息中文名稱科學新發現六:超級鑽石製片地區中國類型紀錄片 片長46分鐘對白語言英語目錄1影片信息2影片簡介摺疊編輯本段影片信息電影名稱:國家地理:科學新發現六:超級鑽石電影類型:紀錄片影片時長:46分鐘影片語系:英語影片字幕:繁中字幕摺疊編輯本段影片簡介鑽石是世界上硬度最高的物質,千百年來鑽石一

地球上的水用完了怎麼辦?可以去別的星球拿

地球上的水並不是無窮無盡的,雖然地球上的水含量很高,但如果有一天淡水資源枯竭了怎麼辦?有人說有海水呀,海水轉化成淡水當然是可以的,小編這裡說的地球水用完是理論上的哈。要是真有那麼一天的話,人類會不會滅亡?答案是否定的,即使地球上的水用完了,我們可以到別的星球去拿,或者是移民到別的星球去。真的有這種星
 「超人」的故鄉氪星真的存在嗎?

「超人」的故鄉氪星真的存在嗎?

在超人漫畫的故事裡,超人因為故鄉氪星發生爆炸毀滅,所以來到地球,不過這個虛構的漫畫情節,最近有突破性發展,因為有天文學家真的發現了氪星的太陽,不但距離地球夠近,這顆母恆星壽命也比太陽系長,有機會發展出像超人這樣高等文明生物。「超人」的故鄉氪星真的存在嗎?美國自然歷史博物館海登天文館館長Neil de

科技之謎:為什麼時光不能倒流?

如果時光能倒流,我將回到曾經……可是這只是『如果』,關於時間的研究,人類已經進行了很多年,可以關於時光倒流一說,至今也沒有一個確切的答案。現在科學界主流的認識是,時光是不能倒流的。那麼這是為什麼呢?下面我們來看看這篇文章。

NASA取消2016年火星探測計劃

最近美國SpaceX公司做了一件讓科學界欣喜若狂的事情,他們成功發射並回收」獵鷹九號「火箭推進器,但是好景不長僅在一天之後,美國NASA就突然宣布:探測器」洞察號「(Insight)上其中一個主要科學原件出了問題,取消原定2016年3月發射該探測器到火星的計劃,這個一項決定對美國的外太空計劃是一個空
 十大奢華科技產品 土豪的專屬

十大奢華科技產品 土豪的專屬

科技便民,我們必須承認我們的社會生活因為科技而越來越便利,但是有些科技並沒有普及到千家萬戶,為什麼呢?因為成本高,價錢高。今天51區小編要給大家介紹的就是那些奢華的科技新產品,跟小編一塊兒去膜拜一下吧!十大奢華科技產品:Krell Illusion II功放Krell此前推出的Illusion 功放
 「天眼」FAST真的能找到外星人嗎

「天眼」FAST真的能找到外星人嗎

9月27日最新消息,世界最大望遠鏡FAST已經竣工,其500米的口徑更是讓人嘆為觀止,那麼這款被外界稱之為天眼的望遠鏡真的能找到外星人嗎?如果「天眼」FAST真的能找到外星人,人類又該如何面對呢?在了解這件事前,我們先來了解一下「天眼」FAST的相關功能吧。在FAST建成以前,世上已存的最大射電望遠
 最新VR虛擬實境科技 讓你一邊飛行一邊健身

最新VR虛擬實境科技 讓你一邊飛行一邊健身

德國初創公司ICAROS GmbH開發出一種結合虛擬與現實的健身器材,可透過虛擬實境(VR)技術,讓使用者一邊健身,同時一邊體驗飛行的快感。這種ICAROS健身器材包含機器本身、控制器和VR眼鏡三項,可藉由VR遊戲來訓練使用者的肌肉。當使用者透過飛行模擬遊戲在享受飛行的同時,此機器可以上下前後移動,