麻省理工學院 | 明確不確定性的界限
指南者留學
2023-01-25 09:53:14
閱讀量:1163
<p>在科學技術領域,人們長期以來一直在努力提高各種測量的精度,同時也在努力提高圖像的分辨率。隨之而來的一個目標是減少從所收集的數(shù)據(jù)(可視的或其他方式的)中可以做出的估計和得出的推論的不確定性。然而,不確定性永遠不可能完全消除。既然我們必須接受它,至少在某種程度上,通過盡可能精確地量化不確定性,我們可以獲得很多東西。</p>
<p> </p>
<p>換句話說,我們想知道我們的不確定性有多不確定。</p>
<p> </p>
<p>麻省理工學院計算機科學與人工智能實驗室(CSAIL)的博士后Swami Sankaranarayanan和他的合著者——加州大學伯克利分校的Anastasios Angelopoulos和Stephen Bates在一項新的研究中討論了這個問題;以色列理工學院的Yaniv Romano;以及麻省理工學院電氣工程和計算機科學副教授菲利普·伊索拉(Phillip Isola)。這些研究人員不僅成功地獲得了對不確定性的精確測量,他們還找到了一種以普通人能夠理解的方式顯示不確定性的方法。</p>
<p> </p>
<p>他們的論文于12月在新奧爾良舉行的神經信息處理系統(tǒng)會議上發(fā)表,涉及計算機視覺——人工智能的一個領域,涉及訓練計算機從數(shù)字圖像中收集信息。這項研究的重點是部分被玷污或損壞(由于缺少像素)的圖像,以及旨在揭示受損或以其他方式隱藏的信號部分的方法——特別是計算機算法。Sankaranarayanan解釋說,這種算法“把模糊的圖像作為輸入,然后給你一個干凈的圖像作為輸出”——這個過程通常分為幾個步驟。</p>
<p> </p>
<p>首先,有一個編碼器,這是一種由研究人員專門訓練的神經網(wǎng)絡,用于消除模糊圖像的模糊。編碼器獲取扭曲的圖像,并由此創(chuàng)建一個抽象(或“潛在”)的干凈圖像的形式-由一組數(shù)字組成-這對計算機來說是可以理解的,但對大多數(shù)人來說是沒有意義的。下一步是解碼器,解碼器有幾種類型,通常都是神經網(wǎng)絡。Sankaranarayanan和他的同事使用一種被稱為“生成”模型的解碼器。特別地,他們使用了一個名為StyleGAN的現(xiàn)成版本,它從編碼表示(例如一只貓)中獲取數(shù)字作為輸入,然后構造一個完整的、清理過的圖像(特定貓的圖像)。因此,整個過程,包括編碼和解碼階段,從最初混亂的渲染中產生了清晰的圖像。</p>
<p> </p>
<p>但是人們能對最終圖像的準確性有多大的信心呢?而且,正如2022年12月的論文中所述,什么是表示圖像中的不確定性的最佳方式?標準的方法是創(chuàng)建一個“顯著性圖”,它賦予一個概率值——在0到1之間——來表示模型對每個像素的正確性的置信度,每次取一個。Sankaranarayanan表示,這種策略有一個缺點,“因為對每個像素的預測是獨立執(zhí)行的。但有意義的對象出現(xiàn)在像素組中,而不是在單個像素中,”他補充道,這就是為什么他和他的同事們提出了一種完全不同的評估不確定性的方法。</p>
<p> </p>
<p>他們的方法以圖像的“語義屬性”為中心——當把一組像素放在一起時,它們就有了意義,例如,組成一張人臉、一只狗或其他一些可識別的東西。Sankaranarayanan堅持認為,目標是“以一種與人類容易理解的像素分組相關的方式來估計不確定性。”</p>
<p> </p>
<p>盡管標準方法可能只產生一張圖像,構成對真實圖像應該是什么樣子的“最佳猜測”,但這種表示中的不確定性通常很難辨別。</p>
<p> </p>
<p>這篇新論文認為,為了在現(xiàn)實世界中使用,不確定性應該以一種對非機器學習專家的人有意義的方式呈現(xiàn)。作者并不是只生成一張圖像,而是設計了一種生成一系列圖像的程序——每一張圖像都可能是正確的。此外,它們可以在范圍或間隔上設置精確的界限,并提供一個概率保證,真實的描述位于該范圍內的某個地方。如果用戶對90%的確定性感到滿意,則可以提供更窄的范圍,如果可以接受更大的風險,則可以提供更窄的范圍。</p>
<p> </p>
<p>作者認為,他們的論文提出了第一個為生成模型設計的算法,該算法可以建立與圖像有意義(語義可解釋)特征相關的不確定性區(qū)間,并提供“正式的統(tǒng)計保證”。雖然這是一個重要的里程碑,但Sankaranarayanan認為這只是朝著“最終目標”邁出的一步。到目前為止,我們已經能夠為簡單的事情做到這一點,比如恢復人臉或動物的圖像,但我們希望將這種方法擴展到更關鍵的領域,比如醫(yī)學成像,在這些領域,我們的‘統(tǒng)計保證’可能特別重要。”</p>
<p> </p>
<p>他補充說,假設胸部x光片模糊了,“你想重建圖像。如果給你一組圖像,你想知道真實的圖像包含在這個范圍內,這樣你就不會漏掉任何關鍵的信息”——這些信息可能會揭示病人是否患有肺癌或肺炎。事實上,Sankaranarayanan和他的同事已經開始與一位放射科醫(yī)生合作,看看他們預測肺炎的算法是否在臨床環(huán)境中有用。</p>
<p> </p>
<p>他說,他們的工作可能也與執(zhí)法領域有關。“監(jiān)控攝像頭拍攝的畫面可能很模糊,你想要增強這一點。這樣做的模型已經存在,但衡量不確定性并不容易。你不想在生死關頭犯錯誤吧。”他和他的同事正在開發(fā)的工具可以幫助確定一個有罪的人,并幫助一個無辜的人免罪。</p>
<p> </p>
<p>Sankaranarayanan指出,我們所做的大部分事情以及我們周圍世界發(fā)生的許多事情都籠罩在不確定性之中。因此,更堅定地把握這種不確定性可以在無數(shù)方面幫助我們。首先,它可以告訴我們更多我們不知道的東西。</p>
<p> </p>
<p>安杰洛普洛斯得到了美國國家科學基金會的支持。貝茨得到了數(shù)據(jù)科學研究所基金會和西蒙斯研究所的支持。Romano得到了以色列科學基金會和Technion的職業(yè)發(fā)展獎學金的支持。Sankaranarayanan和Isola對該項目的研究由美國空軍研究實驗室和美國空軍人工智能加速器贊助,并根據(jù)合作協(xié)議編號FA8750-19-2- 1000完成。麻省理工學院超級云和林肯實驗室超級計算中心也提供了計算資源,為本工作報告的結果做出了貢獻。</p>
<p> </p>
<blockquote>
<p>注:本文由院校官方新聞直譯,僅供參考,不代表指南者留學態(tài)度觀點。</p>
</blockquote>