讀天才與算法：人腦與AI的數學思維筆記21_語言遊戲

1. 語言遊戲1.1. 如果你想成爲一名作家，理解語言是很重要的，或者至少要有理解語言的願望1.2. 若要通過圖靈測試，算法需要能夠接受千變萬化的“自然語言”作爲輸入，並對其進行處理，然後生成與人類可能做出的反應相對應的輸出1.3. “自然語言”一般指人類在自然進化過程中不斷被重複、被使用的，沒有經過有意識的預先設想和計劃的語言1.3.1. 其與計算機代碼有著鮮明的區別1.4. 第一個成功通過圖靈測試的算法，是計算機科學家約瑟夫·魏澤鮑姆（Joseph Weizenbaum）在1966年開發的名爲“ELIZA”的程序1.4.1. 如果你曾經看過心理醫生，而這名心理醫生剛好接受過卡爾·羅傑斯（Carl Rogers）的以當事人爲中心的治療培訓，你就會了解，心理醫生會問一些問題，但不會把談話導向一個新的方向1.4.2. 他問的這些話僅僅是繼續了前面的話題，而這爲患者提供了進一步闡述其精神狀態的空間1.4.3. 關鍵是要編寫很多的規則來讓對話令人信服1.4.4. 應答的範圍有限也不靈活，並且對以往的對話沒有記憶、聯想1.4.5. 之所以其在治療情景中應用效果良好，是因爲治療通常取決于患者是否能解決他們自己的問題1.4.6. 作爲醫生的算法應能診斷病情，所以ELIZA並不擅長進行疾病診斷，但另一些算法可能會比你的全科醫生更擅長疾病診斷2. 勒布納人工智能獎2.1. Loebner Prize2.1.1. 20世紀90年代初，發明家休·勒布納（Hugh Loebner）贊助設立2.2. 勒布納人工智能獎分設金、銀、銅獎。金獎、銀獎的獎金分別爲10萬美元、2.5萬美元2.3. 銅獎又分爲四個等級，獎金分別爲4000美元、1000美元、500美元、200美元2.4. 該獎項旨在遴選在人機交互方面更具靈活性和說服力的程序2.4.1. 這個測試的內容包括破譯和理解文本、視聽組件等內容，通過標准是評委們無法將其與真正的人類區分開來2.4.2. 第一個通過擴展版圖靈測試的程序將獲得一枚金質獎牌和10萬美元獎金2.4.2.1. 如果程序不僅能以文本方式通過交談測試，在音頻和視頻方式的測試中也能過關，則獲金獎，贏得10萬美元和一枚18K金質金牌2.4.3. 如果一個程序能夠獲得半數評委的確認票，那麽它的創建者將會獲得一枚銀質獎牌和2.5萬美元的獎金2.4.3.1. 如果它能在比較長的時間內以文本談話的方式迷惑至少半數評委，則獲銀獎2.4.3.2. 在2013年獲得第23屆勒布納人工智能獎銀獎的“三井”，在與人們對話的時候，會對人們提出的問題給出一些非常有見地的回答2.4.4. 在未達到以上標准的程序中，迷惑住最多評委的將獲銅2.5. 如果你曾經和聊天機器人聊過天，那麽你就用你跟它的對話有效地訓練過它2.6. 如果聊天機器人在未來遇到類似的情況，它可以逆轉角色，使自己應對起來更像是人類。但大多數算法都是基于ELIZA“如果……那麽……”的規則和更爲複雜的規則，因而，這些算法永遠無法真正處理語言的多樣性2.6.1. 我們需要理解語言是如何組合在一起的3. 威諾格拉德的測試3.1. “威諾格拉德”的測試由斯坦福大學教授威諾格拉德提出3.2. 在這個測試中那些不能很好理解語言模糊性和語言情境方面問題的人工智能很快就會原形畢露3.2.1. 人工智能系統在嘗試處理“自然語言”時，會在語言模糊性和語言情境方面存在一些問題3.3. 基于對語境和過往經驗的認知，人類知曉如何理解這個謎語似的句子，但是對于機器真的很難3.3.1. “威諾格拉德”測試正是利用了“自然語言”的複雜性、豐富性和模糊性等特征3.4. 人類所使用的代碼是長久以來在與他人的語言交流中逐步形成的3.4.1. 從幼年開始，人類就在語言環境中浸染，在這個過程中我們不斷地學習，不斷地犯錯，不斷地再學習3.5. 互聯網上有大量的可作爲數據庫使用的實例3.5.1. 我們爲什麽不能將算法投入互聯網任其自由發展，去學習駕馭語言的複雜性、模糊性呢？3.6. 諾姆·喬姆斯基（Noam Chomsky）認爲語言天賦是我們與生俱來的，就好像我們是按照老式的自上而下的模型進行編程的，而不是從零開始學習3.6.1. 語言學家們驚奇地發現，一個孩子想要理解其他人並與之互動，所需要的語言真的不用很多3.6.2. 對機器學習來說，僅通對一個龐大的語言使用數據庫來學習語言將會是非常困難的4. 危險邊緣4.1. 哥倫比亞廣播公司的益智問答遊戲節目，已有數十年曆史4.1.1. 《危險邊緣》以答案的形式提問、提問的形式作答4.1.1.1. 開局階段，人類選手發揮得不錯，並在一段時間內保持了領先，但最終還是不敵IBM算法的威力4.1.2. 更多的困難來自問答的方式4.1.2.1. 節目以一種問答倒置的方式進行，以答案的形式提問、提問的形式作答4.2. 2011年，IBM將注意力轉向了與國際象棋或圍棋截然不同的一個方向：挑戰變幻莫測的“自然語言”4.2.1. 參加益智問答節目《危險邊緣》4.3. 常常利用雙關語、文字遊戲、轉移注意力等方法來迷惑參與者，即使是人有時也很難理解其問題的意思4.3.1. 由這些因素帶來的模糊性使得算法幾乎不可能100%准確4.3.2. 贏得比賽將標志著機器在解析語言語義方面的能力有了重大提升4.4. 肯·詹甯斯（Ken Jennings）4.4.1. 已經連勝74場4.5. 布拉德·拉特（Brad Rutter）4.5.1. 直被認爲是一個“學痞”4.6. 《危險邊緣》之王4.6.1. 兩人在學校的智力測驗小組中都曾嶄露頭角4.7. IBM的算法“華生（Watson）”4.7.1. 爲了紀念IBM公司的第一任首席執行官托馬斯·J.沃森（Thomas J.Watson）4.8. 節目在全美電視網上播出，讓所有人看到了人類被機器超越4.9. 要贏得比賽不僅僅要擅長回答問題，有時也需要一定的策略4.9.1. 參賽者可以在最後一個題目上下賭注，這使得落後的選手有可能在最後一題時將手裏的錢數翻倍，從而贏得比賽4.9.2. 華生”也分出了一部分算力，來確保它能有效地運用所有數學技能進行下注4.10. 一定程度的運氣因素4.10.1. 答題的過程中在題板上會給出所謂的“雙賭法”，“華生”很幸運地在比賽中選到了4.10.2. 雙賭法通常指在賽馬博彩中，選擇兩場次指定的比賽都勝出即爲贏的押注法4.11. 有一個不公平的優勢：搶答器4.11.1. 一開始“華生”被允許使用電子信號的方式按搶答器，而不是像人類那樣按下實物按鈕4.11.2. 人們很快意識到，這將給“華生”帶來巨大的優勢4.11.3. “華生”每次都能在微秒級精確地按下搶答器4.11.3.1. 人類的反應能力和計算機電路相比差遠了4.12. 需要下注的，在下注的環節，“華生”依然對自己的答案表示不那麽確定，所以它下了很小的賭注

文采家

讀天才與算法：人腦與AI的數學思維筆記21_語言遊戲

躺柒