讀天才與算法:人腦與AI的數學思維筆記04_算法

躺柒 2024-04-19 23:20:20

1. 算法1.1. 當下,我們的生活完全依賴于算法1.1.1. 上網搜索內容1.1.2. 使用GPS導航1.1.3. 觀看由奈飛公司(Netflix)推薦的電影1.1.4. 在線預約1.2. 算法正在引導我們進入數字時代,但很少有人意識到在計算機誕生之前,算法作爲數學的核心已存在了數千年1.2.1. 自古希臘以來,算法的身影一直伴隨著數學的誕生與發展1.2.2. 歐幾裏得除了證明素數有無窮多個外,還發現了一個方法,按照這個方法就能解決最大公約數等問題1.2.2.1. 在歐幾裏得的算法中,任何階段都不存在歧義1.2.3. 類似于“如果……那麽……”的條件判斷句式,這是算法的典型特征,也是計算機程序中算法的妙趣所在1.3. 任何算法都應該具備的四個關鍵特征的核心1.3.1. 它應該由一組精確的陳述和明確的指令組成1.3.2. 無論輸入的參數如何,這個過程都應該完成(不應該進入無限循環)1.3.3. 它應該給輸入算法的任何參數以答案1.3.4. 在理想情況下,它的運行速度應該很快1.3.4.1. 算法的執行時間與問題的規模成正比,數字越大,耗時越長1.4. “算法”這一名詞1.4.1. 穆罕默德·阿爾·花拉子密(Muhammad Al-Khwarizmi)是巴格達智慧館(great House of Wisdom)的首批負責人之一,他負責將古希臘數學原著翻譯成阿拉伯文1.4.2. “算法”是拉丁文對他名字的翻譯1.4.3. 圖片並不是一種嚴謹的數學方法,你需要的是代數的語言,即一個字母可以作爲變量代表任何數字,而這正是花拉子密的發明1.5. 算法已成爲我們這個時代通行的“貨幣”,因爲它們是計算機系統的完美素材1.5.1. 算法利用我們解決問題的模式,反過來引導我們去找到解決問題的方案1.5.2. 計算機不需要思考,它只要不停地遵循算法、執行指令即可,就像變魔術一樣,答案自己就會蹦出來1.6. 一個優秀的算法存在的價值:從足球到《權力的遊戲》,它在多種不同的應用場景中都能發揮作用1.7. 我們的生活對算法的依賴越多,對算法的工作原理及運行過程的深入理解就變得越重要1.7.1. 否則,你很可能會被算法“坑”了1.8. 算法的問題在于,有時會産生一些讓人意想不到的結果1.8.1. 人類能察覺到怪異,而算法只知執行,它才不管結果是否謬以千裏、荒誕不經1.8.2. 算法可能導致意想不到的後果,是人們對先進技術存在恐懼的主要原因之一1.9. 算法是基于數學的,在某種程度上,它們就是數學運算1.9.1. 它們並沒有真正創造性地拓展應用它們的領域,所以在數學界,沒有人會覺得自己受到了特別的威脅1.9.2. 後來出現了一種新算法,這個算法可以在與數據交互時做出動態調整,運行一段時間後,它的程序員就可能弄不太明白他的算法爲什麽會做出這樣或那樣的選擇了1.9.2.1. 這就是DeepMind團隊所使用的新算法,這個算法使機器在圍棋領域中戰勝了人類,開創了機器學習的新紀元2. 荒島算法2.1. 當代最非凡的算法莫過于每天幫助數百萬人浏覽互聯網的搜索算法2.2. 1996年拉裏·佩奇(Larry Page)和謝爾蓋·布林(Sergey Brin)把新算法命名爲“網絡爬蟲”(Backrub),但最終還是決定叫“谷歌”(Google),其靈感來自1後面的100個零2.2.1. 他們的目標是找到一種對互聯網上所有的頁面進行排序的方法,以幫助大家在這個不斷增長的海量數據庫中進行檢索,所以起這個代表巨大數字的名字似乎特別貼切,而且也很酷炫2.3. 搜索詞出現頻率最高的網站會被放在最頂部2.4. 如果一個網站有很多鏈接指向它,就暗示著其他網站認爲這個網站值得訪問2.4.1. 其原理是通過其他網站的評估去衡量某個網站的重要性,或者說該網站的訪問價值2.4.2. 這種方式也有可能被黑客攻擊,比如只需僞造出有1000個網站的鏈接指向這個花店就行了,這樣也會使其被納入搜索名錄2.4.2.1. 爲了防止這種情況出現,他們決定給那些獲得廣泛好評,深受信賴的網站賦予更高的權重2.5. 需要找到一種方法,通過觀察網絡的連通性來分配球2.5.1. 異常情況:如果存在未鏈接其他網站的孤立網站,它的球會無法重新分配2.5.2. 矩陣的特征向量是在數學和其他科學領域中非常有效的一種工具2.5.2.1. 是量子物理中用來計算粒子能級的秘密武器2.5.2.2. 可以用于研究旋轉流體的穩定性(比如旋轉的恒星或者病毒的繁殖率)2.5.2.3. 可以用于研究素數在所有數字中是怎樣分布的問題2.6. 基礎引擎是公開的,但算法內部的一些重要參數還是保密的,並且隨著時間的推移不斷發展變化、更新換代,這些在一定程度上使得算法難以被破解2.6.1. 定期在互聯網上搜羅網站信息並更新網站鏈接的統計點擊量,這個工具叫作“谷歌蜘蛛俠”(Google spiders)2.7. 谷歌算法最吸引人的地方在于它本身的健壯性和防止欺騙的策略2.7.1. 一個網站很難在自己的網站上做手腳來提高排名,它必須依靠其他網站來提升自己的排名2.7.2. 如果你關注一下谷歌搜索,就會發現排名很靠前的網站主要都是新聞媒體網站和大學官方網站,比如牛津大學、哈佛大學的官網2.7.3. 當牛津大學網絡中的任何一個網站鏈接到外部網站時,該鏈接將提升其所鏈接的外部網站的排名,這意味著牛津大學認可與該網站共享其巨大的聲望2.8. 谷歌的算法再強大,也不可避免地被那些了解數學原理的人用更加聰明的辦法攻擊並加以利用2.8.1. 另類的搜索結果的峰值會通過算法本身而不是人工幹預進行降級,並被算法慢慢剔除2.8.2. 谷歌不喜歡扮演“上帝”,但從長遠來看,它相信的是數學的力量2.9. 評估網絡節點的方法也可以應用于其他“類網絡”領域2.9.1. 與美國許多依靠數據分析發展起來的體育項目不同,足球需要經過一段時間的積累才能利用數學和數據統計挖掘比賽背後隱藏的規律2.9.2. 以最終勝者西班牙隊的數據來說,經過算法統計分析,西班牙隊中沒有明顯的核心球員,這反映了整個球隊很好地貫徹了“全攻全守”“快速短傳”的戰術思想,這最終促成了西班牙隊走上冠軍領獎台2.10. 網絡分析還應用于文學領域2.10.1. 一個不理解劇本內容的計算機算法也能分析出跟人相同的結論2.10.2. 事實證明,算法對于這個劇情網絡更加微妙的分析揭示出了劇中真正的主角3. 穩定婚姻問題3.1. 史上第一個獲得諾貝爾獎的算法3.1.1. 1962年,由兩位數學家大衛·蓋爾(David Gale)和勞埃德·沙普利(Lloyd Shapley)共同提出使用了一個匹配算法來解決“穩定婚姻問題”3.1.2. 這個算法不僅對人際關系問題的研究具有重要意義,對一些社會問題,包括醫療資源和學校招生名額分配等,也具有重大價值3.2. 穩定的婚姻關系意味著使所有的人獲得較爲滿意的伴侶,不應該有任何一位成員因不滿意算法分配的伴侶而選擇在某個時刻離開,與其他人私奔3.2.1. 利用多輪分析找到最終的穩定配對3.3. 在蓋爾和沙普利研究的基礎模型上,我們建立了婚戀交友網站用于配對分析的現代算法3.3.1. 從某種程度上講,這些算法選擇的結果會比我們自己去相親的結果更好3.4. 這個算法目前在世界各地廣泛使用3.4.1. 在丹麥用于小朋友匹配幼兒園3.4.2. 在匈牙利用于學生擇校3.4.3. 在紐約用于給猶太教堂分配拉比3.4.3.1. 拉比在猶太文化中,這是對有學識的人的尊稱3.4.4. 在中國、德國和西班牙用于大學招生和學生擇校3.4.5. 在英國被英國國家醫療服務體系(National Health Service)用于病人與器官捐贈配對,挽救了許多病人的生命3.4.6. 在美國用于給醫學院的畢業生分配工作4. 書商之戰4.1. 《制造蒼蠅》這本書二手書的價格大致在40美元4.2. 一個商家profnath對這本書開價1 730 045.91美元,並且還不包郵4.3. 一個商家bordeebook在做打折活動,但是價格更高,打完折要2 198 177.95美元,居然也不包郵(需要額外支付3.99美元運費)4.3.1. bordeebook的算法也挺有特點,檢測競爭對手的價格變化情況,並將對手價格乘以1.270 59作爲自己的售價4.3.2. bordeebook實際上就沒有這本書4.3.3. 其實就是倒買倒賣而已4.4. 《制造蒼蠅》這本書的錯誤定價並沒有給任何人帶來重大影響,但算法的錯誤是可能導致重大後果的4.4.1. 如果將這樣的算法用于股票期權定價將導致股市崩盤
0 阅读:0

躺柒

簡介:書既能讀薄也能讀厚,輸出才能檢驗輸入,完成才能完善。