AI科學家李飛飛的視界之旅
AI究竟是怎麼看世界的?
2024 Jan 25 閱讀塗鴉實驗室
(將圖片往左滑可看到更多圖片)
曾經有人眼睛太小,被自駕車判定為睡著,我們看得出的電腦不一定看得懂,你知道如果要讓電腦「看懂」這個世界,需要餵它多少張圖嗎?答案是:
「無限」
在人工智慧創造之初,有一群科學家試圖教機器「看」這個世界,然而當時人類連自己怎麼「看見」這個世界都不清楚,畢竟即使只有眨眼的一瞬間,我們依然能看見並理解眼前的圖像與意義
就這一瞬間,精密的人體從接收訊息、組成影像、連結經驗與記憶一連串動作一氣呵成,我們是用什麼辨別色彩、形狀、光影,又如何與腦中的資料庫形成連結?
受限於早年的科技,當時的科學家們對這些摸不著頭緒,更別說讓機器模仿人類看世界、並重現在我們眼前
因為這個「看」不只是單純的「看」到顏色,還要能「辨識」那是什麼物體,能「理解」物體之間的關聯
所以當你叫AI:「給我一張在海邊清涼玩水的比基尼美女圖」,它必須要能知道「海」、「玩水」、「比基尼」、「美女」各長什麼樣子,還必須理解美女應該在海裡玩水,而不是飄在天空,比基尼要在美女身上、而不是在臉上或大海裡
讓機器學人類「看」,但我們究竟是怎麼「看」的?
後來隨著科技進步,科學家們開始理解人類視覺原理,從《李飛飛的視界之旅》中,看起來概念有點像是拼圖,眼睛每一個接收元件只會看一個小部分,每個小部分進到下一層後會拼成整個畫面,在下一層就會比對大腦的資料庫並歸類
就像每片拼圖有一點色彩,但那色彩沒有意義,也無法單靠它理解是什麼圖像,等到拼圖組合起來後,我們才能理解這拼圖有什麼內容,不過拼圖需要花點時間,我們是一秒之內就可完成整個過程
然而資料庫要有多少類似的畫面才能形成一類?多少才能確定多樣物體之間的關係?如何讓我們了解即使在不同光線下,蘋果一樣是蘋果、不會改變?
這就有賴於我們成長過程中對於世界的探索,每時每刻我們都在觀察周遭,並用眼睛紀錄在腦內並歸檔,李飛飛等科學家們發現,要讓電腦擁有「人類等級」的視覺,就必須要讓電腦像人類嬰兒成長一樣認識這個世界
(人類等級的意思是,像人類一樣的認知世界,而不是像貓狗或其他動物的視界)
認識世界?但世界上有多少分類?怎麼分?
在我當初看《李飛飛的視界之旅》前,以為每個種類只要餵個十張二十張就可以了吧?了不起100張,但我沒想過分類要怎麼分、有多少才夠讓電腦認識世界的通貌?
比如狗,有小狗大狗,白狗黑狗,有哈士奇、吉娃娃,奔跑的狗與睡著的狗,世界上有多少分類,它們又各有多少角度或樣貌?天啊,我無法想像
最終在書裡揭曉了,那個數量是——
15,000,000張,分布在22,000個類別,還要外加每一張手工標註,以免電腦指著豬八戒說沙悟淨
這項工程在當年十分浩大,一度預估要花19年的時間才能完成,從最初完全不被看好、搜集圖片到被Google限流、經費短缺到一度想要賣店籌措資金,到最後透過群眾外包才總算縮到一年多完成
機器深度學習領域的先驅-李飛飛
至此,初代的大數據逐漸成形,隨著一次次的實驗調整,機器深度學習的歷史頁也跟著翻開了,而這些,是在那個年代AI領域中少見的華裔女性-李飛飛所促成
這段過程中,李飛飛博士儘管疲憊但不曾放棄,而她所遇到的難關不只是學術方面,還有移民家庭的窮困經濟、對未來的徬徨(要選夢想還是現實)
一個曾在美國社會底層掙扎的移民女孩,在餐廳裡打黑工、被學校老師看衰、直到用學術成績證明自己,要有多強的意志力,才能在這麼多不好的條件下成為領域先驅?我越看是越佩服她
老實說,天下文化分享書籍時,我壓根不知道李飛飛是誰,但大約翻到第二章開始,我就被吸引住了,李飛飛的文筆很好,用個人故事與AI歷史發展兩條敘事線牽引讀者,到中間段隨著她投入到研究領域後逐漸融合
不知不覺中,我因著她的挫折而嘆息,又因突破的曙光而振奮,更因不同的思考切角而感到興味盎然,不誇張,我連和兩小晚餐時都在分享這本書的知識(盡量白話)
結語
如果你喜歡看自傳、對科學/大數據&演化歷史感興趣,又或者好奇科學家在推進這些科技時會發生哪些事情,甚至早年移民到美國的辛酸血淚,《李飛飛的視界之旅》裡面都有
也許今天之前你不認識李飛飛,但今天之後,我真心覺得她的努力與成就值得被你認識,因為我們的現在與未來,有她的過去奠基其中,分享給大家:)
好書推薦:https://readmoo.com/book/210305021000101
曾經有人眼睛太小,被自駕車判定為睡著,我們看得出的電腦不一定看得懂,你知道如果要讓電腦「看懂」這個世界,需要餵它多少張圖嗎?答案是:
「無限」
在人工智慧創造之初,有一群科學家試圖教機器「看」這個世界,然而當時人類連自己怎麼「看見」這個世界都不清楚,畢竟即使只有眨眼的一瞬間,我們依然能看見並理解眼前的圖像與意義
就這一瞬間,精密的人體從接收訊息、組成影像、連結經驗與記憶一連串動作一氣呵成,我們是用什麼辨別色彩、形狀、光影,又如何與腦中的資料庫形成連結?
受限於早年的科技,當時的科學家們對這些摸不著頭緒,更別說讓機器模仿人類看世界、並重現在我們眼前
因為這個「看」不只是單純的「看」到顏色,還要能「辨識」那是什麼物體,能「理解」物體之間的關聯
所以當你叫AI:「給我一張在海邊清涼玩水的比基尼美女圖」,它必須要能知道「海」、「玩水」、「比基尼」、「美女」各長什麼樣子,還必須理解美女應該在海裡玩水,而不是飄在天空,比基尼要在美女身上、而不是在臉上或大海裡
讓機器學人類「看」,但我們究竟是怎麼「看」的?
後來隨著科技進步,科學家們開始理解人類視覺原理,從《李飛飛的視界之旅》中,看起來概念有點像是拼圖,眼睛每一個接收元件只會看一個小部分,每個小部分進到下一層後會拼成整個畫面,在下一層就會比對大腦的資料庫並歸類
就像每片拼圖有一點色彩,但那色彩沒有意義,也無法單靠它理解是什麼圖像,等到拼圖組合起來後,我們才能理解這拼圖有什麼內容,不過拼圖需要花點時間,我們是一秒之內就可完成整個過程
然而資料庫要有多少類似的畫面才能形成一類?多少才能確定多樣物體之間的關係?如何讓我們了解即使在不同光線下,蘋果一樣是蘋果、不會改變?
這就有賴於我們成長過程中對於世界的探索,每時每刻我們都在觀察周遭,並用眼睛紀錄在腦內並歸檔,李飛飛等科學家們發現,要讓電腦擁有「人類等級」的視覺,就必須要讓電腦像人類嬰兒成長一樣認識這個世界
(人類等級的意思是,像人類一樣的認知世界,而不是像貓狗或其他動物的視界)
認識世界?但世界上有多少分類?怎麼分?
在我當初看《李飛飛的視界之旅》前,以為每個種類只要餵個十張二十張就可以了吧?了不起100張,但我沒想過分類要怎麼分、有多少才夠讓電腦認識世界的通貌?
比如狗,有小狗大狗,白狗黑狗,有哈士奇、吉娃娃,奔跑的狗與睡著的狗,世界上有多少分類,它們又各有多少角度或樣貌?天啊,我無法想像
最終在書裡揭曉了,那個數量是——
15,000,000張,分布在22,000個類別,還要外加每一張手工標註,以免電腦指著豬八戒說沙悟淨
這項工程在當年十分浩大,一度預估要花19年的時間才能完成,從最初完全不被看好、搜集圖片到被Google限流、經費短缺到一度想要賣店籌措資金,到最後透過群眾外包才總算縮到一年多完成
機器深度學習領域的先驅-李飛飛
至此,初代的大數據逐漸成形,隨著一次次的實驗調整,機器深度學習的歷史頁也跟著翻開了,而這些,是在那個年代AI領域中少見的華裔女性-李飛飛所促成
這段過程中,李飛飛博士儘管疲憊但不曾放棄,而她所遇到的難關不只是學術方面,還有移民家庭的窮困經濟、對未來的徬徨(要選夢想還是現實)
一個曾在美國社會底層掙扎的移民女孩,在餐廳裡打黑工、被學校老師看衰、直到用學術成績證明自己,要有多強的意志力,才能在這麼多不好的條件下成為領域先驅?我越看是越佩服她
老實說,天下文化分享書籍時,我壓根不知道李飛飛是誰,但大約翻到第二章開始,我就被吸引住了,李飛飛的文筆很好,用個人故事與AI歷史發展兩條敘事線牽引讀者,到中間段隨著她投入到研究領域後逐漸融合
不知不覺中,我因著她的挫折而嘆息,又因突破的曙光而振奮,更因不同的思考切角而感到興味盎然,不誇張,我連和兩小晚餐時都在分享這本書的知識(盡量白話)
結語
如果你喜歡看自傳、對科學/大數據&演化歷史感興趣,又或者好奇科學家在推進這些科技時會發生哪些事情,甚至早年移民到美國的辛酸血淚,《李飛飛的視界之旅》裡面都有
也許今天之前你不認識李飛飛,但今天之後,我真心覺得她的努力與成就值得被你認識,因為我們的現在與未來,有她的過去奠基其中,分享給大家:)
好書推薦:https://readmoo.com/book/210305021000101
0則留言