top of page

AI 看見野外:從照片重建動物的三維世界

已更新:1月13日

三維重建(3D reconstruction)在這幾年於人工智慧與電腦視覺領域成為熱門話題,而「重建動物的三維形態與動作」更是其中具挑戰性的一項任務。其目標是從一般的相機拍攝影像或影片中,推算出動物真實的三維外型、姿勢以及動態變化。這樣的技術不僅能應用在娛樂產業、虛擬實境(VR/AR)、電影動畫等內容創作上,也對野生動物的保育、畜牧管理以及生物學研究都有重要價值。想像一下,藉由攝影機重現牠們的體態與動作,就能讓我們在不打擾動物的情況下,獲得許多額外有用的資訊。


傳統上,研究人員若想取得真實動物的 3D 模型,必須使用雷射掃描或多視角攝影等方式,這些方法不但昂貴、流程複雜,還要求動物保持靜止,幾乎不可能在自然環境中進行。不過,深度學習(deep learning)的出現改變了一切。在近幾年,許多研究團隊成功利用類神經網路(neural networks)直接從一般 RGB 影像或影片中推算三維形狀,讓動物重建變得非侵入式又更靈活。


然而這項技術仍面臨不少難題,動物不像人類,牠們有著高度的多樣性與不穩定性。不同物種之間的體型與身形差距極大,即使是同一物種,不同品種、年齡或體態也有顯著差異。此外,動物不會乖乖配合拍攝,牠們不斷移動、轉身甚至遮住自己身體的一部分。再加上毛皮、羽毛、肌肉變化、光線干擾等因素,都讓影像重建變得十分困難。更棘手的是,目前幾乎沒有足夠的動物 3D 資料可供深度模型訓練使用。這使得研究人員必須發展弱監督學習(weakly supervised learning)甚至無監督學習(unsupervised learning)方法,讓 AI 能從普通影像中自行推斷形狀與姿態。

    要讀取更多嗎?

    訂閱 thesoundofevolution.com 持續閱讀此專屬文章。

    bottom of page