德國慕尼黑工業大學(TUM)教授 Angela Schoellig 領導的學習系統與機器人實驗室,近日發表了一款能根據指令尋找失物的創新機器人。這款外型如「裝有攝影機的輪式掃帚」的裝置,是首批成功將影像理解能力與明確執行任務相結合的機器人之一,研究成果已發表於《IEEE Robotics and Automation Letters》。
 |
| /news/2026/03/15/1018274740S.jpg |
該機器人透過頂部的攝影機掃描環境,將 2D 影像像素轉化為包含深度資訊的數據,進而構建出精度達公分級的 3D 空間地圖。配合筆記型電腦的運算能力,機器人不僅能即時更新環境地圖,還能辨識視覺範圍內的所有物體,並理解這些物體對人類的意義與功能。
為了像人類一樣思考失物可能的去處,研發團隊將互聯網的大規模語言模型(LLM)知識轉化為機器人語言。這意味著機器人明白:眼鏡極可能出現在桌子或窗台上,但絕不會出現在瓦斯爐或水槽中。透過這種語義推理,機器人能排除不合理的區域,專注於高機率場所。
在機器人的 3D 地圖中,系統會不斷計算並標記各區域出現目標物的機率數值。實驗數據顯示,相較於在房間內隨機搜索,這種基於 AI 邏輯的搜索效率提升了將近 30%。機器人運用了雙重 AI 技術:一部分用於視覺影像辨識,另一部分則用於語言模型的邏輯判斷。
這款機器人具備優異的記憶功能,能將先前的環境影像與現況進行對比。如果廚房中突然出現新物體,機器人能以 95% 的準確度識別出環境變動,並將這些變動區域標記為「極高機率」的搜索熱點,從而應對動態變化的居家或工廠環境。
Angela Schoellig 教授表示,下一階段的研究目標是讓機器人具備尋找「視線外」物品的能力,例如抽屜內或櫥櫃後的物件。這需要機器人進一步與環境互動,利用機械手臂學習如何抓握把手、判斷門扇開啟方向,讓自動化尋物功能延伸至封閉的儲物空間中。