帳號:
密碼:
最新動態
產業快訊
CTIMES/SmartAuto / 新聞 /
數位雙生突破:SVII-3D技術利用稀疏街景實現分米級基礎設施定位
 

【CTIMES/SmartAuto 籃貫銘 報導】   2026年01月18日 星期日

瀏覽人次:【960】

中國武漢大學與四川省公路規劃勘察設計研究院的科研團隊聯合發表了名為「SVII-3D」的全新框架,成功解決了低成本街景圖像在三維定位上的精度難題。該技術透過先進的視覺語言模型(VLM)與幾何引導精鍊機制,能在稀疏影像中實現分米級(decimeter-level)的3D定位精度,並自動診斷設施的運行狀態。這項突破為大規模、低成本構建城市基礎設施數位雙生(Digital Twin)提供了高效的技術路徑。

在智慧城市與設施生命週期管理中,精確的資產數位化至關重要。傳統技術面臨兩難:光學雷達(LiDAR)系統雖然精準但成本極高;而基於圖像的傳統方法雖成本低廉,卻往往存在公尺級的定位誤差,且難以捕捉細粒度的狀態資訊。SVII-3D框架的出現,正是為了在低成本的稀疏影像基礎上,克服魯棒性不足、定位不準以及缺乏狀態識別能力的挑戰,從而實現高品質的自動化設施管理。

SVII-3D的核心技術之一在於結合了LoRA微調的開集檢測(Open-set detection)與空間注意力匹配網路。這種設計讓系統即使在觀測視角有限、圖像數據稀疏的情況下,也能強韌地關聯不同視角的觀察結果,準確識別目標物。這項技術有效解決了傳統方法在複雜城市環境中容易出現的誤報或漏報問題,大幅提升了物體識別的可靠性與完整性。

為了達到高精度的定位,SVII-3D引入了幾何引導精鍊機制(Geometry-guided refinement)。研究團隊透過雙向精鍊演算法,對未分配的觀測值進行合併與校正,確保每一件基礎設施的中心坐標都由幾何一致的光線集計算而得。實驗證明,即使在噪點較多且影像稀疏的情況下,該機制仍能確保定位準確度維持在釐米至分米級別,解決了資產普查中常見的重複計數與空間偏離問題。

除了幾何定位,SVII-3D更進一步整合了視覺語言模型(VLM)代理(如 Qwen-VL、GLM-4v 等),賦予系統自動診斷設施運行狀態的能力。透過注入國家標準的專家知識與檢索增強生成(RAG)技術,系統能精確區分結構性損壞與表面髒污,並以結構化的 JSON 格式輸出詳細的屬性與健康評估報告。這讓管理單位能依據實時數據判斷維護的優先順序,實現主動式、智慧化的養護策略。

目前 SVII-3D 框架已在武漢與上海等大城市數據集中通過測試,展現了卓越的擴展性與經濟效益。科研團隊表示,儘管依賴稀疏影像仍存在先天局限,但未來的研究重點將轉向開發具備自我驗證能力的「數位質量檢查員(Digital Quality Inspector)」,透過自動檢測感知失敗來提升普查系統的公信力。這項技術的成熟,將推動城市基礎設施從傳統人工巡檢徹底轉向全自動化的數位化管理範式。

相關新聞
研揚全新無風扇強固型Box PC鎖定智慧安防市場
High NA EUV將登場 是否將加速半導體產業寡占?
安勤EMX-PTLP搭載Intel Panther Lake H 算力直攻AI工業邊緣運算
歐盟啟動NanoIC晶片試產線 推進先進製程與AI競爭力
非侵入式高解析腦磁圖突破 金屬中心攜國衛院打造OPMs腦磁影像新平台
相關討論
  相關文章
» 關鍵科技趨勢:半導體產業的七大觀察
» 以碳化矽為開關元件的電子式迴路保護裝置
» 移相多相升壓架構重塑電源效率
» 智慧感測提高馬達效率與永續性
» 強化電子材料供應鏈韌性 循環經濟實現AI資源永續


刊登廣告 新聞信箱 讀者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2026 遠播資訊股份有限公司版權所有 Powered by O3  v3.20.2048.18.97.14.90
地址:台北數位產業園區(digiBlock Taipei) 103台北市大同區承德路三段287-2號A棟204室
電話 (02)2585-5526 #0 轉接至總機 /  E-Mail: webmaster@ctimes.com.tw