對CT圖像分析,分割出結節;
對結節進行定量定性分析;
對隨訪病人記錄其結節在時間上的變化,形成動態跟蹤;
對各類信息綜合考量,判斷結節類型;
甚至,自動生成報告……
找尋、分析、跟蹤、判斷、總結,這是山東聊城某三級醫院CT檢測室里,一套AI系統幫助影像科醫生對肺結節進行診斷的過程。
隨著AI醫療影像開始廣泛落地,越來越多的醫院,尤其是基層醫院開始享受到切切實實的“醫療技能”普惠。聊城這家醫院的系統來自北京一家AI創新科技企業,在2018年,其專門針對肺結節的系統就已經安裝超過一百家醫院,處理了超90萬病例。
這幾年AI醫療影像熱潮迭起,其中肺結節診斷又被認為是“入門”級能力,導致業界對落地成果的出現并不算敏感,而事實上,CT斷層成像作為分辨率非常高的三維成像,每個病人基本上都有幾百張斷片成像,AI系統需要處理的數據量十分龐大,應用落地一直是一件充滿挑戰的事。
這意味著,能夠符合醫療需要并實現快速迭代的AI系統,其背后一定需要越來越強大的算力來加速模型的訓練。
一個現實是,算力價值凸顯,甚至成為阻礙企業發展的桎梏(不僅限于醫療影像領域)——這也一定程度上解釋了,為什么當初醫療影像領域的初創企業一窩蜂上馬,但能活下來出成果的很少,除了開發能力不濟,很有可能是沒有找到合適的算力資源。
解決算力難題,成為內部數據科學團隊的當務之急。
AI超算——人工智能數據中心的小型化,問題的答案?
一位從事AI醫療影像的專家曾這樣闡述過算力的重要性:
由于模型訓練經常需要調整某些參數或者嘗試不同的模型,算力不夠,每個調整都可能需要等上幾天才能出結果,這導致模型優化缺乏效率,甚至因為時間太長都忘記了當初的測試目的。
幾乎所有AI場景對算力的需求都在加速膨脹,過去一些年,市面上能夠提供給數據科學團隊的算力形態,在一定的條件下都未必能很好地滿足需要,尤其是主流的基于CPU的龐大數據中心,在計算能力上離支撐快速迭代要求的算力水準還有較大差距。
甚至,由于數據科學團隊無法找到合適的算力供給而導致項目擱置或企業消亡的案例屢見不鮮,業界呼喚新的解決方案。
需求變化推動著供給變革,算力供給形態這些年也在持續進化,其中,一類可以承擔人工智能數據中心職責、提供符合需求算力的產品——“AI超級計算機”開始走向臺前。
開篇的北京AI創新企業能走下來,除了團隊在美國積累了一系列經驗等原因,恰當的算力供給也不可忽視,其命名為σ-Discover Lung的智能肺結節分析系統的開發,采用了來自NVIDIA的DGX Station加速神經網絡模型的訓練。
以小型化服務器系統的形式,NVIDIA DGX Station主要通過互聯的GPU以及大容量內存,來實現一體式AI數據中心的功能。
而這種產品的出現,其本質上是算力供給形態適應市場需求的一種進化,即人工智能數據中心的小型化——通過新的GPU芯片以及適配的主板與整機系統,大幅度提升算力性能,形成在外形上如同個人計算機產品一樣的“AI超級計算機”(以下簡稱AI超算),告別CPU產品的冗重與低效。
從具體參數看,AI超算表現出十分超前的性能。
不久前國內某龍頭科技企業幫助武漢建設的AI數據中心投入使用,其峰值性能為100 petaflops,相當于50萬臺個人PC的算力之和,而作為AI超算的DGX Station,其最新產品單臺可提供2.5 petaflops的算力,即只需要40臺就能在量級上與一個地區數據中心的峰值能力持平。
而在具體場景中,很多組織也在通過AI超算獲得算力。
中科院深圳先進技術研究院醫工所在醫療影像圖譜分析領域借助AI超算進行神經網絡訓練,相比傳統CPU計算方案,單臺搭載4個V100 GPU的DGX產品,提升訓練速度40倍以上,大大減少了模型訓練的時間。
由于心血管的復雜性,定向攻克心血管CT圖像識別的科亞醫療,需要高精度的AI模型來支持血管的精細重建及功能的準確分析,必須通過大量多維度多模態的醫學影像進行訓練,參數龐大而傳統的算法和工具平臺無法滿足這種需要。
采用AI超算后,科亞醫療的數據處理和訓練速度得到了極大提升,其解決方案“深脈分數DVFFR”實現了92%的檢測精準度,避免了非必要的冠脈造影,減輕了醫生的工作負擔和患者的手術痛苦及經濟負擔。
可以看到,AI超算正在滿足不同類型組織中的數據科學團隊需要。
除了算力,AI超算還將解決數據團隊的“要素配置”難題?
除了性能表現,在過去,一個數據科學團隊要完成算力體系的搭設,往往還需要一套包括各種要素的體系:
要配置計算硬件;
要搭設用于各種開發目的的軟件;
要有AI工程師;
要運營維護;
甚至有時還要考慮設備的散熱降噪……
“麻雀雖小也必須五臟俱全”,很多數據科學團隊顯然缺乏條件進行配置,而因為投入龐大且未必能符合算力要求,即便是大型組織也面臨尷尬的選擇。
而AI超算這種算力形態或能通過一體化的方式規避這個“要素配置”難題,這類產品并不要求復雜的安裝過程,甚至不需要IT部門的幫助,當缺乏這些要素(典型如AI工程師)時,數據科學團隊仍然可以實現即插即用、一站式的計算能力配置。
這意味著,那些非AI專業領域的團隊,不需要學習深度學習知識,不需要對AI框架、模型有十分深入的理解,甚至不需要自己配備數據模型,只需要有數據集,就能輕而易舉地完成AI數據訓練與模型開發工作。
毫無疑問,AI超算的這種特性,對那些相對于AI專業來說的“傳統”行業,例如汽車制造、生物制藥、光伏產業等,十分友好。
在國外,寶馬工廠就利用人工智能工作組設備NVIDIA DGX Station訓練和模擬出從零部件到裝配產線的“數字孿生世界”,幫助產線實現更好的效率與穩定性,為寶馬每天超1萬輛汽車的訂單生產貢獻力量。
構成AI超算即插即用特性的能力有很多,軟件系統方面操作系統、開發框架甚至各個場景的預訓練模型整合最為典型,軟硬件一體化協同讓數據科學團隊基本上無需再花太多心思到開發環境搭設上。
例如,在暨南大學信息科學技術學院計算機系,其教學與科研往往有多個數據團隊在同時使用算力設備,DGX Station AI.超算產品的OS自帶的多用戶、多任務管理功能,能夠讓不同數據團隊甚至不同成員在工作組設置下,按照不同的計劃同時進行各自的實驗,大大提升了資源的利用效率——這種多任務并舉的情形,在眾多組織中都廣泛存在。
此外,由于臺式PC式的產品形態,在企業辦公室、實驗室、科研機構,甚至在家中工作的數據科學團隊都能很容易通過AI超算配置自己的人工智能數據中心,進行深度神經網絡訓練、推理與高級分析等計算密集型AI探索。
用通俗的話說,DGX Station的出現,更像是為組織內的數據科學團隊打開了“懶人模式”——他們只需要聚焦于算法模型的創新即可,其他相關的工作都被一個一體化產品“包圓了”。
小結
如同PC的發展,從一間房到半張桌,從KB到GB到TB,從專業團隊操作到人人可用,AI算力設備也在經歷類似的過程,高能力、低門檻,優質算力資源正在實現更好的觸達,讓組織的數據科學團隊更好地獲取匹配的算力。
而從AI醫療影像場景可以看出,正是因為現實場景應用對AI有著越來越深刻的需求,才不斷倒逼著數據科學團隊以更快的方式來實現模型創新與迭代。這意味著,AI落地越廣泛和深入,最終傳導到數據科學團隊,就是對算力條件越來越高甚至必須一次次突破常規的要求。
AI超算成為了AI應用創新的起點,但它也是AI應用落地的結果,市場需求始終“水漲船高”,算力形態的進化,還將繼續。