登錄
微信登錄
打開手機微信,掃描二維碼
掃描成功
請勿刷新本頁面,按手機提示操作
中科曙光不會以任何理由要求您轉賬匯款,謹防詐騙
您的微信還未注冊
中科曙光不會以任何理由要求您轉賬匯款,謹防詐騙
您可以同時關注中科曙光微信公眾號
使用微信掃一掃即可登錄! 查閱資料更方便、 快捷!
您已經注冊賬號和
關注微信公眾號
2025年1月
服務熱線:400-810-0466
容器化人工智能開發平臺解決方案實現了對深度學習開發環境的快速部署,針對深度學習開發流程,對運算資源按照訓練任務進行分割和分發,并額外支持容器鏡像管理、權限管理、交互界面圖形化等功能,以幫助用戶更快速的介入人工智能領域,聚焦實際算法的優化和迭代,促進人工智能技術在各行各業的快速落地。
基于容器技術,應用容器化,資源動態彈性擴展,實現深度學習開發和應用環境秒級部署。
數據集、模型代碼、模型權重等多維內容共享;在線自定義開發環境,并支持鏡像固化和自助發布。
對深度學習中的數據預處理、模型在線編寫、模型訓練、超參調優、模型驗證和模型發布等流程實現完全覆蓋。
支持深度學習領域主流的Caffe、TensorFlow、PyTorch等框架,提供GUI、SSH、Jupyter等多種接入方式。
方案技術架構
方案物理架構
方案構成
SothisAI軟件平臺:曙光SothisAI是容器化的企業級分布式深度學習平臺,提供高效快速的人工智能解決方案,一站式深度學習解決方案。幫助用戶解決多用戶組資源分配、開發環境快速搭建、應用程序靈活遷移等技術需求。SothisAI支持主流深度學習框架,提供圖形化、SSH、Jupyer等多種接入方式,并采用Slurm和Kubernetes雙調度引擎支撐,可滿足不同應用場景特點。
基于GPU的異構計算集群:針對深度學習的應用特點,采用4U8卡的高密度自研服務器X780和X795,搭配主流人工智能異構加速卡,為集群提供強勁的運算能力支撐。同時集群采用的高帶寬、低延遲的Infiniband網絡,能滿足深度學習多機多卡網絡模型訓練時,對PCI-E的傳輸帶寬的高要求,并保證整個系統的數據傳輸效率,減少網絡數據傳輸帶來的影響。
ParaStor存儲系統:ParaStor是曙光自主開發的分布式并行存儲系統,目前最新版本為Parastor300,采用多副本、N+M糾刪碼等數據保護技術、全冗余設計,支持單一存儲命名空間、支持容量海量擴展,性能線性擴展,能夠充分滿足深度學習應用場景中存在對數據集的頻繁讀寫,多用戶同時并發訪問,訓練時頻繁的數據交互等應用需求。
原生大規模編排調度驗證,經過10000節點驗證,具備處理大規模流量與批任務的能力,支持多種類型業務穩定高效地混合部署,大幅提升資源利用率。兼容主流加速器適配 CPU、GPU、FPGA、NPU。
集數據導入、數據處理、模型開發、模型訓練、模型評估、服務上線等功能于一體,提供一站式全方位的深度學習建模流程,快速打造智能業務。基于的開源容器化 AI 引擎,賦能企業的定制化模型。
集成多個行業數據集,包括語音、圖像、自然語言處理等,依托容器技術,為金融、能源、電力、微服務架構、分布式深度學習提供強大支撐。用戶能夠大幅優化資源管理,實現開發流程敏捷化。