趋动科技猎户座OrionX AI算力池化软件通过软件定义异构算力,将物理异构算力硬件资源进行池化管理,将应用与物理硬件资源解耦合,实现业务按需调度异构算力资源及跨厂商异构算力资源精细化管理和灵活调度。方案主要应用于人工智能开发、训练、推理场景下,可实现GPU算力资源利用率的优化提升,已在能源、金融、运营商、互联网、新能源车企等诸多行业中产生大量的应用案例。
此次趋动科技联合麒麟软件,携手打造基于银河麒麟操作系统的异构算力池化解决方案,共同探索AI领域新场景。
芯片架构 CPU:兆芯、海光、amd64
整机硬件:中科可控等国产主流服务器
加速芯片:海光DCU、寒武纪MLU、英伟达GPU
操作系统:银河麒麟高级服务器操作系统V10
基础软件:OrionX AI算力池化软件
应用软件:不限
结合银河麒麟高级服务器操作系统V10提供的内生本质安全、云原生支持、自主平台深入优化、高性能、易管理等特性,产品层面适应算力资源池技术框架,提升了系统的整体管理、运维、支撑能力。
硬件资源与AI应用松耦合,CPU算力与AI算力按需配比;
AI算力资源按需调用,随需应变;
显存可扩展、算力可超分;
AI任务根据资源池内算力资源使用情况统一调度;
AI算力资源声明式申请,资源自动聚合满足单机单卡,单机多卡及多机多卡不同场景要求;
AI算力资源集中管理;
自定义AI算力监控规则及监控数据可视化;
AI算力数据分析及统计报表。
本方案主要应用于人工智能开发、训练、推理场景下异构算力资源的优化使用。
案例名称:某银行案例
建设内容:通过异构算力资源池化,GPU资源池化,提高GPU资源利用率。实现GPU资源按照按需分配、随用随取、动态回收,使GPU资源从紧缺资源变为了弹性资源,资源弹性按需分配、化全局调用、实时释放、避免占用,有效提升GPU资源的利用率,且对用户无感知。同时实现英伟达GPU和国产GPU异构下的统一管理和资源合理分配。
方案价值:方案整体实现资源池全栈国产化,可在各类人工智能应用场景提供可靠、稳定、高效的算力资源。
基础设施层:服务器采用海光提供的通用算力,海光DCU提供强大AI算力。
操作系统层:银河麒麟高级服务器操作系统V10针对自主海光CPU平台在内核安全、RAS特性、I/O性能、虚拟化和国产硬件(桥片、网卡、显卡、AI卡、加速卡等)及驱动支持等方面优化增强。
虚拟化层:趋动科技OrionX将AI算力资源抽象为虚拟资源,实现AI算力资源的软件定义。