raybet

人工智能计算平台

当前位置:>典型案例>人工智能计算平台>

人工智能计算平台

案例背景

地震数据采集 AI 模型开发框架平台基于云原生技术框架,开发“地震数据采集 AI 模型开发框架平台”,构建物探采集业务的 AI 开发框架,提供包含数据管理-模型开发-模型库-发布共享功能的模型开发、训练、部署、执行一体化全流程管理。从而达到提升地震物探采集 AI 模型与采集专业软件开发效率及前后端协同作业能力的目标。

地震数据采集 AI 模型开发框架平台在计算资源和基础服务统筹云化管理的基础上,提供包含数据管理-模型开发-模型库-发布共享功能的模型开发、训练、部署、执行一体化全流程管理。平台将支持Tensor flow、PyTorch、百度飞浆等主流AI框架,预置Unet、PSPNet、Unet++、Transformer、DeepLabv3、ResNet、图像金字塔等算法。

问题与挑战

aa01.jpg

GPU和CPU等资源分配的不均衡,或者规划的不合理,往往会导致高优任务无法高效的运行。

aa02.jpg

资源碎片较多,导致在集群有空余资源的情况下,某些任务依旧无法运行。

aa03.jpg

样本数据随意存储,不使用的数据不能集中销毁,可用数据无版本管理措施,数据共享无追溯能力。

aa04.jpg

机器学习涉及业务、数据、算法等多团队,团队间缺乏相同的技术和业务背景知识作为协作基础,从而带来沟通屏障。

方案

aa05.jpg

aa06.jpg