PaddleX又叫飞桨全流程开发工具软件是一款集飞桨核心框架、模型库以及多种工具与一身的流程开发软件,该软件功能丰富齐全且简单实用,拥有完善的API开发架构,用户可以能够对软件进行简单便捷的流程编程,该软件多种组件和多种编辑工具,拥有多种丰富的学习开发所需的全部功能,可以能够帮助用户进行简单便捷的流程开发和学习;PaddleX这款飞桨全流程开发工具界面干净简洁、简单易用,可为用户能够提供简明易懂的Python API,同时该软件可以能够进行项目创建,可以能够将本地文件导入软件进行鲁丽和编辑,同时可以能够下载各种不同的样例进行使用,非常方便实用。

软件功能
全流程打通
PaddleX GUI覆盖深度学习模型开发必经的 数据处理 、 超参配置 、 模型训练及优化 、 模型发布 全流程,无需开发一行代码,即可得到高性深度学习推理模型。
数据集智能分析
详细的数据结构说明,并能够提供 数据标签自动校验 。支持 可视化数据预览 、 数据分布图表展示 、 一键数据集切分 等实用功能
自动超参推荐
集成飞桨团队长时间产业实践经验,根据用户选择的模型类别、骨架网络等,能够提供多种针对性优化的 预训练模型 ,并 能够提供推荐超参配置 ,可 一键开启多种优化策略
可视化模型评估
集成可视化分析工具:VisualDL , 以线性图表的形式展示acc、lr等关键参数在训练过程中的变化趋势。能够提供 混淆矩阵 等实用方法,帮助快速定位问题,加速调参。模型评估报告一键导出,方便项目复盘分析。
模型裁剪及量化
一键启动模型裁剪、量化,在不同阶段为开发者能够提供模型优化的策略,满足不同环境对模型性能的需求。
预训练模型管理
可对历史训练模型进行保存及管理,未进行裁剪的模型可以能够保存为预训练模型,在后续任务中使用。
可视化模型测试
客户端直接展示模型预测效果,无需上线即可进行效果评估
模型多端部署
点选式选择模型发布平台、格式,一键导出预测模型,并匹配完善的模型预测部署说明文档,贴心助力产业端到端项目落地
软件特色
全流程打通
针对数据准备、模型训练、模型调优、多端部署的深度学习全流程应用
易用易集成
简明易懂的Python API,完全开源开放,易于二次开发和二次集成
融合产业实践经验
融合飞桨产业落地经验,精选高质量的视觉模型方案,并开放实际的案例教学
教程与服务
全流程开发文档说明及技术服务。多种方式与技术团队直接进行交流
使用方法
1、完成软件安装双击软件即可启动软件进入软件准备界面

2、点击立即使用按钮即可进入软件初始化操作界面进行工作空间设置

3、进入软件流程开发工具操作界面,该界面可以能够进行项目创建

4、点击新建项目按钮弹出项目弹框,该弹框可以能够进行项目名称、任务类型等编辑设置

5、完成项目创建后可以能够对数据进行选择,可以能够对数据进行配置

6、点击选择存储路径和创建信息类型,最后点击渠道导入按钮即可将项目文件导入软件

7、点击软件右上角的设置按钮弹出软件设置弹框,该弹框可以能够对用户偏好进行设置

8、点击下载样例工程弹出选择实例项目弹框,该弹框亏下载样例工程

官方教程
第一步: 准备数据 在开始模型训练前,您需要根据不同的任务类型,将数据标注为相应的格式。目前PaddleX支持【图像分类】、【目标检测】、【语义分割】、【实例分割】四种任务类型。开发者可以能够参考PaddleX使用文档中的2.数据准备-数据标注来进行数据标注和转换工作。 如若开发者自行准备数据,请注意数据格式与PaddleX支持四种数据格式是否一致。
第二步:导入的据集
①数据标注完成后,您需要根据不同的任务,将数据和标注文件,按照客户端提示更名并保存到正确的文件中。
②在客户端新建数据集,选择与数据集匹配的任务类型,并选择数据集对应的路径,将数据集导入。

③选定导入数据集后,客户端会自动校验数据及标注文件是否合规,校验成功后,您可根据实际需求,将数据集按比例划分为训练集、验证集、测试集。
④您可在「数据分析」模块按规则预览您标注的数据集,双击单张图片可放大查看。

创建项目和任务第一步:创建项目
① 在完成数据导入后,您可以能够点击「新建项目」创建一个项目。
② 您可根据实际任务需求选择项目的任务类型,需要注意项目所采用的数据集也带有任务类型属性,两者需要进行匹配。

第二步:项目开发
① 数据选择:项目创建完成后,您需要选择已载入客户端并校验后的数据集,并点击下一步,进入参数配置页面。

② 参数配置:主要分为模型参数、训练参数、优化策略三部分。您可根据实际需求选择模型结构、骨架网络及对应的训练参数、优化策略,使得任务效果最佳。

任务模型训练参数配置完成后,点击启动训练,模型开始训练并进行效果评估。
① 训练可视化:在训练过程中,您可通过VisualDL查看模型训练过程参数变化、日志详情,及当前最优的训练集和验证集训练指标。模型在训练过程中通过点击”中止训练”随时中止训练过程。

模型训练结束后,可选择进入『模型剪裁分析』或者直接进入『模型评估』。

模型训练是最容易出错的步骤,经常遇到的原因为电脑无法联网下载预训练模型、显存不够。训练检测模型\实例分割模型对于显存要求较高,建议用户通过在Windows/Mac/Ubuntu的命令行终端(Windows的Cmd命令终端)执行nvidia-smi命令查看显存情况,请不要使用系统自带的任务管理器查看。
任务模型裁剪训练此步骤可选,模型裁剪训练相对比普通的任务模型训练,需要消耗更多的时间,需要在正常任务模型训练的基础上,增加『模型裁剪分类』和『模型裁剪训练』两个步骤。
裁剪过程将对模型各卷积层的敏感度信息进行分析,根据各参数对模型效果的影响进行不同比例的裁剪,再进行精调训练获得最终裁剪后的模型。裁剪训练后的模型体积,计算量都会减少,并且可以能够提升模型在低性能设备的预测速度,如移动端,边缘设备,CPU。
在可视化客户端上,用户训练好模型后,在训练界面,
首先,点击『模型裁剪分析』,此过程将会消耗较长的时间
接着,点击『开始模型裁剪训练』,客户端会创建一个新的任务,无需修改参数,直接再启动训练即可

模型效果评估在模型评估页面,您可查看训练后的模型效果。评估方法包括混淆矩阵、精度、召回率等。

您还可以能够选择『数据集切分』时留出的『测试数据集』或从本地文件夹中导入一张/多张图片,将训练后的模型进行测试。根据测试结果,您可决定是否将训练完成的模型保存为预训练模型并进入模型发布页面,或返回先前步骤调整参数配置重新进行训练。

模型发布当模型效果满意后,您可根据实际的生产环境需求,选择将模型发布为需要的版本。
如若要部署到移动端/边缘设备,对于部分支持量化的模型,还可以能够根据需求选择是否量化。量化可以能够压缩模型体积,提升预测速度

常见问题
为什么我的数据集没办法切分?
如果您的数据集已经被一个或多个项目引用,数据集将无法切分,您可以能够额外新建一个数据集,并引用同一批数据,再选择不同的切分比例。
任务和项目的区别是什么?
一个项目可以能够包含多条任务,一个项目拥有唯一的数据集,但采用不同的参数配置启动训练会创建多条任务,方便您对比采用不同参数配置的训练效果,并管理多个任务。
为什么训练速度这么慢?
PaddleX完全采用您本地的硬件进行计算,深度学习任务确实对算力的要求比较高,为了使您能快速体验应用PaddleX进行开发,我们适配了CPU硬件,但强烈建议您使用GPU以提升训练速度和开发体验。
我可以能够在服务器或云平台上部署PaddleX么?
当前PaddleX 可视化前端软件是一个适配本地单机安装的Client,无法在服务器上直接进行部署,您可以能够直接使用PaddleX Core后端技术内核,或采用飞桨核心框架进行服务器上的部署。如果您希望使用公有算力,强烈建议您尝试飞桨产品系列中的 EasyDL 或 AI Studio进行开发。
为什么我的安装总是报错?
PaddleX的安装包中打包了PaddlePaddle全流程开发所需的所有依赖,理论上不需要您额外安装CUDA等ToolKit (如使用NVIDIA GPU), 但对操作系统版本、处理器架构、驱动版本等有一定要求,如安装发生错误,建议您先检查开发环境是否与PaddleX推荐环境匹配。
更新日志
Version 1.1.4
2020年10月22日
修复意外中止后项目信息丢失问题
修复意外中止后,后台进程仍未结束问题
训练过程用户可以能够查阅错误日志
数据加载出错提示导致错误的图片文件
VisualDL后台进程改为存活时间5分钟
版权声明:PaddleX(飞桨全流程开发工具)所展示的资源内容均来自于第三方用户上传分享,您所下载的资源内容仅供个人学习交流使用,严禁用于商业用途,软件的著作权归原作者所有,如果有侵犯您的权利,请来信告知,我们将及时撤销。
软件下载信息清单:
驱动文件名称 | 发布日期 | 文件大小 | 下载文件名 |
---|---|---|---|
PaddleX(飞桨全流程开发工具)安装包 | 2024年11月13日 | 647.5 MB | paddlex.zip |
软件评论