MLops博客

kb88凯时开户平台如何构建实验跟踪工具

11分钟
2023年9月13日

身为MLOPS团队工程师,你常常负责改善数据科学家的工作流添加能力到ML平台或构建独立工具使用

kb88凯时开户平台即一种能力自读文章后, 数据科学家 可能联系请求帮助实验正在缩放并变得越来越复杂跟踪实验并保证实验可复制 越发难上加难

构建管理实验工具可帮助数据科学家;

  • 一号跟踪不同项目实验
  • 2保存实验元数据
  • 3复制并比较结果随时间推移
  • 4分享结果队友
  • 5或推实验输出到下游系统

文章总结了过去五年中 最受欢迎实验跟踪器

基于我们自身洞察力Piotrusakow档案整理亚当奈乌拉斯基后端技术导师奈普奈学习

  • 如何实现开发需求kb88凯时开户平台实验跟踪工具
  • 什叶派kb88凯时开户平台理想实验跟踪工具组件并如何满足需求
  • 如何实现架构后端层kb88凯时开户平台实验跟踪工具
  • 技术考量kb88凯时开户平台建实验跟踪工具

本指南的焦点是要为您提供构建工具的必要构件kb88凯时开户平台文章不覆盖构建实验跟踪工具或写代码构建技术考量

聚焦构件,因为任何编码一周内无关紧要,半年后任何工具都可能被忘记

kb88凯时开户平台开发实验跟踪工具需求

开发方面有三大问题 建房时解决kb88凯时开户平台ML实验跟踪工具包括:

  • 帮助数据科学家处理元数据人工线程取自资料和模型原创
  • 提供数据科学家界面监控评价实验性能有效决策调试
  • 向数据科学家提供平台跟踪进度他们的ML项目
kb88凯时开户平台图表推理构建实验跟踪工具
kb88凯时开户平台三大理由建实验跟踪工具

处理元数据与人工线程数据与模型源

kb88凯时开户平台实验跟踪工具可帮助数据科学家从他们的数据和模型源头追踪实验文物的线程,存储生成元数据并管理它有可能定位实验的数据和模型的来源, 所以数据科学家可以探索实验事件和过程

解开两大好处

  • 可复制性:确保每一次实验数据科学家运行都可复制
  • 可解释性:确保他们能解释实验结果

确保可复制实验结果

实验结果应易复制,以便数据科学家可以更好地相互合作并实现良好的工作流程视图重复制运行相同代码并发同环境配置相同数据获取相同或类似实验结果

实现可复制性工作需要构建组件跟踪实验元数据参数、结果、配置文件、模型和数据版本等上代码修改数据科学家培训环境(或基础设施)配置

数据科学家几乎不可能复制模型并修复错误管道

用户应能够跟踪模型开发代码库的变化(数据处理代码、管道代码、实用脚本等),直接影响到实验运行方式和相应结果

确保数据科学家解释实验结果

当数据科学家运行实验并建模型满足预期性能需求时,他们也需要理解结果判断为什么模型作某些预测当然,并非所有情况都如此,但在需要理解模型预测方式和原因的情况下, "ML解释性变得关键

无法追踪实验数据源头(线程)、处理方式、实验使用参数和实验结果

kb88凯时开户平台实验跟踪工具应允许数据科学家:

  • 检验他人实验并易分享他们的遗产
  • 比较行为所创实验
  • 追踪并审核每一次实验免偏差和其他问题
  • 调试比较实验缺少训练数据、代码或参数

守法性是解释性至关紧要的另一个原因举例说,GNPR要求贵组织收集并跟踪数据集元数据并记录并报告实验生成模型如何工作

监控评价实验性能以有效决策

多数时间比较用不同数据集版本和参数进行的实验结果是合情合理的kb88凯时开户平台实验跟踪法帮助数据科学家测量模型参数变化对实验的影响将观察模型性能随数据版本变化

当然,这将有助于建立强健高性能机器学习模型无法确定训练模型(或模型)会归纳为隐蔽数据而不监控评价实验数据科学团队可用此信息选择最佳模型、参数和性能度量

跟踪机器学习项目进度

kb88凯时开户平台数据科学团队和其他相关利害相关方使用实验跟踪解决方案检查项目进度并查看项目向预期性能需求方向向向

功能性和非功能性需求

向合唱团布道 如果我说很多思想 去开发有效需求 任何软件工具第一,你必须弄清楚 企业和产品使用方面有哪些需求并在整个软件开发生命周期内对之进行规范、分析、测试和管理

创建用户故事分析并验证需求需求开发并配得上自己的文章本节概述最重要的功能性和非功能性需求理想工具跟踪实验

理解用户

取决于团队结构 组织搭建不同的用户kb88凯时开户平台需要实验跟踪工具kb88凯时开户平台最理想的是 数据科学家会使用你的实验跟踪工具kb88凯时开户平台高层次上,这里是您的数据科学家想做的工作 实验跟踪工具

  • 模式训练直播远程服务器培训模型或远程计算机培训模型直播时,他们想看到模型培训运行现场直播,这样当运行失效或完成分析结果时可以快速响应或分析结果
  • 所有模型训练元数据齐备与团队或自身一起研究项目时,他们希望所有建模元数据都存放在一个位置上,以便随时快速查找最佳建模元数据并确信元数据将永远存在
  • 对比模型训练运行模型培训有不同版本时,想比较模型并观察哪些最优性能,哪些参数有效,哪些输入输出不同


功能需求

kb88凯时开户平台上一节用实验跟踪工具学习解决问题kb88凯时开户平台这也是构建功能实验跟踪工具的任务

kb88凯时开户平台开始设计实验跟踪软件时,必须开发功能需求,以表示理想实验跟踪工具应做什么显示需求基于用户必须做的工作和结果特征应像什么

需求
特征特征

无缝集成工具生态圈

结合ML框架实验使用(模型培训与数据工具)。

整合工作流管弦和CI/CD工具

支持元数据日志多数据类型

记录简单数据类型如整数、浮点数、字符串等

记录复杂数据类型,如串行、字符串、图像、文件与文件目录

合并日志元数据(程序化元数据和UI元数据)。

查看运行细节列表,如数据版培训模型参数、性能标度、人工制品、所有者、持续时间和时间

排序过滤属性实验举例说,你可能希望它显示仅经X版训练的数据集Y运行量,精度大于0.93,按创建用户分组并排序时间

对比不同的实验以观察不同参数、模型架构和数据集如何影响模型精度、培训成本和硬件使用

非功能性需求

kb88凯时开户平台实验跟踪工具非功能性需求应包括:

质量学
描述性

可靠性

kb88凯时开户平台免得实验跟踪工具爆破培训作业-这可能代价高昂,当然,那应该是一个破解协议者

性能显示

API和集成需要低延迟度,这样它就不会延缓培训作业和ML管道(成本成本计算)。

效率

架构和技术应优化成本效益,因为用户可运行并跟踪多项实验,成本可快速相加

可缩放性

ML只会提高贵组织内的重要性不希望最终出现需要重写系统的情况,因为只有一位数据科学家使用时你提前捷径重写系统

强健性

需要弹性数据模型支持变化队规模和结构单数据科学家或一组数据科学家、4机学习工程师、2DevOps工程师等互换工作流用户可以决定想跟踪的内容一些人只跟踪训练后阶段一些人想跟踪数据变换的整个管道,另一些人则会监控生产模型千变万化风景数据模型需要支持生态圈中每一个新的ML框架和工具没有它,您的整合会快速变黑和无法维护

外部集成需求集成性应建立起来,以便软件收集数据集元数据供用户实验使用

kb88凯时开户平台架构实验跟踪系统

kb88凯时开户平台理想实验跟踪系统三三层:

  • 一号前端/UI
  • 2后端
  • 3客户库

kb88凯时开户平台一旦你理解这些组件的用法和我们为什么需要这些组件后,你就能搭建系统适应实验跟踪需求

kb88凯时开户平台实验跟踪软件不同层次间的互动
kb88凯时开户平台实验跟踪软件不同层次间的互动

搭建实验系统前端层

kb88凯时开户平台前端拦截大多数用户请求并寄送后端服务器运行实验跟踪逻辑多请求多响应遍历前端层 交通量大增 并需能处理最高层并发水平.

前端图层也可以视觉化并和实验交互系统前端最重要的部分是什么?

可视化实验元数据

数据科学方面许多实验处理可视化问题,从可视化数据到实时监控训练有素模型及其性能前端图层必须能够显示各种实验元数据,从简单字符串到嵌入ypyter笔记本源码视频自定义报表

显示数以百计运算属性

包括相关属性和日志元元数据包括:

  • 算法使用
  • 性能度量和结果
  • 实验持续时间
  • 输入数据集
  • 时间实验启动
  • 唯一标识符运行
  • 其它属性您认为可能有必要

并有可能跨实验对比运行

使用属性实验中添加可解释性特征和属性当然,你也可以从此视图推广或下载模型

查看a
untune.ai运行表

管理状态优化性能中两个最复杂部分构建UI组件比较,比如说,10次运行每个有千个属性,其中许多需要显示在动态图表上,可引起很多头痛。中等规模项目可能经历恒定浏览器冻结幼稚地.

除性能外,还有其他UItweaks可只显示项目属性子集,按特性分组运行,按别排序使用带提示和补全等滤波查询编辑器

系统后端

kb88凯时开户平台系统后端支持实验跟踪法逻辑kb88凯时开户平台层中编码实验跟踪域规则并判定数据创建、存储和修改方式

前端为此层客户端可拥有其他客户端,如集成模型寄存器、数据质量监控组件等有效方式与最传统软件相同,即创建服务下层和API图层中学习

kb88凯时开户平台基本实验跟踪工具需要执行系统后端两个主要组件

  • 一号用户项目和工作空间注册
  • 2实战跟踪组件

用户、项目和工作空间寄存器

kb88凯时开户平台本组件帮助管理实验跟踪工具用户并用实验跟踪活动关键组件需要做的有:

  • handle认证授权
  • 项目管理权限
  • 项目或工作空间的定额数(请求数秒数、存储量)

权限详度是多少?可选择粒状权限自定义角色和粗度预定义角色

跟踪组件

kb88凯时开户平台跟踪组件实战跟踪逻辑以下是一些块你应该考虑实现

  • 属性存储.
  • 布洛布文件存储器.
  • 串行存储.
  • 查询引擎.

属性存储

运行属性(参数、度量尺、数据样本等),需要方法将数据与运行关联属性存储和表内泛数据组织开始作用,因此数据查找对用户容易执行当然 关系数据库在这里会很值钱

一致性水平是多少可接受最终一致性?或你宁可强一致性代价高悬浮API层

布洛布文件存储

某些属性不易插入数据库字段,你需要一个属性数据模型处理此操作布洛布存储器高成本效益解决办法主要的优势是你可以存储大量非结构化数据用户可能想存储源码数据样本泡菜数据Frames等)、模型权值、配置文件等解决之道实用

关键计数器存储服务长期成本效益低延时存取.

串行存储

需要确定存储序列的方法, 特别是数字序列, 属性需要特殊关注视你使用案例而定,它们可能有数以万计元素存取方式让用户访问UI中的数据可能具有挑战性也可以限制序列数支持,例如1000元素,这足以供多例使用

关键因素有:

  • 一号长期存储成本效益
  • 2函数取舍
  • 3相对实施简单化

查询引擎

还需要添加特征到过滤器运行中结构大相径庭,这意味着你需要强健数据库引擎处理这类查询简单关系数据库无法有效实现时数据量非小事替代方式是严格限制实验属性数,您可过滤或分组使用下层多点 少点数据库黑客和技巧将足够工作你的方式绕过这一点

关键考量是取舍属性数用户可过滤、排序或分组并实现简单.

客户库(API和生态整合)

高层使用API层保护客户不理解结构、组织或甚至是服务揭穿特定操作,这非常有用。它不应该改变任何东西或运行逻辑像后端层那样取而代之的是,它应提供标准代理界面,暴露服务端点和API操作

kb88凯时开户平台搭建实验跟踪工具原生API通常不够求解方法为用户所使用 需要无缝集成如果您先定义API层,客户对代码库底层重构的修改最小化或最小化API合同不变

实际中,这意味着你可拥有库(或Python)与后端服务器重提升通信记录查询数据处理重试后退脱机您可能想实现持久性异步队列自始至终数据耐用性异步,以免延缓模型培训过程

kb88凯时开户平台实验跟踪工具也需要与数据培训模型推广工具合作, 除其他外,您的API层需要与ML和数据生态系统工具.

ML和数据生态系统演化,所以整合不是终点需要用新版工具测试并更新引导用户使用遗留集成程序而不强迫用户修改实验代码可解决此问题。

kb88凯时开户平台实验跟踪软件架构的考量(后端)

kb88凯时开户平台评价可行性是构建实验跟踪系统结构的一个重要部分 并评估你是否正确构建即指开发高层次架构 基础你已建立的要求

架构设计应显示你分析的层次和组件应分层搭配指层结构,指区分前端从您的后端架构.kb88凯时开户平台文章侧重于后端架构的考量,即实验跟踪逻辑编码

理解后端架构后,你也可以跟踪域驱动设计原则构建前端架构

后端架构层

建立系统架构软件架构原理帮助结构尽可能简单高效其中一个原理描述模块性想要软件模块化结构化,以便快速理解源码,省时构建系统并有可能减少技术债务.

工具跟踪实验 几乎肯定进化, 所以当你开发第一个架构时, 这将是粗糙的和 只是一些工作原理因为架构会随时间变化 需要步调一致设计模式省时维护并添加新特征

kb88凯时开户平台后端架构图像基本实验跟踪解决方案

kb88凯时开户平台后端结构理想实验跟踪工具
kb88凯时开户平台后端结构理想实验跟踪工具

使用前面解释的部分后,你可以看到架构中不同的模块并观察它们如何协同工作。

架构考量:单立认证授权

架构中你可能注意到验证与授权分离既然你可能有不同的用户,你希望他们通过认证组件.

通过授权组件软件管理员可管理每个用户权限和访问级别可阅读更多验证与授权差异本条.

上头定额管理用户管理构件的一部分将有助于管理用户可获取的存储限值

kb88凯时开户平台建立实验跟踪工具前的考量

kb88凯时开户平台造实验跟踪软件最高级学到它需要什么kb88凯时开户平台自然下一个问题转而问道:“在建立实验跟踪工具前,我必须作何考虑?

kb88凯时开户平台可能这是一个愚蠢的问题 而不是问题 你组织战略软件-核心产品提供- 是一个实验跟踪工具如果不是,你应该继续阅读

您可能已经熟悉软件开发难题搭建Vs买.kb88凯时开户平台实验跟踪工具为贵组织操作软件(支持数据和ML团队正常运维),下一个重要考虑解答问题时将考虑贵组织成熟度如下:

  • 经验,
  • 人才大全
  • AG凯时手机版高山市时间轴)
kb88凯时开户平台说明在决定是否构建或购买实验跟踪工具时的考量
kb88凯时开户平台判断是否构建或购买实验跟踪工具时的考量

来看看你想做决定时 需要自问的一些问题

kb88凯时开户平台贵组织开发过实验跟踪工具吗

举例说,如果贵组织从未开发实验跟踪器,则需要更多时间、试验和错误才能快速实现行业标准、最佳做法、安全性及守法性if a 'foundation'基础并不存在 特别是从工程队黑客构建可能达不到行业标准和公司期望

或需要有效、安全、更可靠现成解决方案

哪些人才可以搭建

产品或软件公司 有可能已有软件开发商 处理策略提供kb88凯时开户平台需要考虑契机成本 将内部开发者的技能 建实验跟踪工具 而不是用他们的技巧提高主产品

开发实验跟踪器内部可显著提高产品或ML团队工作流效率也可以占用开发商的技巧和时间 建构更多有意义的差异器 或最终消磨时间和努力

造价高多少

内部实验跟踪器建设成本大都维护费用.组织能承担更新软件、修复故障并添加新特征的费用吗?

预算覆盖维护工具运行和雇用新人所需的基础设施 以防原创开发商离开思考耗时耗值软件开发项目的长期效果,而不仅仅是短期节省

降低维护成本的一大部分正在减少高意外费用同时出现的可能性换句话说,同一般维护费用一样,管理风险的最佳时间是软件生命周期早期确定是否需要建或外包

kb88凯时开户平台建立实验跟踪工具需要多长时间

你必须考虑机会成本举个例子,如果需要两个月制作定制工具, 那时你还能搭建什么呢?执行跟踪组件需要两个多月吗?从POC构建工具到最终稳定发布需要多少开发周期

如果你是大企业的一部分 并有足够的开发周期 构建实验跟踪器 可能不成问题if it's not, 特别是使用案例独有问题获取脱机解决方案说到集成与您的栈以便集中建设战略软件可能效果更好

不太可能你有足够的周期达到水平复杂特性丰富需要标准实验管理工具,所以可能不值得用开发周期专用它

例举at奈普奈过去五年我们只专注于建健元数据存储库管理所有模型构建元数据供用户使用跟踪实验.从客户和ML社区学习并持续提高产品强度以适应各种使用案例和工作量

快速编码牺牲设计架构几乎总是错误选择软件运行时尤其如此,因为你较少时间专注于良好的架构并构建它必须具备的特征。归根结底,不是战略软件直接冲击或定义组织

终极思想

文章中我们覆盖了很多重述几钥外送

  • kb88凯时开户平台实验跟踪是一种强效活动.使用正确工具自动化使其方便用户并高效使用
  • kb88凯时开户平台开发有效实验跟踪工具需要:考虑用户对软件的杠杆作用和它与数据栈和下游服务整合的方式基本地讲,想一想最起码需要 让你起步运行-不复杂
  • kb88凯时开户平台后端图层实验跟踪软件.需要确保执行跟踪组件和工作空间寄存器以顺利管理用户会议

建立实验跟踪器的目标是确保提供组件供用户登录实验数据、跟踪实验并安全协作使用if they can do那些小到零管理, 那么你有可能搭建工作队

在大多数情况下,我们看到构建第一版仅仅是第一步-特别是如果它不是贵组织核心软件组件的话-用户需求列表因更新问题而增加时添加新特征可能会有挑战性

AG凯时手机版相关利害相关方需要考虑投入资源以适应用户需求的价值,并有可能满足行业标准

下一步步骤

你从何而去兴奋建构或你认为取脱机解法会吗

模型注册平台大都假设存储模型的具体形状取实验形式-stitchfix案例 我们模型不遵循线性定位模式

可适用于特定区域、业务线、实验等,都可互换性或多或少易于管理这些维度对数据科学家访问模型之需至关紧要 -以利亚本伊兹StefanKrawczyk免费部署机器修复数据科学家学习平台

StefanKrawczyk谈论为什么他们决定搭建模型寄存器菲律宾凯时国际官网开户而不是使用现有解决方案在同一背景中菲律宾凯时国际官网开户开源或付费解决方案无法满足特殊用户需求kb88凯时开户平台建立并维护实验跟踪工具可能不是开发者最高效使用时间和努力

深入探寻或聊天建立实验跟踪器联系我们脱机我们想交换经验

当然,如果你决定跳过大楼使用Neptune取而代之注册先试一试联系我们万一你有任何问题

AG凯时手机版参考资源

文章有用吗

感谢回馈