大规模信息流引荐系统研发效能提升之优秀实际

时间：2021-08-04 21:01 来源：网络整理作者：网络浏览：次收藏挑错推荐打印

信息流产品为了给大家提供千人千面的内容引荐，后端构建了一个庞大、复杂的引荐系统，整个系统包括上百个模块，上百个策略算法以及模型，并且这个系统以极高速的效率迭代，日均上线近百个需求；这样庞大的系统如何做到这样高速波动的迭代呢? 这里离不开 PM、RD、QA等各角色共同构建的智能交付系统。

本文主要引见了百度大规模信息流引荐系统研发、交付效能提升的相关实际。涵盖研发、测试、发布、上线部署各个阶段，经过智能化手腕，结合数据和算法，完成效能提升、以及流程智能流转，最终完成全流程的无人值守。

一、背景引见

信息流产品为了给大家提供千人千面的内容引荐，后端构建了一套庞大、复杂的大规模引荐系统，整个系统包括上百个模块，上百个策略算法以及模型，并且整个系统以极高速的效率不停迭代相关的策略以及架构，日均上线百次；这样庞大的系统如何做到这样高速且波动的迭代呢？这里离不开PM、RD、QA等各角色共同构建的智能交付系统。

大规模信息流引荐系统研发效能提升之优秀实际

△图表 1：简化引荐系统

智能交付系统掩盖从研发、测试、发布到上线的各个环节，首先要设计一套高效运转的交付形式，并针对以后交付形式各个环节的成绩逐一击破：

大规模信息流引荐系统研发效能提升之优秀实际

△图表 2：交付形式表示图

1. 研发及自测阶段：以微效劳化、业务框架&执行引擎为开发者赋能，降低研发成本，提升研发效率，并探求以自主测试为驱动的新研发形式，经过QA提供的优质交付效劳、RD本身质量看法和代码可测性的提升，进而完成研发测试一体化（测试才能左移为研发提供效劳、可测性改造等；研发右移提供更多的基础架构才能、质量看法提升等）来试点全体效能提升；

2. 测试阶段：将每个测试行为拆分为测试输入、测试执行、测试剖析、测试定位4个子环节，在树立完备的测试体系之后，经过数据和算法，以智能的手腕对各个子环节赋能，提升全体的测试效率和召回才能，并释放排查、定位、结果校验剖析各处的人力；

3. 发布阶段：从测试评价角度评价需求能否可以发布上线，满足上线条件的需求智能流转至上线部署阶段，完成流程的无人值守；

4. 上线部署阶段：从编译优化&部署包裁剪、智能监控、并发起态调整，效劳重启优化4个方面，结合OP、EE、RD共同提升上线效率；

5. 底层：依赖于弱小的中台才能，包括配置数据管理、构建中台、策略中台等等中台支撑流水线高效运转。

大规模信息流引荐系统研发效能提升之优秀实际

△ 图表 3：智能交付细叱表示图

二、中心成绩&处置方案 2.1 研发&自测阶段--该阶段主要处置研发效率和自测效率成绩 2.1.1 业务框架&执行引擎构建 1. 背景

目前，融合层的众多策略&业务逻辑，都比较分散。主要体如今以下几个方面：

代码架构：策略逻辑不内聚，数据依赖分散，缺乏通用性；

研发效率：开发一个调权功用，需求修正n个文件函数，并且每个中央的依赖数据和运用方式能够不尽相反，在开发前需求先熟习各个位置的代码，开发进程中很容易漏掉某个中央没开发到，研发调试、测试周期被迫延伸。

基于上述背景，预期完成一个算子执行框架，其主要目的如下：

标准算子接口和数据依赖，提升策略代码通用性和迭代效率；

框架对外接口尽能够复杂，外部执行完成尽能够轻量。

2. 完成

框架在完成上拆分红了两部分：中心执行+执行策略。如下图：

大规模信息流引荐系统研发效能提升之优秀实际

△图表 4：业务框架&执行引擎设计图

(1) 中心执行

主要功用：依据给定『执行形式』运转算子。中心细节上包括如下：

并发多路&短路执行功用，输入处置数据组织方式支持：流式&随机拜访容器；

算子支持带形状&有形状形式，完成算子执行的信息采集和反应。

(2) 执行策略

主要功用：依据中心执行采集的信息，生成『执行形式』。详细完成逻辑是：采集中心执行每个算子的运转信息，输入执行剖析策略模块，生成下一次中心执行的执行形式，中心细节包括如下：

独立线程活期剖析运转状况，生成运转形式；

运转形式更新和运用采用0-1buf增加读取&写入的竞争；

执行剖析策略模块，采用插件化设计（相似路由iptable），生成运转形式的时分，顺序遍历每一个策略，支持自定义开发不同的执行剖析策略模块。

2.1.2 新研发形式试点 1. 背景

所谓自主测试就是RD在研发进程中自行应用优质的测试相关效劳停止质量保障，再结合完备有效的自动化才能直接给出可交付结论的研发行为；全体经过树立极致流水线和测试效劳才能，引入研发深度参与测试，并结合智能化测试落地，提升全体交付效能。

2. 完成

流程变化：原有提交代码后QA依据本次变更补充相应case，以掩盖变更场景，左移至RD开发环节；

RD任务： RD在开发需求、策略代码的同时，在QA提供的测试效劳才能基础上，经过配置case或许编写自定义校验函数的完成case书写任务，全体case编写成本30min之内；

QA任务： QA经过树立可配置化模块接入，配置化case添加的自动化测试框架，提供低成本运用的测试效劳才能，降低RD case书写成本；并且测试效劳才能掩盖包括基础校验、策略校验等90+%中心功用点，流水线掩盖功用、功用、波动性等P0测试场景，以保障此部分的需求无风险上线。

大规模信息流引荐系统研发效能提升之优秀实际

△ 图表 5：新研发形式试点

2.2 准入&测试阶段--该阶段主要处置测试效率成绩

我们树立了集成『自动化测试』、『功用测试』、『波动性测试』等各项工程才能的完备流水线作为准入系统。树立了完备的工程才能之后，我们还是遇到了这样的成绩：

自动化测试才能更多的是作为功用回归才能，如何可以快速掩盖新增功用，提升自主测试呢？

功用diff测试产出报告包括上百个目的项，如何剖析，如何判别是由于系统缘由惹起的波动，还是代码变更惹起的下跌，降低剖析成本呢？

包含如此多项才能的准入系统，如何可以更高效运转，提供应RD和QA丝滑般的流水线体验呢？

所以，在智能交付时期，基于前期树立的完备测试才能的基础上，以中台和数据支撑，策略算法赋能，为整个准入系统提质增效，并经过火析、定位、评价智能化，流程智能流转，释放投入人力。

大规模信息流引荐系统研发效能提升之优秀实际

△ 图表 6：智能化无人值守流水线表示图

2.2.1 测试输入：智能case生成 1. 背景

自动化测试才能更多的是做为功用回归才能，如何可以快速掩盖新增功用，将部分非自主测试项目功用高质高量掩盖，提升自主测试呢？

2. 完成

经过对增量代码的白盒剖析结果，结合业务策略，停止测试用例生成，以尽能够掩盖本次新增功用。

大规模信息流引荐系统研发效能提升之优秀实际

△ 图表 7：智能case生成方案

2.2.2测试执行：智能构建 1. 背景 (责任编辑：admin)

标签：12图资源库信息系统实践

从零末尾了解Docker

甲骨文谷歌版权之战，你最常用的软件或许被

微软发布 Visual Studio 开展路途图，少量

科技行业薪酬最高的15种职位看看你在哪一

StackOverflow 调查：富有国度盛行 Python

WebAssembly 再添一员猛将：将支持运用 Go

Java案虽已尘埃落定，但软件界的连锁反响才

倾听顺序员的心声真的很重要

Git 12岁了，为你送上12个Git 的运用技巧！

扎克伯格13年前写的Facebook网站代码，你见

GraphQL vs REST API 架构，谁更胜一筹？

12种从单体架构向微效劳转型的设计准绳与优

猜你也喜欢看这些 ······: [WEB开发] 大规模信息流引荐系统研发效能; [WEB开发] 理想中的运用顺序是如何丧失数据; [WEB开发] 一个前端妹子的阿里P7成长之路; [WEB开发] 2021年开发者报告出炉！TypeScri; [WEB开发] Kubernetes运用NVMe有哪些益处？; [WEB开发] 学习 CLR 源码：延续内存块数据; [WEB开发] 新TBI计算机模型能绘制出最高分; [WEB开发] 最近 GitHub 上很火的七个项目; [WEB开发] 权衡低代码开发平台好坏的11个关; [WEB开发] 一块自制自行车码表从B站火到Git; [WEB开发] 手把手带你彻底掌握，义务队列、; [WEB开发] Redis中一个String类型引发的惨

其他类型的网站教程 ······: [dede教程] LuManager效劳器管理软件安装DED; [dede教程] Linux+Apache+PHP+MySQL效劳器环; [FLASH教程] szybkie po&0;yczki; [网页设计] Имеется ли возмо; [discuz教程] Транспортная фа; [建站经验] Как поступить в; [网页设计] Общебытовые акс; [dede教程] Many Thanks Very; [HTML教程] Many Thanks Extremely; [JS教程] Thanks Very; [SEO教程] Many Thanks Really; [MYSQL教程] Thanks Really

关键词标签查找 ······: 站长之家网站优化网站源码网页特效下载矢量图片素材网站运营 dedecms 矢量素材字体全国地图热点地方门户网站地图生成器蚂蚁分类系统齐博3.5 红旗安乐业房产源码安卓网站源码齐博分类1.51 汽车源码栏目嵌套 128x128png图标顶部公告特效导航竖列菜单 dede插件