机器学习平台TI

【技术分享】七：搜索排序—排序模型

本文原作者：彭江军，经授权后发布。导语: 模型是机器学习三问里面的怎么去学的环节。是确定特征与因变量之间关系最为核心的步骤。这部分涉及到模型的选择，和优化目标以及损失函数的选取。排序由第一节讲到，LTR有三个模式，分别是pointwise, pairwise,listwise。在这里主要描述一下采

腾讯云TI平台

2019-11-06

0

35

【技术分析】六：搜索排序—指标介绍与选择

本文原作者：彭江军，经授权后发布。导语: 这一节将着重说明，怎样定位线上和线下指标之间的差异，对齐线下和线上指标，得到一个大致的关系。优化线下什么指标，对应的能带来线上什么指标的提升。这样可以避免模型上线的风险。因此也是指标的分析也是十分重要的一个问题。 1：指标介绍在该系列文章1中列举了几种常

腾讯云TI平台

2019-11-04

0

108

【技术分享】五：搜索排序-特征分析

本文原作者：彭江军，经授权后发布。导语：数据决定了任务的上限，模型方法决定达到上限的能力。在这里想借助信息熵的一些概念来对数据的重要性做一些分析，将数据的分布差异度量出来，并据此得到特征对于分类的重要性度量。对于特征的重要性的分析不适合放到特征特别多的情况下，因为往往特征之间是不独立的，所以去

腾讯云TI平台

2019-11-01

0

18

【技术分享】机器学习之决策树与随机森林模型

本文原作者：汪毅雄，经授权后发布。导语：本文用容易理解的语言和例子来解释了决策树三种常见的算法及其优劣、随机森林的含义，相信能帮助初学者真正地理解相关知识。决策树引言决策树，是机器学习中一种非常常见的分类方法，也可以说是所有算法中最直观也最好理解的算法。先举个最简单的例子： A：你去不去吃饭

腾讯云TI平台

2019-10-30

0

44

【技术分享】四：搜索排序—数据的采集与构造

本文原作者：彭江军，经授权后发布。导语：数据决定了任务的上限，模型方法决定达到上限的能力。在机器学习三要素里面，经验数据是极其重要的一环，直接决定了该机器学习任务的最终能达到的效果。尤其是在进入大数据时代，数据获取上面会比以往容易许多，选取数据集有时候带来的提升比更改模型带来的要快速的多。 1：数

腾讯云TI平台

2019-10-28

0

9

【技术分享】三：搜索排序—机器学习化建模

本文原作者：彭江军，经授权后发布。导语在搜索排序概述里面说到搜索排序算法的发展的第二个阶段Learning to rank (LTR) 的时候就已经提到了机器学习，还整出了哲学词：审时度势。在这里接着对机器学习的概念以及一般化的结构做一个系统的简略的描述，并看看机器学习的结构是如何适配搜索排序

腾讯云TI平台

2019-10-25

0

15

【技术分享】二：搜索排序—工业流程

本文原作者：彭江军，经授权后发布。导语：对于做算法的而言，了解一下整个流程是必要的。一来加深对整个环节的理解，二来：方便在定位badcase的知道可能是那块的问题所在。 1：写在前头，不专业的地方求轻喷这部分做的时间比较短，大概半年的ES引擎维护工作，负责了两个小频道的召回服务（具体那两个不能说

腾讯云TI平台

2019-10-23

0

16

【技术分享】一：搜索排序—概述

本文原作者：彭江军，经授权后发布。 1: 搜索排序的概念搜索排序：在一次会话中，用户在交互界面输入需要查询的query，系统给返回其排好序的doc例表的过程。 2：搜索排序和推荐排序的区别推荐：基于用户的行为挖掘出用户的兴趣，为其推荐对应的视频，doc等。 2.1从展示形式来讲：搜索排序每次展

腾讯云TI平台

2019-10-21

0

29

【技术分享】机器学习模型可解释性

本文原作者：陈亮，经授权后发布。导语模型可解释性方面的研究，在近两年的科研会议上成为关注热点，因为大家不仅仅满足于模型的效果，更对模型效果的原因产生更多的思考，这样的思考有助于模型和特征的优化，更能够帮助更好的理解模型本身和提升模型服务质量。本文对机器学习模型可解释性相关资料汇总survey。

腾讯云TI平台

2019-10-18

0

93

【技术分享】机器学习模型评估之通俗理解AUC

本文原作者：陈亮，经授权后发布。导语机器学习模型的评估指标很多，对于分类问题常会看到AUC作为性能衡量指标，大家往往对AUC值本身感兴趣，如其具体值的物理含义等。本文希望不引入太多公式，简单讨论下AUC指标。通俗理解AUC指标 AUC是二分类模型的评价指标。 AUC的通俗解释是：随机给定一个正

腾讯云TI平台

2019-10-16

0

77

【技术分享】机器学习优化算法—梯度下降(Gradient Descent)

本文原作者：游遵文，经授权后发布。参考文献 [1] 李航，统计学习方法 [2] An overview of gradient descent optimization algorithms [3] Optimization Methods for Large-Scale Machine Lear

腾讯云TI平台

2019-10-14

0

22

【技术分享】Spark机器学习的加速器：Spark on Angel

本文原作者：游遵文，经授权后发布。 Spark的核心概念是RDD，而RDD的关键特性之一是其不可变性，来规避分布式环境下复杂的各种并行问题。这个抽象，在数据分析的领域是没有问题的，它能最大化的解决分布式问题，简化各种算子的复杂度，并提供高性能的分布式数据处理运算能力。然而在机器学习领域，RDD的弱

腾讯云TI平台

2019-09-26

0

23

【技术分享】GBDT算法-原理篇

本文原作者：蒋凯，经授权后发布。导语：工业界机器学习大杀器解读。 GBDT是常用的机器学习算法之一，因其出色的特征自动组合能力和高效的运算大受欢迎。这里简单介绍一下GBDT算法的原理，后续再写一个实战篇。 1、决策树的分类决策树分为两大类，分类树和回归树。分类树用于分类标签值，如晴天/阴天

腾讯云TI平台

2019-09-18

0

26

【技术分享】怎么理解凸优化及其在SVM中的应用

本文原作者：汪毅雄，经授权后发布。导语：本文先介绍了凸优化的满足条件，然后用一个通用模型详细地推导出原始问题，再解释了为什么要引入对偶问题，以及原始问题和对偶问题的关系，之后推导了两者等价的条件，最后以SVM最大间隔问题的求解来说明其可行性。凸优化理论广泛用于机器学习中，也是数学规划领域很重要的

腾讯云TI平台

2019-09-11

0

64

【技术分享】机器学习之SVM - 理论知识

本文原作者：汪毅雄，经授权后发布。导语：本文用一些简单的例子来解释了SVM是什么，然后通过SVM中最大间隔、核函数、软间隔、SMO四个关键部分，依次进行数学推导和解释。相信了解机器学习的同学都知道，SVM的“完美强迫症”使得其在各大模型中，几乎是一个“统治性”的地位。但是也不是那么绝对啦，SVM

腾讯云TI平台

2019-09-11

0

51

腾讯云开发者社区

【技术分享】七：搜索排序—排序模型

【技术分析】六：搜索排序—指标介绍与选择

【技术分享】五：搜索排序-特征分析

【技术分享】机器学习之决策树与随机森林模型

【技术分享】四：搜索排序—数据的采集与构造

【技术分享】三：搜索排序—机器学习化建模

【技术分享】二：搜索排序—工业流程

【技术分享】一：搜索排序—概述

【技术分享】机器学习模型可解释性

【技术分享】机器学习模型评估之通俗理解AUC

【技术分享】机器学习优化算法—梯度下降(Gradient Descent)

【技术分享】Spark机器学习的加速器：Spark on Angel

【技术分享】GBDT算法-原理篇

【技术分享】怎么理解凸优化及其在SVM中的应用

【技术分享】机器学习之SVM - 理论知识

免费产品

推荐排行

官方网站

热门标签