tag

机器学习

本文原作者:尹迪,经授权发布。 1 谱聚类算法的原理 在分析快速迭代聚类之前,我们先来了解一下谱聚类算法。谱聚类算法是建立在谱图理论的基础上的算法,与传统的聚类算法相比,它能在任意形状的样本空间上聚类且能够收敛到全局最优解。 谱聚类算法的主要思想是将聚类问题转换为无向图的划分问题。 首先,数据点被看

NeuralNLP是腾讯广告(Tencent Marketing Solution,TMS)(https://e.qq.com/)数据算法团队搭建的一个基于PyTorch的深度学习NLP公共实验平台,主要涵盖文本分类、序列标注、语义匹配、BERT微调和文本生成等,目前已经广泛应用于腾讯广告业务文本相

| 导语ACM SIGMOD/PODS 2019 数据管理国际会议于6月30日到7月5日在荷兰首都阿姆斯特丹召开。腾讯技术团队直击现场第一时间带回大会盛况。 SIGMOD第一天大会Keynote主题为“Responsible Data Science”;第二天的Keynote主题是区块链,更偏应用一

​ 导语:ABC时代(AI+BigData+Cloud),作为腾讯云大数据及人工智能产品中心的一员,也算是站在了toB+ABC的“腾讯风口“。分享一些在AI领域作为一名商业产品经理的心得,希望尽可能系统化。适合对AI感兴趣的人群,无需产品和算法/研发背景知识。 前言 明镜所以照形,古事所以知今。无论

本文原作者:梁源,经授权后发布。 ​ 机器阅读理解和问答是自然语言处理领域的一个火热主题。该任务旨在让机器像人类一样阅读理解。前面两篇文章对BERT的官方源码以及在序列标注上的应用进行了介绍,本篇文章将介绍如何利用BERT来解决阅读理解与问答问题。 1. 阅读理解与问答简介 机器阅读理解与问答主要涉

作者:孟辉(alexmeng) 1 概述 大家知道,序列标注、文本分类、句对关系判断和生成式任务并称自然语言处理四大基础技术支柱。序列标注作为最基础的语言计算任务已在命名实体识别、词性标注、分词以及属性抽取等场景中得到了广泛的应用。这里顺便提一下,我们在属性抽取方面沉淀了诸多宝贵的经验,限于文章篇幅

导语: 生成对抗网络(Generative Adversarial Network,简称GAN)是非监督式学习的一种方法,通过让两个神经网络相互博弈的方式进行学习。自2014年GAN网络提出以来,其在Computer Vision(计算机视觉)领域获得了广泛的关注,但GAN网络在其他领域的应用相对较

前言 明镜所以照形,古事所以知今。无论做哪个行业属于哪个领域,我们回顾历史,总是可以发现一些规律,一些似曾相识。回顾历史,我们可以总结历史经验、把握历史规律,增强开拓前进的勇气和力量。 ​ AI发展的三大浪潮 事物发展总是有周期的,大到一个国家/朝代的发展变更,小到一个月总有那么三十几天不想上班。A

本文原作者:于洋,经授权后发布。 1. 开篇 ​ 通常,我们在使用Tensorflow低级API编程时(非Eager模式), 一般有下面三个步骤: 使用tensorflow python侧的API构建图。图通常包括了两部分:正向计算图和反向计算图; 构建的关键字是:新建的 tf.Operation(

本文原作者:赖博先,经授权后发布。 导语:高中的时候,班主任让我们每学完一个章节,整理出这个章节的关键词和一份问题列表。现在回想起来,其实是很有用的,这让我们可以从另外一个视角来审视所学习的内容,而不是单纯的填鸭式的记忆;最近在复习机器学习相关内容,也从问题的视角来回顾机器学习知识体系,对于机器学习

「 42. 」 这是科幻小说《银河系漫游指南》中智能计算机「Deep Thought(深思)」经过750万年运算,找到的「关于生命,宇宙及一切问题的终极答案」。 为什么是42?「深思」把这个问题交给了一台更高智能的电脑——地球来回答,目前仍无解。 受这个终极答案的启发,我们提出了**「AI与机器人的

导语:预流失用户,即有流失倾向,但还没有开始真正流失的用户。相较于流失用户而言,预流失用户处于观望阶段,或许对现有产品有所顾虑,或许对于潜在的流向(竞品)有所顾虑,或许是在等待些什么;流失用户,即已经流失了的用户,或许是因为游戏弃坑,或许选择了其他产品,用户肯定还在玩些什么,只是不再来你这儿了。文章

本文原作者:赖博先,经授权后发布。 背景 随着我们底层特征库中特征数目的不断增长,如何组合特征,如何针对不同场景选择适合的特征,如何评估特征优劣?这些问题已经日益凸显,所以这次想梳理现有的特征工程方法,并将通用的模块抽象成工具,封装到神盾离线计算平台。 特征构造 对于一个推荐场景,特征构造主要是根据

本文原作者:赖博先,经授权后发布。 Youtube是全球最大的视频分享平台,用户量高达10亿+,每天上传的UGC和PGC都是百万级别。那么问题就来了,他们是如何让用户在这么多的视频中快速的发现自己感兴趣的内容呢?大家可能会想到搜索,确实搜索是一个必不可少的工具,但有一个前提条件是用户必须知道视频的关

| 导语ACM SIGMOD/PODS 2019 数据管理国际会议于6月30日到7月5日在荷兰首都阿姆斯特丹召开。腾讯技术团队直击现场第一时间带回大会盛况。 SIGMOD第一天大会Keynote主题为“Responsible Data Science”;第二天的Keynote主题是区块链,更偏应用一