大数据
一、前言 在大数据时代,数据挖掘,人工智能,机器学习这一系列高大上的技术应运而生,针对这一系列高大上的系统,测试同学如何参与其中,做好质量把控呢?与我们熟悉的测试套路又有何不同呢?欲知详情,请听笔者细细道来。 二、背景知识介绍 模式识别:是目的,就是通过计算机用数学技术方法来研究模式的自动处理和判读


分布式文件系统用于解决海量数据存储的问题,腾讯大数据采用HDFS(Hadoop分布式文件系统)作为数据存储的基础设施,并在其上构建如Hive、HBase、Spark等计算服务。 HDFS块存储采用三副本策略来保证数据可靠性,随着数据量的不断增长,三副本策略为可靠性牺牲的存储空间也越来越大。如何在不降


最近KDnuggets上发的“20个问题来分辨真假数据科学家”这篇文章非常热门,获得了一月的阅读量排行首位。 但是这些问题并没有提供答案,所以KDnuggets的小编们聚在一起写出了这些问题的答案。我还加了一个特别提问——第21问,是20个问题里没有的。 下面是答案。 Q1.解释什么是正则化,以及它


本文作者:安全平台部 chloehua(华珊珊)2015年入职腾讯,从事互联网安全工作,投身挖掘互联网黑色产业,探寻网络安全世界的风云变幻。 今年9月1日即将踏入大学的18岁临沂罗庄女孩徐玉玉,19日接到了一通诈骗电话,结果被骗走了上大学的费用9900元。得知被骗后,徐玉玉伤心欲绝,郁结于心,最终导


**1.背景点击率预估(pCTR)**是广告投放过程中的一个重要环节,精准的点击率预估对于广告投放系统收益最大化具有重要意义。pCTR的优化主要有算法优化,系统改进,特征探索等几种途径。2015年下半年微信公众号位置,在引入了多种新特征,优化已有特征的准确度和覆盖率,并使用深度学习的算法框架后,效果


2007年入职腾讯安全平台部,专注于各类互联网黑产研究,目前主要关注金融、云产品黑产研究。 了解黑产,正视黑产,打击黑产。——题记 纳尼,打差评也能赚钱?揭秘“差评师”黑产 网络敲诈勒索,几乎从互联网诞生的第一天起就存在了。从现实延伸到虚拟世界,敲诈勒索利用互联网的隐蔽性和便利性愈演愈烈,并且根据各


序言 猴年春节长假刚刚落幕,年味的气氛犹在。作为中国最隆重的传统节日,团圆饭、放鞭炮、看春晚是春节一直以来不可或缺的元素,但互联网文化也逐渐渗透春节里,成为一种新的文化符号。 本次报告以春节出行、网购年货、春节主要活动节目等维度来盘点70、80、90后春节的生活状态。 超2/3的人春节期间有出行计划


本次报告主要从用户属性、留存数据以及移动设备三个方面进行解读。 文章来源于腾讯云开发者社区,点击查看原文


上周,腾讯云大数据联合团队以98.8秒的成绩完成100TB数据排序,摘得2016 Sort Benchmark全球排序竞赛冠军。在这次竞赛中,腾讯云数智分布式计算平台分别夺得Sort Benchmark大赛GraySort和Minutesort的冠军,创造了四项世界纪录。(了解详情请点击《腾讯打破2


腾讯QQ有着国内最大的关系链,而共同好友数,属于社交网络分析的基本指标之一,是其它复杂指标的基础。借助Spark GraphX,我们用寥寥100行核心代码,在高配置的TDW-Spark集群上,只花了2个半小时,便完成了原来需要2天的全量共同好友计算。这标志着QQ千亿级别的关系链计算进入了小时级别时代


今日起,2016年全国高考正式拉开大幕,4月~6月也被称为学子“备考季”,是中高考、期末大考的集中时段。一大波考卷迎面来袭,今年考生的鸭梨是什么?新生代又会以怎样的方式进行备考?你了解新生代考生的行为习惯吗?QQ空间、QQ社交指数、腾讯大数据将联合为您解密! 文章来源于腾讯云开发者社区,点击查看原文


作者介绍:augustzhang,安全平台部基础架构组员工,先后从事密保、验证码等后台研发工作,现在主要负责安全平台部大数据平台的研发工作,致力于研究每秒GB级的数据如何进行实时分析等问题。 背景 后台设计 经常会遇到空间上的问题,比如:网卡流量爆了,Cache又快满了,APP的手机流量过高等。通常


引言 从2016年第4季度腾讯大数据的报告中,我们已经看到了,作为活跃移动设备品牌TOP1的华为,其优秀的业绩表现。 尤其是,35岁以上年龄群用户对华为的偏好,让我们不禁想深入看看华为的独到魅力到底在哪里,请走入我们的华为Mate9分析。 回顾2016年度,缺乏新意的iPhone 7,因爆炸事件宣布


引言 2016年已离我们远去,在短短的一年时间中,移动市场发生了极大的变化。 在所谓“成熟”的移动市场上,品牌格局重新洗牌,昔日王者不再,黑马异军突起。 腾讯大数据在此发布2016年Q4移动行业数据报告,望诸君管中窥豹、见仁见义。 腾讯大数据2016年Q4季移动行业数据报告将分为以下3个章节:移动设


本月中旬,腾讯大数据在“腾讯大数据技术峰会暨KDD China技术峰会”上宣布推出面向机器学习的第三代高性能计算平台——Angel,并预计于2017年第一季度开放其源代码,鼓励业界工程师、学者和技术人员大规模学习使用,激发机器学习领域的更多创新应用与良好生态发展。 那么,Angel是如何“以己之

