强化学习
文章来源:机器之心。 让机器能根据文章的主题思想生成人类能够读懂的文本摘要是一个重要的 NLP 研究问题。腾讯知文团队、苏黎世联邦理工学院、哥伦比亚大学和腾讯 AI Lab 的研究者针对这一任务提出了一种引入主题模型和强化学习方法的卷积神经网络方法。该论文已被 IJCAI 2018 接收,机器之心在


背景:7月28日,腾讯云在北京举办云+社区沙龙,邀请来自腾讯与四川云检科技的五位AI技术专家,分享他们在专业领域的AI开发经验,帮助开发者在具体行业场景中实践AI技术。本文根据王亮在【7.28日腾讯云+社区技术沙龙-AI技术全面场景化落地实践】现场演讲内容整理而成。 讲师介绍 王亮,腾讯AI高级研究


在荷兰刚刚结束的 IEEE CIG 计算智能与游戏大会上,清华大学张钹院士领导的人工智能创新团队 TSAIL 在第一人称射击类游戏《毁灭战士》(Doom)AI竞赛 VizDoom(Visual Doom AI Competition) 上荣获竞赛 Track 1 的预赛和决赛冠军,及 Track 2


被誉为神经计算和机器学习领域两大顶级会议之一的NIPS于近日揭晓收录论文名单,此次为第32届会议,将于 12 月 3 日至 8 日在加拿大蒙特利尔举办。 腾讯AI Lab第三次参加NIPS,共有20篇论文入选,其中2篇被选为亮点论文(Spotlight),涵盖迁移学习、模仿学习、半监督学习等多个


今天要介绍的是一筐黄瓜。 这可不是一筐普通的黄瓜。它们是由腾讯人工智能实验室AI Lab团队的成员协同国内外农业专家和学生,使用人工智能AI在荷兰一间温室里种植出来的黄瓜。 它们和我们平常在菜市场买的黄瓜有什么区别呢? 放大了图片看看... ... 其实也没啥区别。依然是大家熟悉的黄瓜,可蒸煮,可煎


TStarBots是《星际争霸2》游戏AI的代码实现。TStarBots使用了深度强化学习、模块化AI和动作空间分解等算法,以及大规模分布式强化学习平台。详细技术描述请参考Tencent AI Lab发布的预印本[1]. 我们期望其他研究人员或开发者能够在TStarBots的基础上继续研究或二次开发


作者:Morvanzhou 周沫凡 为什么做这个实践 做这个实践的主要目的就是让我们活学活用, 从0开始搭建一个强化学习框架。之前我们在强化学习系列教程中学习到了很多强化学习的知识, 了解了各种算法应该怎样运用, 从最简单的 Q-Learning到结合神经网络的 DQN, 再到做连续动作的 DDPG


Morvan周沫凡 学习资料: 强化学习系列教程 本节学习代码 上次我们已经搭建好了三个主要部分, 包括 main.py, rl.py, env.py. 强化学习最重要的部分之一就是怎样定义你的环境. 做出来一个可视化的模拟环境能大大减轻不可见的负担. 有一个机器人在你屏幕上跑来跑去, 你能看见它,


— 腾讯数据库与华中科技大学合作发布了最新研究论文 《An End-to-End Automatic Cloud Database Tuning System Using Deep Reinforcement Learning》,该论文首次提出了云数据库自动性能优化系统 CDBTune,该系统可


导语:腾讯围棋AI「绝艺」世界大赛再夺金,三年四冠,砥砺前行! 中国围棋协会主办的2019「中信建投证券杯」世界智能围棋公开赛今天在山东日照落幕。由腾讯 AI Lab 研发、担任中国国家围棋队的训练专用围棋 AI「绝艺」夺得冠军。中国星阵、韩国韩豆(Handol)和比利时里拉零( Leela Zer


| 导语 大规模的强化学习需要海量的异构计算资源,批量快速启停训练任务,高频更新模型参数,跨机跨进程共享模型数据等。传统的手工管理模式操作繁琐,面临诸多不确定性,带来的各种挑战无法支撑大规模强化学习的场景。本文介绍了腾讯内部某业务基于 TKE 构建大规模强化学习解决方案,以及与传统手工模式对比该方案


作者:qizailiu,腾讯 IEG 应用研究员 导读 OpenAI 近期发布聊天机器人模型 ChatGPT,迅速出圈全网。它以对话方式进行交互。以更贴近人的对话方式与使用者互动,可以回答问题、承认错误、挑战不正确的前提、拒绝不适当的请求。高质量的回答、上瘾式的交互体验,圈内外都纷纷惊呼。 为什么有


作者:monychen,腾讯 IEG 应用研究员 简单来说,ChatGPT 是自然语言处理(NLP)和强化学习(RL)的一次成功结合,考虑到读者可能只熟悉其中一个方向或者两个方向都不太熟悉,本文会将 ChatGPT 涉及到的所有知识点尽可能通俗易懂的方式展现出来,有基础的同学可以选择性跳过一些内容。


作者:fairyang,腾讯 PCG 应用研究员 序言 自 11 月 30 日 ChatGPT 发布,其令人惊艳的对话能力,在业界引发了对通用人工智能的热潮。截止发文,OpenAI 一直保持遥遥领先,且并未透露更多的技术细节。然近日,一款新的 AI 助手 Claude 发布,ChatGPT 终于迎来


作者:bear 该篇文章是我学习过程的一些归纳总结,希望对大家有所帮助。 最近因为 AI 大火,搞的我也对 AI 突然也很感兴趣,于是开启了 AI 的学习之旅。其实我也没学过机器学习,对 AI 基本上一窍不通,但是好在身处在这个信息爆炸的时代,去网上随便一搜发现大把的学习资料。 像这个链接里面:ht

