轻量级神经网络降噪方法,解析 ZegoAIDenoise 的算法实现!

语音社交再次爆火,在国内众多团队“紧急出击”的背景下,即构深度研究了最近爆火产品的业务逻辑之后,基于已经成熟的音视频互动技术,推出全新「语音聊天室方案」——4步快速搭建一个类似的语音聊天室。

影响线上狼人杀体验互动体验的因素很多,比如杂音、回声、噪声等音质问题;网络不稳定;高并发;硬件不兼容等等。而为了尽可能的还原线下游戏场景,在解决了上述痛点外,平台还需参考线下场景进行业务形态设计。

本篇文章我们重点讲述图像与色彩基础知识的第一部分,在今天的学习过程中,大家可以了解到视频、图像、像素和色彩之间的关系,也初步认识了两种重要的色彩空间:RGB 和 YUV,以及它们的基本原理、差异和联系。

上次我们讲述了关于 ZegoAvatar 的面部表情随动技术解析,今天我们将和大家一起再探讨下关于 ZegoAvatar 中的 AI 捏脸部分!

在上一篇文章中,我们完成了对音频前处理三剑客的学习。声音信号经过音频前处理模块,已经“洗尽铅华、去除杂质”,现在,你是否已迫不及待想要将它们分享到世界各地了呢?

已入驻品牌

影响音视频延迟的种因素有很多,此前我们已分享了不同流媒体系统对时延影响,数据流动过程中采集、前处理、编解码三个环节是怎样引入时延的,今天我们将分享在流媒体数据传输、渲染环节,有哪些因素会导致时延。

在之前的文章中,我们已经接触了两个重要的音频前处理模块 – 回声消除 AEC 和噪声抑制 ANS,它们分别解决了 RTC 场景下的回声、噪声问题,极大提升了用户的体验。至此,音频前处理三剑客中,就只剩下一位 – 音频自动增益控制 AGC(A...

自2020年来,虽然健身房的防疫限制逐渐放松,仍有越来越多的人选择在家中健身。根据移动营销数据分析平台Adjust 的应用数据显示,健康和健身类应用持续增长。2021 年上半年会话同比增长 31%这一现象说明许多人开启了移动端健身的旅程,也...

在全球“宅经济”的影响下,社交派对类游戏意外的迎来了爆发。

本文介绍了视频视频花屏/绿屏问题的常见原因,如丢失关键帧、metadata的变化、硬件编解码的兼容性问题和颜色格式不一致问题。以及排查方法和解决策略,包括检查视频数据格式、排查自采集/自渲染模块问题、联系第三方音视频SDK技术支持等。

在上一篇文章中,我们带大家了解了视频、图像、像素和色彩之间的关系,还初步认识了两种常用的色彩空间,分别是大家比较熟悉的 RGB,以及更受视频领域青睐的 YUV。今天,我们将继续深入学习 RGB、YUV 的相关内容,进一步了解它们的常见采样格...

即构和上海GDG技术社区联合举办了实时音视频技术云上技术分享专场,来自即构科技和Bilibili的资深技术专家进行了深度分享。大会吸引了500+开发人员交流、观看,并在活动过程中与分享嘉宾进行了热烈互动,下面我们将整理嘉宾们分享的核心内容,...

即构针对两大行业痛点进行了解决:一是首帧卡顿带来的用户体验差问题;二是多个视频同时推流造成的服务器压力大问题。

这次的低延迟直播产品L3,也是ZEGO即构在深刻洞察客户需求的基础之上、为了针对性解决传统CDN的直播痛点而推出的。

实时音视频通话涉及到的技术栈、人力成本、硬件成本非常大,一般个人开发者基本无法独立完成一个功能健全并且稳定的实时音视频应用。

随着实时音视频应用技术的发展,我们已经看到了各种画质增强的视频增强技术,那么是否存在一种技术,可以使视频在低光照条件下看起来比实际情况更清晰或接近实际情况呢?

在直播、在线教育、线上会议等音视频应用场景中,网络质量的好坏会直接影响用户体验。从主播端推流到观看端拉流,涉及多地多端的网络,一旦出现网络连通性问题,往往难以快速清晰判定问题发生的阶段、原因,不利于及时排查故障和后续运营优化。

随着近年来深度学习技术取得的巨大发展,其强大的高级特征提取能力恰好解决了传统技术的弊端。ZEGO 即构科技使用深度学习技术解决图像、视频等抠图任务并在多个业务场景中进行了广泛的应用。

本文将介绍如何使用微信小程序原生推拉流组件 进行推拉流,快速实现一个简单的实时音视频通话。

远程“视频面试”的核心就是面试及候选人双方,进行一对一或多对一的音视频通话,对客户来说,安全性、稳定性、流畅性是极其重要的,无论在任何网络环境下,实时音视频体验效果必须达到最好。