多媒体技术是指通过计算机对文字、数据、图形、图像、动画、声音等多种媒体信息进行综合处理和管理,使用户可以通过多种感官与计算机进行实时信息交互的技术,又称为计算机多媒体技术。

加载中
置顶
程序员
发表了博客
04/14 20:54

如何基于 ZEGO SDK 实现 Android 变声/混响/立体声

## 1 前言 在直播、语聊房、K 歌房场景中,为增加趣味性和互动性,玩家可以通过变声来搞怪,通过混响烘托气氛,通过立体声使声音更具立体感。ZegoExpress SDK 提供了多种预设的变声、混响、混响回声、立体声效果,开发者可以灵活设置自己想要的声音,在通话或直播过程中动态调整变声、混响、混响回声、虚拟立体声,如果需要试听,可以启用耳返进行测试。 * 变声:通过改变用户的音调,使输出的声音在感官上与原始声音不同,实现... 展开更多

收藏 0
0
置顶
发表了博客
04/13 11:18

直播技术干货分享:千万级直播系统后端架构设计的方方面面

本文由网易云信技术团队分享,原题“如何保障一场千万级大型直播?”,有修订和改动。 1、引言 本文以TFBOYS“日光旅行”七周年这场直播演唱会为案例,为你分享大型直播系统后端架构设计的方方面面,包括:基本架构、稳定性保障、安全性障、监控报警、应急预案等技术范畴。 案例中的这次演唱会采用了在线实时互动及演唱会现场的多场景导播切换,提供了主机位和三个艺人专属机位流,同时每个机位流实时转码四个清晰度档位,用户可... 展开更多

收藏 5
0
置顶
程序员
发表了博客
04/02 22:31

如何基于 ZEGO SDK 实现 Flutter 一对一音视频聊天应用?

之前的文章发布了ZEGO SDK实现Android端音视频通话应用的开发教程,不少开发者反馈很实用,能不能也出一版Flutter的教程。 有求必应,这不小编来了~ 我们封装了ZEGO Flutter SDK,**本文将引导你如何使用ZEGO Flutter SDK 快速轻松的构建一个跨平台音视频聊天应用,减少开发成本。** #### 1 准备环境 在开始集成 ZEGO Express SDK 前,请确保开发环境满足以下要求: - Flutter 1.12 或以上版本。 - iOS 7.0 或以上版本,且支持音... 展开更多

收藏 1
0
置顶
程序员
发表了博客
04/01 23:29

如何基于 ZEGO SDK 实现 Android 一对一音视频聊天应用

疫情期间,很多线下活动转为线上举行,实时音视频的需求剧增,在视频会议,在线教育,电商购物等众多场景成了“生活新常态”。 本文将教你如何通过即构ZEGO sdk在Android端搭建视频通话能力。即构SDK提供100+种行业解决方案,每月赠送10000分钟免费时长,提供免费接入体验。 接下来我们看看完整的实现流程。 1 准备环境 在开始集成 ZEGO Express SDK 前,请确保开发环境满足以下要求: Android Studio 2020.3.1 或以上版本。 An... 展开更多

收藏 0
0
置顶
发表了博客
03/22 15:11

HMS Core音频编辑服务,实时分离人声、伴奏和乐器声

想获取一首歌的伴奏却找不到资源怎么办?没关系,我们可以自己解决。音频编辑服务提供音源分离的功能,帮助开发者在应用中构建人声与伴奏分离的功能。 目前,音源分离功能已经开放了人声与伴奏、乐器等多种分离的方式,可以实时解析并将乐器中的人声和各种乐器元素提取到独立的音轨上,满足创作者对伴奏制作、扒带、音乐创作等多种场景的应用需求。并且,无需专业的音频处理软件,只要集成华为音频编辑服务,就能在移动端轻松完... 展开更多

收藏 1
0
置顶
发表了博客
02/10 20:07

声网AI降噪测评系统初探

![图片](https://img-blog.csdnimg.cn/img_convert/c85eb9746fc1c5f7f86d5bbe99c8a71d.gif) > **作者:孟赛斯** ## 前言 音频质量的优化是一个复杂的系统工程,而降噪是这个系统工程中的一个重要环节,传统的降噪技术经过几十年的发展已经陷入了瓶颈期,尤其是对非平稳噪声的抑制越来越不能满足新场景的需求。而近几年以机器学习/深度学习为代表的AI技术的崛起,为特殊场景下的音频降噪带来了新的解决方案。声网Agora 伴随着在线... 展开更多

收藏 0
0
置顶
发表了博客
02/25 20:46

视频图像色彩增强的主要方法与落地实践

![图片](https://img-blog.csdnimg.cn/img_convert/211a1cb13d6e05dc496220bff277bf16.gif) ## 背景 色彩增强作为视频后处理中画质增强技术的一部分,指的是通过调整图片和视频画面的饱和度特性,使得画面色彩更加丰富和逼真,提升人的视觉主观感受。由于设备摄像头的多样性,部分摄像头在视频采集时存在饱和度不足,画面发灰,色彩寡淡等问题,这些情况在拍摄室外景物和颜色丰富的场景时尤其容易出现。这些问题可以通过算法的后... 展开更多

收藏 1
0
置顶
发表了博客
03/02 14:54

静默活体检测能力,有效规避用户实名认证环节风险

静默式活体检测,是华为HMS Core机器学习服务所属的人脸活体检测能力,即无需用户配合做出张嘴、扭头、眨眼等动作,便可实时捕捉人脸,快速判断是否为活体,用户使用过程便捷,综合体验感较佳。 ## 技术原理 静默活体检测能力使用RGB摄像头,通过屏幕拍摄出现的摩尔纹、纸质照片反光等一些细节信息进行甄别摄像头前的检测物是真实人脸,还是人脸翻拍图片、人脸翻拍屏幕、人脸面具等假脸攻击。同时,静默活体检测能力的活体数据覆... 展开更多

收藏 0
0
置顶
发表了博客
01/11 08:43

3分钟了解如何跨应用、跨形态无缝登录

![](https://oscimg.oschina.net/oscnet/up-e5574c9f2a3b5e47bc0d742b2490a7f8b35.jpg) ## 一、 功能盘点 Q1:什么是[钥匙环服务](https://developer.huawei.com/consumer/cn/hms/huawei-keyring/?ha_source=hms1)? A:[钥匙环服务](https://developer.huawei.com/consumer/cn/hms/huawei-keyring/?ha_source=hms1)是HMS Core对国内外开发者开放的技术服务,[提供用户认证凭据本地存储,和跨应用、跨形态共享能力,帮助用户在安... 展开更多

收藏 0
0
置顶
发表了博客
01/11 15:34

实时音视频入门学习:开源工程WebRTC的技术原理和使用浅析

本文由ELab技术团队分享,原题“浅谈WebRTC技术原理与应用”,有修订和改动。 1、基本介绍 WebRTC(全称 Web Real-Time Communication),即网页即时通信。 是一个支持网页浏览器进行实时语音对话或视频对话的技术方案。从前端技术开发的视角来看,是一组可调用的API标准。 在WebRTC发布之前,开发实时音视频交互应用的成本是非常昂贵,需要考虑的技术问题很多,如音视频的编解码问题,数据传输问题,延时、丢包、抖动、回音的处... 展开更多

收藏 50
4
置顶
发表了博客
01/11 14:47

轻松集成一键染发能力,多变发色随心换

在制作短视频时,用户会有各种各样的美化需求,比如想给视频人物更换头发颜色,怎样轻松实现呢?[华为视频编辑服务](https://developer.huawei.com/consumer/cn/hms/huawei-video-editor?ha_source=hms1)(Video Editor Kit)一键染发功能,集成就可让应用拥有头发换色能力。用户利用预置的多种发色样式,点击即可拥有多变新发色,体验超自然发色效果,满足用户个性化美化需求,让视频变得更多彩、有趣。 ![](https://oscimg.o... 展开更多

收藏 0
0
置顶
发表了博客
01/10 16:50

实时音视频入门学习:开源工程WebRTC的技术原理和使用浅析

本文由ELab技术团队分享,原题“浅谈WebRTC技术原理与应用”,有修订和改动。 1、基本介绍 WebRTC(全称 Web Real-Time Communication),即网页即时通信。 是一个支持网页浏览器进行实时语音对话或视频对话的技术方案。从前端技术开发的视角来看,是一组可调用的API标准。 在WebRTC发布之前,开发实时音视频交互应用的成本是非常昂贵,需要考虑的技术问题很多,如音视频的编解码问题,数据传输问题,延时、丢包、抖动、回音的处... 展开更多

收藏 2
0
置顶
发表了资讯
2021/12/30 07:22

Avidemux 2.8 发布,最高可处理 1000 帧视频

Avidemux 是一个免费开源的视频编辑器,可以进行剪切、过滤和编码等任务。它支持广泛的文件格式,包括 AVI 文件的编辑,DVD 的 MPEG 文件、MP4 和 ASF,并能将声音从文件中分解出来,支持强大的队列任务处理和脚本功能。 Avidemux 2.8 已经正式推出,更新内容如下: 捆绑的 FFmpeg 库已更新至 4.4.1 版本 “重新采样 FPS” 和 “更改 FPS” 过滤器可以处理最高 1000 帧 支持将 HDR 视频转换为带有色彩映射的 SDR 支持对 TrueHD... 展开更多

收藏 4
置顶
发表了博客
2021/12/28 15:52

百度APP视频播放中的解码优化

背景 在全民视频的时代,百度APP中视频播放是十分重要的业务。随着 5G 的到来,视频播放已经不满足以前的标清/高清,超清乃至于 4K 已经是旧时王谢堂前燕飞入寻常百姓家。越来越清晰的视频源,越来越复杂的视频编码,对 APP 的视频解码能力也有越来越高的要求。 与此同时,大家的手机性能越来越好,很多手机都逐步提供了强悍的硬件解码能力;而软件解码发展多年,也有其不可替代的优势。所以,如何合理利用手机的软/硬件解码能力... 展开更多

收藏 0
0
置顶
发表了问答
2021/12/21 11:58

ffmpeg 视频倍速播放问题

关于ffmpeg 视频倍速播放的问题 我先想实现5倍快速播放,怎么处理 ffmpeg -i input.mkv -filter:v "setpts=0.5*PTS" output.mkv ffmpeg -i input.mkv -filter:v "setpts=0.25*PTS" output.mkv ffmpeg -i input.mkv -filter:v "setpts=0.1*PTS" output.mkv 感觉视频的快速播放和这个PTS没有关系呢。。。 如果我要实现快速播放,如何处理呢?......

收藏 0
置顶
发表了博客
2021/12/20 11:28

COG云原生优化遥感影像,瓦片切分的最佳实践

摘要:云上遥感影像文件Cloud optimized GeoTIFF(COG)格式的详细介绍,大量数据上云面临的挑战,并分享了获得云原生影像最佳性能的实践经验。 本文分享自华为云社区《COG云原生优化遥感影像,瓦片切分的最佳实践》,作者: tsjsdbd 。 1 遥感影像文件格式 遥感影像就是地球自拍照,一般文件很大,一张文件5GB左右。 这些影像文件大多数都保存为 TIFF 格式(而不是JPEG),因为TIFF格式记录的内容是比较原始的多个波段的信息,... 展开更多

收藏 0
0
置顶
发表了博客
2021/12/14 16:23

声临其境,轻松几步教你把音频变成3D环绕音

在音乐创作、音视频剪辑和游戏等领域中,给用户带来沉浸式音频体验越来越重要。开发者如何在应用内打造3D环绕声效?[华为音频编辑服务](https://developer.huawei.com/consumer/cn/hms/huawei-audio-editor/?ha_source=hms1 "华为音频编辑服务")6.2.0版本此次带来了空间动态渲染功能,可以将人声、乐器等音频元素渲染到指定的三维空间方位,支持静态和动态渲染两种模式,进一步提升应用中的音效体验。开发者可以点击查看以下Dem... 展开更多

收藏 0
0
置顶
发表了博客
2021/12/14 10:23

使用 scipy.fft 进行Fourier Transform:Python 信号处理

摘要:Fourier transform 是一个强大的概念,用于各种领域,从纯数学到音频工程甚至金融。 本文分享自华为云社区《使用 scipy.fft 进行Fourier Transform:Python 信号处理》,作者: Yuchuan。 scipy.fft模块 傅立叶变换是许多应用中的重要工具,尤其是在科学计算和数据科学中。因此,SciPy 长期以来一直提供它的实现及其相关转换。最初,SciPy 提供了该scipy.fftpack模块,但后来他们更新了他们的实现并将其移到了scipy.fft模... 展开更多

收藏 1
0
置顶
程序员
发表了资讯
2021/12/13 08:30

英特尔为 FFmpeg 提供了大量 Vulkan 改进功能

除了实验性的 Vulkan 视频解码支持外,英特尔最近为 FFmpeg 提供了许多新的 Vulkan 改进。 去年,FFmpeg 开始初步支持 Vulkan,并一直持续到现在。而英特尔的工程师最近在 FFmpeg Git 中增加了一些 Vulkan 功能。这些新增功能包括一个基于 Vulkan 的水平翻转过滤器(hflip_vulkan),一个垂直翻转过滤器(vflip_vulkan),一个水平和翻转过滤器(flip_vulkan),一个转置过滤器(transpose_vulkan),以及一些基础设施优化。 此... 展开更多

收藏 3
置顶
发表了资讯
2021/12/13 07:08

digiKam 7.4.0 发布,KDE 数字相片管理工具

digiKam 是 KDE 桌面环境的影像管理和编辑程序,支持所有主要图像格式,并可以组织目录为基础的照片收藏,或按日期、时间、或标签的动态相册。用户还可以对图像添加标题和注释,搜索他们和透过智能文件夹保存搜索。添加插件还可以输出到 Flickr 的相册、Gallery2、谷歌地球的 KML 文件、Simpleviewer、刻录成光盘或创建 Web 画廊。 近日,digiKam 7.4.0 正式发布,本次更新的部分内容如下: 在 bugzilla 上关闭了 1300 多个用户... 展开更多

收藏 1
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
返回顶部
顶部
返回顶部
顶部