多媒体技术是指通过计算机对文字、数据、图形、图像、动画、声音等多种媒体信息进行综合处理和管理,使用户可以通过多种感官与计算机进行实时信息交互的技术,又称为计算机多媒体技术。

加载中
置顶
发表了问答
01/15 11:19

FFmpeg 教程

教程作者写道: 本文介绍命令行音视频处理工具FFmpeg,以例为主。 读者除了知道如何打开命令行窗口外,不需要特别的知识。 地址:https://wklchris.github.io/blog/FFmpeg/index.html

收藏 1
置顶
运营/编辑
发表了博客
2023/11/16 08:00

FFmpeg 6.1 发布,7.0时代即将来临

11月10日,FFmpeg 6.1正式发布。 FFmpeg 发布版本的时候,按照惯例,会选择一些物理学家名字作为代号,这一新版本代号为“Heaviside”。主要为纪念伟大的英国数学家和物理学家奥利弗·黑维塞(Oliver Heaviside)。 奥利弗·黑维塞(Oliver Heaviside)自学成才,没有系统经历过高等教育,但在物理、数学、工程领域成果非凡,其名言一直为人所津津乐道。 “数学分2种,严格的和物理直观化的。前者的范围窄;后者粗犷而广泛。拘泥于... 展开更多

收藏 6
0
置顶
发表了博客
2023/11/13 17:59

正式开源!网易有道上线“易魔声”语音合成引擎

刚刚,我们上线了「易魔声」开源语音合成(TTS)引擎!🎉🎉🎉 「易魔声」,是一款有道自研TTS引擎,目前支持中英文双语,包含2000多种不同的音色,更有特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。 「易魔声」中文 网易有道 (我们用「易魔声」将以上这段话进行了技术合成,点击试听 ) 用户可免费在开源社区GitHub进行下载使用(地址:https://github.com/netease-youdao/EmotiVoice),通... 展开更多

收藏 13
0
置顶
运营/编辑
发表了博客
2023/11/02 08:20

FFmpeg直播能力更新计划与新版本发布

// 编者按:客户端作为直接面向用户大众的接口,随着技术的发展进化与时俱进,实现更好的服务是十分必要的。FFmpeg作为最受欢迎的视频和图像处理开源软件,被相关行业的大量用户青睐,而随着HEVC标准的发布到广泛使用,相信国内很多网络流媒体从业者都在长期关注FFmpeg FLV支持HEVC的官方更新。LiveVideoStackCon 2023 上海站邀请了来自快手的音视频首席架构师刘歧,为大家带来他关于FFmpeg 直播能力的更新计划。 文/刘歧 整理/... 展开更多

收藏 0
0
置顶
发表了博客
2023/05/09 10:05

QUIC在京东直播的应用与实践 | 京东云技术团队

作者:京东零售 周凯 一. 前言与背景 国内的互联网直播技术从2005年前后兴起,彼时最具代表性的直播产品是由PPLive创始人姚欣在华中科技大学就读期间发起的校园直播项目PPLive。当时的直播技术用的还是基于windows系统自带的mediaplayer内置的COM组件开发的播放器,采用的是RTSP协议。受当时的互联网传输带宽及成本限制,PPLive并没有采用现在比较流行的单播技术,而是采用P2P技术分发直播流。国内的直播技术也进入了一段以P2P... 展开更多

收藏 4
1
置顶
程序员
发表了博客
2022/12/22 16:24

惊!揭露视频网站节约 30% 成本的秘密

今年,爱奇艺宣布2022年第一季度首次实现季度盈利,这是爱奇艺在过去三个季度中,毛利率持续增长,且运营费用持续下降带来的结果。长视频行业发展十几年来,一直深陷亏损旋涡。爱奇艺的首次实现季度盈利,也意味着降本增效将成为视频平台的发展方向。 ## 视频平台的降本需求 对于视频网站、App 来说,运营的成本投入主要是由带宽成本、版权成本和推广成本这 3 部分组成,而带宽成本是当前视频网站相当重的一块投入。 据统计,近... 展开更多

收藏 2
0
置顶
发表了博客
2022/09/15 14:56

Shopee视频处理技术后台应用

`关注「Shopee技术团队」公众号,探索更多Shopee技术实践` ``` 目录 1. 背景 2. Shopee 视频技术落地产品 3. Shopee 视频相关后台服务 3.1 直播/点播转码 3.2 直播连麦 3.3 多人会议混流 3.4 视频后台编辑 4. 高清低码 4.1 视频处理的一般流程 4.2 Shopee 高清低码优化方案 5. 性能优化 5.1 编码器端上优化 5.2 一入多出编码 ``` > 东南亚各市场的网络环境复杂多变、差异极大,如何在有限网络条件下提供稳定、高清的视频体验是我... 展开更多

收藏 0
0
置顶
程序员
发表了问答
2022/09/14 14:40

我找第三方开发了一款 android 端导播软件,目前软件有概率闪退

闪退报错如下:

收藏 0
置顶
发表了问答
2022/09/13 18:06

高手问答第 292 期 —— 实时互动娱乐场景下如何提升RTC音频引擎音质

传统RTC(语音通信)场景,音频引擎的整个处理链路如3A算法、编解码、丢包补偿等技术仅针对语音做处理。而实时互动娱乐场景(如主播连麦、互动播客、游戏语音等)会涉及到音乐、音效等,以优化语音质量为目标的音频引擎在面对这类场景时,经过算法处理后的音质会大打折扣。例如语音场景双讲问题出现的频率较低,然而在音乐一直播放时,只要对端说话,就会形成双讲,如果回声消除处理不好,就会对语音或者音乐造成很大的损伤;又如降... 展开更多

收藏 7
置顶
发表了博客
2022/08/03 11:22

从技术全景到场景实战,透析「窄带高清」的演进突破

随着5G时代的到来,互联网短视频、电影电视剧、电商直播、游戏直播、视频会议等音视频业务呈井喷式发展。 作为通用云端转码平台,阿里云视频云的窄带高清需要处理海量、不同质量的视频。对于中高质量的视频,现有的窄带高清1.0就能提供满意的转码效果,并带来达30%的带宽成本降低;而对于有明显压缩失真和成像噪声的低质量视频,需要使用性能更好的窄带高清2.0进行去压缩失真、去噪和增强处理从而得到更好的观看体验。 在2022稀... 展开更多

收藏 2
0
置顶
运营/编辑
发表了博客
2022/07/24 17:02

从码农转型大音乐家,你只差这些音乐处理工具

喜欢唱跳 Rap 篮球,想变成知名歌手?你的机会来了!小编整理了包含音频录制、作曲、音频处理、音频合成、音频可视化等功能的一系列音乐处理工具,助力每位码农成为大音乐家!相信我,你也可以变成光。 MuseScore MuseScore 是非常老牌的开源编曲软件,适用于多种操作系统,如 Windows、macOS、各种Linux发行版,和一些BSD变种,且适配了包含中文在内的 69 种语言。 MuseScore 拥有非常专业的制谱编排功能,支持超 500 种乐器,... 展开更多

收藏 10
3
置顶
发表了博客
2022/07/06 11:01

视频化全链路智能上云?一文详解什么是阿里云视频云「智能媒体生产」

视频化链路在革新 人工向智能、小众向大众 标准向定制、慢钝向实时 视频创作与传播的全流程在革新。 对于视频的生产与消费,其全链路包含采集、制作、管理、分发、消费五个阶段,而云计算和网络的发展,为每个环节都带来巨大的势能变化。 例如: 采集阶段,以往需要使用专业的摄像设备进行拍摄,现在仅一台移动端设备即可完成高品质拍摄。 生产制作阶段,以往需要用专业的非线性编辑软件来制作,而现在以云剪辑服务工具即可实现... 展开更多

收藏 0
0
置顶
发表了博客
2022/05/31 16:53

视频直播技术干货:一文读懂主流视频直播系统的推拉流架构、传输协议等

本文由蘑菇街前端开发工程师“三体”分享,原题“蘑菇街云端直播探索——启航篇”,有修订。 1、引言 随着移动网络网速的提升与资费的降低,视频直播作为一个新的娱乐方式已经被越来越多的用户逐渐接受。特别是最近这几年,视频直播已经不仅仅被运用在传统的秀场、游戏类板块,更是作为电商的一种新模式得到迅速成长。 本文将通过介绍实时视频直播技术体系,包括常用的推拉流架构、传输协议等,让你对现今主流的视频直播技术有一... 展开更多

收藏 3
0
置顶
程序员
发表了博客
2022/04/14 20:54

如何基于 ZEGO SDK 实现 Android 变声/混响/立体声

## 1 前言 在直播、语聊房、K 歌房场景中,为增加趣味性和互动性,玩家可以通过变声来搞怪,通过混响烘托气氛,通过立体声使声音更具立体感。ZegoExpress SDK 提供了多种预设的变声、混响、混响回声、立体声效果,开发者可以灵活设置自己想要的声音,在通话或直播过程中动态调整变声、混响、混响回声、虚拟立体声,如果需要试听,可以启用耳返进行测试。 * 变声:通过改变用户的音调,使输出的声音在感官上与原始声音不同,实现... 展开更多

收藏 0
0
置顶
发表了博客
2022/04/13 11:18

直播技术干货分享:千万级直播系统后端架构设计的方方面面

本文由网易云信技术团队分享,原题“如何保障一场千万级大型直播?”,有修订和改动。 1、引言 本文以TFBOYS“日光旅行”七周年这场直播演唱会为案例,为你分享大型直播系统后端架构设计的方方面面,包括:基本架构、稳定性保障、安全性障、监控报警、应急预案等技术范畴。 案例中的这次演唱会采用了在线实时互动及演唱会现场的多场景导播切换,提供了主机位和三个艺人专属机位流,同时每个机位流实时转码四个清晰度档位,用户可... 展开更多

收藏 5
0
置顶
程序员
发表了博客
2022/04/02 22:31

如何基于 ZEGO SDK 实现 Flutter 一对一音视频聊天应用?

之前的文章发布了ZEGO SDK实现Android端音视频通话应用的开发教程,不少开发者反馈很实用,能不能也出一版Flutter的教程。 有求必应,这不小编来了~ 我们封装了ZEGO Flutter SDK,**本文将引导你如何使用ZEGO Flutter SDK 快速轻松的构建一个跨平台音视频聊天应用,减少开发成本。** #### 1 准备环境 在开始集成 ZEGO Express SDK 前,请确保开发环境满足以下要求: - Flutter 1.12 或以上版本。 - iOS 7.0 或以上版本,且支持音... 展开更多

收藏 1
0
置顶
发表了博客
2022/03/22 15:11

HMS Core音频编辑服务,实时分离人声、伴奏和乐器声

想获取一首歌的伴奏却找不到资源怎么办?没关系,我们可以自己解决。音频编辑服务提供音源分离的功能,帮助开发者在应用中构建人声与伴奏分离的功能。 目前,音源分离功能已经开放了人声与伴奏、乐器等多种分离的方式,可以实时解析并将乐器中的人声和各种乐器元素提取到独立的音轨上,满足创作者对伴奏制作、扒带、音乐创作等多种场景的应用需求。并且,无需专业的音频处理软件,只要集成华为音频编辑服务,就能在移动端轻松完... 展开更多

收藏 1
0
置顶
发表了博客
2022/02/10 20:07

声网AI降噪测评系统初探

![图片](https://img-blog.csdnimg.cn/img_convert/c85eb9746fc1c5f7f86d5bbe99c8a71d.gif) > **作者:孟赛斯** ## 前言 音频质量的优化是一个复杂的系统工程,而降噪是这个系统工程中的一个重要环节,传统的降噪技术经过几十年的发展已经陷入了瓶颈期,尤其是对非平稳噪声的抑制越来越不能满足新场景的需求。而近几年以机器学习/深度学习为代表的AI技术的崛起,为特殊场景下的音频降噪带来了新的解决方案。声网Agora 伴随着在线... 展开更多

收藏 0
0
置顶
发表了博客
2022/02/25 20:46

视频图像色彩增强的主要方法与落地实践

![图片](https://img-blog.csdnimg.cn/img_convert/211a1cb13d6e05dc496220bff277bf16.gif) ## 背景 色彩增强作为视频后处理中画质增强技术的一部分,指的是通过调整图片和视频画面的饱和度特性,使得画面色彩更加丰富和逼真,提升人的视觉主观感受。由于设备摄像头的多样性,部分摄像头在视频采集时存在饱和度不足,画面发灰,色彩寡淡等问题,这些情况在拍摄室外景物和颜色丰富的场景时尤其容易出现。这些问题可以通过算法的后... 展开更多

收藏 1
0
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
返回顶部
顶部