关于我们

实时音视频是什么? 有哪些新玩法 ?

2021-05-12 浏览:2450

如何理解实时音视频这个概念?

以直播场景来举例,例如主播1往视频云上推流,观众拉流观看,即形成了单向直播的场景。观众能够看到主播,但是主播看不到观众。另外一种像刚才一样,主播1推流出去,观众拉流观看,其中观众1希望能和主播1视频连麦互动,这时观众1也会推一路流出去,主播将观众1的音视频流拉下来观看,这样他们之间就构成了一个相互拉流观看的场景,相互都能看见对方。同时他们两个的音视频流会被实时的内容分发网络分发给观众来观看。什么是实时音视频,就是说实时马上能看到。

实时音视频怎么玩?

视频直播或者在线教育已经处于一个比较成熟发展的阶段,最近这半年在线教育出现了一些新的玩法,例如在线的钢琴陪练。老师通过ipad给小朋友上课。老师会仔细听小朋友的钢琴演奏的效果,给他提建议,同时老师也可以演奏钢琴,给小朋友示范练习,整个过程是一个云视频沟通的场景。老师跟学生分别把他们的音视频流推到实时传输网络,然后相互都把对方的音视频流拉到ipad上观看,这样就构成了视频通话的场景。小朋友的父母亲可以从CDN侧拉流观看老师和小朋友上课的情形,这就是在线钢琴一对一陪练的场景。

技术上能满足什么要求呢?

首先延迟要比较低,其次是要流畅没有卡顿的感觉,不能影响整个的体验。如刚才提到的钢琴陪练视频,清晰度要达到720P,针对音乐声音,采样率要达到48kHz,也即是全带语音,才能够比较完好地还原音乐效果,音频的码率要超过100kbps。最后两个关键技术就是噪音抑制和回声消除。噪音抑制是把背景的噪音去除掉,但不是去除掉所有的噪音,要针对心理学模型保留适当的舒适噪音。回声消除,就是把老师跟小朋友之间的通话回路的回声消除掉,我们期望麦克风是全向性的,如果是定向性的,需要把硬件的回声消除功能关掉,使用软件的回声消除模块来消除回声。

下一个场景是线上的KTV房,这是即构科技的客户酷狗直播的一个应用场景。有N个用户等着排队唱歌,跟线下的K歌房一样,围观的用户都能够听到我K歌的声音并看到字幕。这里涉及的技术就是要把歌者的声音还有伴奏的声音歌词全部混在一起,再通过音视频的通道、实时传输网络实时传输出去。观众在听我唱歌的时候,能够听到我有没有跑调、背景音乐是否协调,如果不协调,体验感会很差。

另一个场景合唱直播,这是KTV直播场景的一个延伸,唱歌的人不是一个而是多个。之前马云和王菲合唱了一曲《风清扬》,我们如果把合唱搬到线上是这样一个效果:他们分别在两个不同的直播间,看着MV视频画面,听着伴奏,就像在线下KTV里K歌一样演唱,最终围观的观众可以在手机的APP上看到马云和王菲还有MV叠加的视频画面,还可以听到他们两个合唱和背景音乐混在一起的效果。这就是时下比较流行的合唱直播,把线下合唱的场景搬到线上视频直播里。

这个场景下即构科技有两种方案,一种方案是能够让马云跟王菲两个人相互连麦听到对方的声音,一边唱一边聊。这个好处是会有更多的互动,缺点是可能会出现一些歌词上的不同步。第二种方案是让马云能够听到王菲的声音而王菲听不到马云的声音,保证做到歌词跟背景音乐还有两边唱歌的声音是完全同步的。

最后一个场景是跨国的在线教育,例如跨国互动小班课堂,多个学生可以和老师实时互动上课。当前互动小班,PC端我们可以支持32个学生同时上课,手机端可以支持20个,此外我们还提供老师跟学生写写画画的白板。我们的客户好未来反馈说小孩子特别喜欢这一种功能。

另外还有双师课堂,比如说在北京有一个名师在考研的冲刺班上讲课,在深圳、上海和杭州等城市的多个教室的学生们也希望听到这个名师老师的课,双师课堂的解决方案在名师的课堂部署一个录播机、两个摄像头、麦克风等设备,各个城市的N个教室里的学生能通过他们教室里的录播机收看到名师上课的情形。因为远程有一位名师在授课,本地有一个老师在辅导,所以叫做双师课堂。

基本上即构实时音视频服务的行业包括了视频直播、在线教育、视频社交、游戏语音、物联网、家庭陪护等领域。我们能在全球范围做到低延迟、高清不卡顿,这得益于我们底层自研的音视频技术引擎,得益于超过10年的音视频技术积累。科大未来实时音视频是您的不二选择!!!

返回列表