藏在互动直播、在线课堂、IoT背后的技术之源
大嘉购官网整理编辑:
本文经授权转自公众号:吴怼怼(ID:esnql520),作者:Cici,编辑:吴怼怼
01
「只闻其声,不见其人」
最近热门话题不少,但双十一可能会是持续时间最久的一个。
工作三年,自认为大件小件已经买的差不多,这次交了定金的4件东西总价没到500。上一个购入的千元级物件,还要追溯到半年前的一台破壁料理机。
除了让我每天都能喝到一杯暖暖的豆浆之外,这台料理机引起的对话其实更让我无法忘怀。
收到货的当天,我的室友——一位汽车发动机方向的工程师,兴致勃勃地要来围观它的运作。观察它轰隆隆工作1分钟后,他兴奋地下了结论:这本质上是一台高速运转的电机。
这句话让我感到震惊,因为它完全颠覆了我的思维方式。当我了解「声网」后,立刻就联想到这件事,当然它不是一台电机这么简单。
长久以来,我们习惯享受一件成品带来的服务,却没有想过背后如何运转。无论套上怎样的外壳,拥有如何华丽的外观,但其工作原理或是一个重要功能,可能就是简单的一句话甚至一个词。
而声网,如果要用一个词概括,那就是「实时通信」。简简单单四个字,但却蕴含着复杂的技术与服务。
声网是谁?我们日常运用的软件中内嵌实时通信技术(Real-time communication,简称RTC)的提供者,它藏在背后、深层,不会被直接看到,却又无处不在。
声网是第一个把RTC技术作为服务提供给开发者和创业者的公司,而且在很长一段时间内是唯一一家。在这段时间里,声网举办的每年一届的RTC大会,是该领域国内外开发者交流相关技术、行业想法的最大平台。
创立于2014年的声网,目前为社交泛娱乐、教育、医疗、金融等各行业提供场景化解决方案。联想到它的核心理念与服务范围,用「只闻其声,不见其人」概括再合适不过。
通过调用声网的API,开发者可以快速创建聊天、语音、视频等功能,比起考核送达率的即时通信(IM),RTC主要要求低延时和接通率,视频社交、互动直播、游戏开黑、AR远程协作等场景都在应用RTC。
这些熟悉的场景每个人都在接触,教育和社交就是两个非常依赖RTC的领域,也是声网长久以来深耕的两个重要领域。
2018年年初,受困于用户规模增速减缓的陌陌,开始主打场景化社交。除了直播,还提供一起KTV、狼人圈、派对等一系列功能,让用户有更多可选择的娱乐方式。
为其提供多样场景解决方案的,正是声网。
以一起KTV为例,它依托于语音聊天室,主播使用播放器播放MV,MV切换到伴奏时,房间观众听主播K歌,同时可以上麦和主播交流。播放过程中,主播可以控制歌曲的切换和暂停。
声网的SDK解决了主播和观众的MV播放需要同步,同时对音质要求较高的难点,为其延续了社交直播平台中实时场景的热度,又完善了实时体验。
在教育领域,声网服务于VIPkid、好未来、沪江等多位赛道领跑者。
声网曾和沪江合作,将实时互动的教育大课搬上实时互联网,让中国5W偏远地区的小学生同时「坐」在一个虚拟大教室,跟英美外教学英语、跟一线名师做物理实验,将实时互动大频道的技术边界继续推到了100W。
本质上都是解决需求,外表看起来这些似乎更倾向于「提供服务」,那么声网还有更直接利落的「解决问题」。
随着海量UGC内容的产生,音视频平台的审核压力不断加大,声网的一站式服务不仅可以让平台拥有实时音视频的功能,还拥有实时智能语音识别功能。对于试图利用背景音蒙混过关的,声网独特的AI降噪技术也能够提升不良信息识别率。
02
提供技术,构建场景
数据统计门户Statista报告显示,2015年-2019年,CPaaS(Communication Platform as A Service)市场从4亿美元增长到81亿美元。
几年间,声网与全球CPaaS市场共同发展,也经历了从SDK到场景服务,再到生态共创的发展阶段。
在场景服务的阶段,声网为各种规模的公司提供轻松开发和嵌入实时通信的方法,为开发团队节省人力资源和时间成本,使开发者专注于构建应用程序而非基础架构,并为泛娱乐社交提供变现解决方案,为在线教育提升感受体验等。
到最新阶段,声网进一步升级成生态共创。在声网Agora 2019品牌发布会上,声网公布「Agora云市场 」全球合作伙伴计划,这也是声网第一次品牌发布会。
生态共创意味着,声网的用户成为合作伙伴,双方一起构建基于实时互动场景的技术市场平台,为开发者提供技术平台、产品功能、开发集成、渠道销售等解决方案,探索RTC在更多领域的用法。
除了社交和教育是重中之重,声网也持续不断地在IoT、金融、医疗等行业发力探索。
医疗急救一直让我有个困惑——在医生到来之前,作为患者家属甚至是路人除了等待能够做什么?毕竟不是人人都会CPR,也并非所有急救措施都要用到CPR,普通人也难拥有足够的医学知识判断患者的突发疾病。
声网其实解决了我这个困惑。
2018年下半年,重庆率先上线了可视化120自救互救系统。在拨打120后,点开由平台发送的短信链接,医生就可以通过视频对话,指导现场人员进行自救或互救。
这背后的技术就由声网合作提供。
尽管现在我们几乎用微信代替了一切通讯(非简单社交),但它还是建立在熟人基础上。不得不承认的是,很多状况与场景容不得让我们「先加个微信」。
2018年统计结果显示,我国每年有54 万人发生猝死,超过 80%猝死在医院门外,抢救成功率不到 1%。
如果声网RTC能够在医疗急救领域大规模运用,相信未来会对这个数字有所改变——在急救车到来之前,RTC提供帮助的可能性,可能远大于恰巧身边有一位医生的概率。
03
声网开放,CPaaS迎接未来
除了「Agora云市场 」全球合作伙伴计划之外,声网还在发布会上提到三个重要举措。
第一件事是,Q4上线Agora Analytics水晶球2.0。听起来名字很梦幻,其实很直接,就是服务透明化。
如果说声网的实时音视频服务是为开发者提供了一辆车,那么水晶球就是告知开发者车况如何,以及如果发生故障,那么问题出在哪。量身打造的使用场景+售后自助服务,由此全都具备。
一个常见的场景是,一位学生在观看付费在线课程中进行投诉,原因是画面卡顿体验差。由于这个平台使用的是声网的服务,于是请求声网查找问题,最终结论是学生使用的设备版本过低,不支持老师的高分辨率画面。
问题最终被解决,但在一来一去三方沟通之间,几个小时可能就这样过去。平台客服可能有着必须在规定时间内解决投诉的kpi压力,学生可能当天不止观看这一堂课,但由于问题一直在,所以始终体验不好。
那么,对水晶球2.0的需求就会非常迫切。声网以此提供RTC服务全面的质量监控和分析数据产品套件,在实时问题调查的基础上,可以进行整体服务质量和分析,实时质量监控。
另两件事是,声网开源自研的抗丢包音频编解码器Agora Solo。Solo是声网专为不稳定网络设计的语音编解码器,能够在弱网条件下保证流畅的高质量通话;Agora RTC SDK3.0也将于11月上线,实现直播和通信大融合,并全面提升弱网环境下的音视频体验。
声网不仅为平台用户赋能,授之以渔,还为开发者提供福利,实现技术共享与进步。
之前提到未来,其实任何技术与服务的发展都应该具备前瞻性。
Low-code(构建自定义代码开发)甚至No-code(零代码-拖放式编辑)快速开发应用,正在成为新的趋势。Agora云市场的一站式解决方案,就是以Low-code的形式,把声网的实时音视频技术和合作伙伴的业务能力结合,无论单一接口的功能还是场景解决方案,都可以根据实际需求,通过低代码模块组建的方式自由组合,灵活开发。
在未来,RTC服务的界限会变得越来越模糊,多种技术的结合也会变得越来越普遍。
在4G时代,解决丢包问题是声网在RTC领域拥有卓越表现的关键。5G时代尽管也将要到来,但带宽只是其中一个环节,并不一定能够避免丢包,高峰期、不同运营商之间的数据传输依旧面临与4G时代同样的问题。
不过,声网考虑的问题显然不只是不丢包而已。5G时代与VR、AR、AI的结合将会大大拓宽使用场景,AI教育、工业领域智能制造,声网始终在路上前行。
特别声明:本文为合作媒体授权DoNews专栏转载,文章版权归原作者及原出处所有。文章系作者个人观点,不代表DoNews专栏的立场,转载请联系原作者及原出处获取授权。(有任何疑问都请联系idonews@donews.com)