任意门adsl(ADSL线路)

none

文|谢谢

如果有一天,你获得了超能力,可以瞬间移动到任何地方,你很快就会发现,这个世界上的大部分技术对你来说都会变得毫无意义。

你再也不需要网购了,因为你可以去任何一家店,摸一下,自己试穿;不需要快递、外卖、打车软件,甚至不需要汽车、飞机等交通工具。即使是最新的自动驾驶系统对你也失去了魅力;什么在线教育、医疗、视频聊天、电话会议……你都不需要了。

不幸的是,没有如果。

所以如果你反过来想,你会发现我们人类的很多技术很大程度上都是为了解决同一个问题——打破空之间的限制,或者说“跨越距离”。

人类天生厌恶空之间的限制,从不掩饰自己“跨越距离”的欲望。

这种欲望在艺术作品中经常暴露——孙武空战斗力再上去就得配个筋斗云;哈利·波特太强大了,他必须有一个会飞的扫帚。哆啦a梦一集拉出一个新道具,但是任何一个门的魅力都是永恒的。

与艺术作品相比,现实世界中人类与空“之间的制约”的对抗更加激烈。

五千多年前,我们的祖先一次次倒地驯养野马;2000多年前,秦始皇指挥无数人将烽火台遍布万里,只为隔空发出战争信号。两百多年前,第一辆火车被一辆马车追着嘲笑;一百多年前,莱特兄弟经历无数次失败,终于试飞成功;第一个电报响起,第一个电话……几十年前,互联网诞生了。

科技飞速发展的背后,总有跨越距离的欲望。

我今天要讲的故事发生在网络上,也和《穿越距离》有关。

那些年,中国有一股韩流。十台电视机里有七八台在放韩剧,街边的店铺里正在播放一首《Unara,Unara,Azuula……》。(对,我说的是《大长今》主题曲。你脑子里有声音吗?

)

有些人开始对韩语感兴趣了,但是在大城市说起来容易。小城市哪里有像样的韩语学校?身边的韩国人我都抓不住(不像马云小时候能在西湖边找外国人练口语)。因此,人们把目光投向互联网——一个没有地域限制的世界。

学习语言依赖于对话。很久以后,人们在网上发现了一个好东西——YY。

时任YY科技负责人的赵斌对韩国爱好者的涌入感到惊讶。在他的想象中,YY不是用来学习语言的,而是为游戏玩家设计的。

最早的YY用户是魔兽世界玩家。他们在游戏中需要实时的交流和合作,打字会耽误和怪物的战斗。于是Duowan.com的创始人李学凌带了一批人给他们做了一个语音通讯工具,也就是YY。

之后各种游戏玩家,比如传奇,穿越火线等。,听到这个消息,涌向YY,这是意料之中的。但是学了韩语频道之后,越来越多和游戏无关的语音频道相继出现,比如学英语的,PS的,学乐器的,唱歌的,聊天的,吹牛的……这个还是挺意外的。

比赛结束后,许多人喜欢对YY吹牛和大喊大叫。

本来只是为了解决一小部分人的需求,却不小心触碰到了一个更普遍的需求。就好像我本来只想在地里挖几个菜,结果用锤子挖了一个金矿。

虽然在加入YY之前,赵斌已经从事音视频行业多年,并且是美国著名视频会议公司WebEx的创始工程师之一,但他对实时音视频软件的理解还停留在“网络电话”和“语音工具”的层面,YY用户彻底颠覆了他的想法。

据赵斌回忆,当时YY上有一位老人,每天在频道里演奏一种自己发明的奇形怪状的乐器。一群少年在通道里围着老人拍手大笑,用言语、声音、表情包、奖励投来赞赏的目光。

这些人与人之间跨距离实时交互的场景极大地启发了赵斌,一些抽象的思想开始钻入他的脑海:工具背后人与人之间的情感交流,人类对跨距离实时交互的渴望和需求……

后来,YY逐渐演变为在线教育和直播,这在很大程度上是由YY用户“跨越距离”的愿望驱动的。

当越来越多的人开始跟着YY学习,甚至大型教育机构开始进入市场的时候,YY开始了在线教育;

当玩家对“开黑”不满意,想站在大神身后看他怎么玩的时候,游戏直播就出现了;

当人们不满足于只听到小姐姐温柔的声音,还想看美女的时候,现场秀就出现了…

一切都是那么自然,就像生物进化一样。

那时候每个网吧都有一群人站在大神身后。

2012年,YY母公司在欢聚时代上市,招股书概览栏里有一句非常显眼和前端的话:“人类是群居动物,有与他人接触、互动和交流的基本欲望。”

我想在它后面加一句,让它更容易理解:“但在现实世界中,这种基本的愿望往往会受到地域的限制,受到距离的阻隔。谁能帮助人们满足这些愿望,谁就会得到奖励。”在那些日子里,YY热衷于捕捉和满足人们的愿望,并因此获得了巨额报酬。

在YY上市的第三年,赵斌离职,他的财富自由了。他本来就有退役的打算,但他出来是为了组建音网。他自己的解释是“被身边的朋友怂恿”,但根本上是因为他认为人类“跨越距离”的欲望远未得到满足。

当时,李学凌向YY提出了“不卡、不掉线、不延迟”的产品需求。然而,当YY用户的规模越来越大,就很难维持这种需求。后来,赵斌加入进来,和一帮干部一起改写了YY语音的技术底,让YY在一年内突破百万日活,冲到千万级别,在所有语音工具中脱颖而出。

“不卡、不掉、不耽误”,这个目标乍一看并不难。这就像一个酒店定下了“不脏不毒不臭”的目标。怎么会这么难实现?

将其归咎于网络基础设施和有限的底层技术。

年前,我家还在用电话线ADSL拨号上网。甚至更早,南北互通都是问题。玩游戏的时候,要分成电信区和网通区。不管技术人员怎么优化,就跟车窄一样,交警想尽办法引导。没被屏蔽就已经不错了。为什么你仍然认为速度很慢?要做到一定的用户规模,“不卡、不掉线、不延迟”是当时能做到的最好。你为什么需要自行车?

赵斌知道,只要底层技术还在发展,网络环境还在改善,“帮人跨越距离”就会进步空。

也是为了“跨距离的实时交互”。当年声网和YY的具体做法不太一样:

YY将为需要它的玩家开发一个软件,让他们自己打开。Soundnet没有选择做应用,而是在应用背后做了一套“实时交互基础设施”,将实时交互的能力以API接口的形式直接嵌入到各种应用中。

打个不那么严格的比方:YY是社区里的公共水龙头,需要的人可以自己取水。聚集的人越来越多,它就在旁边摆摊卖瓜子、饮料、矿泉水,用其他生意赚钱。声网直接向地产商收钱,帮他们把“自来水系统”接入楼内,让业主搬进来就能直接有水喝。

开发者赵斌认为,科学技术总会向“通用”的方向发展,所以他希望只有巨头才能拥有的实时交互能力,能够通用于所有开发者和创业者。

如果回到2006年左右,你会发现《魔兽世界》其实内置了语音聊天功能。太奇怪了。楼里有自来水系统,看起来不错。为什么人们仍然下楼去YY打水?

魔兽世界自带语音系统设置界面。

原因很简单,因为魔兽世界自己的语音服务太垃圾了,简直卡,掉线,延迟,直接劝退人(不知道后来好了没有)。

然后用刚才的类比,魔兽世界大楼虽然有自己的水龙头,但是水质不好,有时候变黄有时候变白,而且总是停水漏水。

对于一个自来水系统来说,人们能看到的水龙头是最容易做到的,但也是不重要的。后面人们看不到的水质保障才是关键。同样,一个语音聊天功能,界面和按钮是最容易做到的,也是最不重要的。音视频采集、数据传输、时间同步、网络抗抖动、抗丢包、抗延时是最重要也是最难做到的。

如果每个游戏都做了自己的语音功能,就不会有什么YY了,但也不可能发生,因为太难了。当年专业的语音聊天工具那么多,敢宣称不会卡,不会延迟的也就那么几个。难度可想而知。

“实时交互不是一种功能,而是一种服务。”在创业的路上,赵斌不断告诉他的队友。后来,直到SoundNet成功上市,赵斌说:SoundNet唯一做对的事情就是率先意识到实时互联网是一种服务,而不是一种功能。

创业第二年,声网迎来了第一个客户,接着是第二个、第三个客户……就像雨一样,先是稀稀落落的几滴,两滴,然后密密麻麻。

声音的风暴发生在2020年。这一年,新型肺炎病毒在家门口围攻人,人类活动空被限制到前所未有的境地。限制激发了强烈的欲望,人们又把目光投向了互联网,就像学韩语的人把目光投向了互联网——一个没有空和地域限制的世界。

于是,整个互联网世界一下子热闹起来,所有涉及音视频技术的厂商数据都大幅上涨。美国政府甚至发布通知,让网飞、Youtube和其他网站降低图像质量,以节省网络带宽。视频会议、在线教育、在线医疗…各类线上厂商迎来了前所未有的春天,声网通话分钟数成倍增长。

乘着这股风,王声在美国股票市场上市。在招股书中,Soundnet将自己定义为“实时互动云服务提供商”,英文是RTE-RTE——Real-TimeEngagement。有些人很惊讶,因为在此之前,人们对这个领域的描述更多的是“实时音视频”或者“实时通信”,它的英文是RTC——real-time communication。

RTC这个词是Google开发的。2011年,谷歌收购了从事音视频实时交互引擎开发的公司GIPS,对其技术进行了重组并使其开源,命名为Web RTC,可用于在网页或应用中轻松嵌入实时音视频功能。

随后的十年,RTC逐渐成为代表这个领域的词。但是到了2020年,声网觉得RTC已经不足以定义行业和自己了。

2010年之前,互联网主要解决“跨距离实时交互”的可用性问题,2010年到2020年这10年间,主要解决普及问题。2020年疫情过后,几乎没有人是线上实时互动的新手。已经渗透到我们生活中的各种场景,是时候整理一个新的目标了。

赵斌告诉我,“听到声音看到图片只是一个起点,是实时交互的基础。”

言下之意,以RTC为代表的音视频技术只是实现的手段,而不是最终目的。跨越人与人之间距离的是RTE实时交互。

在实践中,RTE和RTC是什么关系?举个简单的实际例子你就明白了。

老师远程教孩子。老师除了传输声音和图片,还要在黑板上写字,在PPT上画画。这时候就需要一个交互式白板,把板上的字迹实时同步给大家。白板上的字迹超出了音频和视频的范畴,是通过信令来传输的。

Netless是一家交互式白板公司,最近被王声收购。

一个医生在千里之外给一个病人做远程手术。他看着那边实时拍摄的画面,听着扬声器里那边手术室的声音。这都属于实时音视频的范畴,也就是RTC,但当他在千里之外操纵手术刀轻轻一划,却是信令传输,属于RTE。

现在很多遥操作都有一个很大的问题:没有触觉反馈,医生也不知道用了多大的力。为了让医生保持操作的“手感”,未来的遥操作者还需要获得触觉反馈,这当然也需要实时传输,这就超出了音频和视频的范围。

图片来自互联网

总之,RTC是RTE的子集,RTE是RTC的Plus版本。

2021年春节那个特殊的除夕,无数游子响应国家号召,留在异地,我也是其中之一。在某个时刻,我庆幸自己出生在这样一个科技时代,拿起手机就能见到千里之外的亲人。我也没必要学李白和till,举起杯子问明月,我可以用手机相机喝一杯。

当时我就忍不住想实时交互未来会往什么方向发展。在VR、AR、5G网络普及之后,会不会出现电影《Ready Player One》中的场景,我们每个人戴着VR眼睛穿梭于虚拟世界,在那里拜年、聊天、发红包、打麻将……甚至在里面工作,而不顾现实世界的各种空约束?

带着这个问题,我去找Soundnet的一个朋友聊天。Soundnet的首席财务官汪静波告诉我,“在虚拟世界工作?不要等未来,你现在已经有了~还是声网的客户……”

我按照他说的找到了这个叫Virbela的产品,发现它的设定是这样的:

在虚拟现实场景中,你控制一个角色在其中行走,就像3D游戏一样。可以通过电脑控制,也可以通过VR设备访问。

给你的角色揉脸换衣服。你可以选择让它看起来像你真正的样子,或者你可以“美化”它。

它是如何用于远程办公的?

控制欲强的角色走到公司门口,前台的小姐姐会跟你打招呼。你可以通过耳机听到她的声音,她的背后还有一个真人——你公司的前台。在现实世界中,她坐在家里远程办公。

当你走进公司,走向你的工位,你可以看到你的同事在路上工作,你可以互相打招呼。

然后,你也找到你自己的工作站,一台电脑在桌子上,你坐下来,然后你开始工作-使用你真实世界的电脑,当然,真正的工作。

在此期间,如果你有好的想法,你可以转头或者起身告诉你的同事,他们在你身边。系统会根据你的角色的距离和位置来调整音量和环绕效果,来模拟真实的环境,就像真的坐在一起一样。

会议室里,大家都有早会,墙上的投影幕就是你真正讨论的内容。

工作累了,可以去茶水间喝杯茶,和同事在楼下聊聊天,抽根烟。

如果你喜欢,你可以跳一个快乐的集市。嘿。

这款软件不仅可以远程办公,还可以作为远程VR教室进行大规模演讲。

甚至举办商业展览。

虽然画面看起来没有那么细致,有些场景甚至很搞笑,但是在这里,你拥有最豪华的海景写字楼,大到可以开火车的办公室,蓝天白云,绿草如茵,不用通勤。你需要什么样的自行车?

不得不说,歪坚果的脑洞真的很大。可惜Virbela是国外产品,不然我愿意在里面买个写字楼。

“Ready Player One会是实时交互的终结吗?”我问汪静波。

“不会”他说,Ready Player One的场景很可能会出现,但绝不会是实时交互的全部。声网对未来的判断是,未来实时交互会呈现多元化的特征,多种形式并存,而不是只有一种形式。

他说,就拿典型的网络斗地主实时互动场景来说吧。有些人喜欢在电脑和手机前玩,因为里面有丰富的道具和特效。如果你在虚拟世界里做一个模拟牌桌,你可能不喜欢。

就目前而言,更有可能的是,实时交互会像水和电一样渗透到我们现实生活的每一个角落,也许会以某种方式出现,解决一个需要跨越的问题。

可能是医保视频,不用跑腿就能办各种业务。

可能是“网上自习室”,三两个网友开着相机学习直播,互相监督。或者几个程序员结对编程。

还是“虚拟影院”,几个朋友一起看一部电影,边看边聊天?

还可以看一场足球比赛的直播,和三五好友聊聊天,喝喝啤酒,就像世界杯期间的酒吧。

实时交互+智能家居?实时交互+智能汽车?实时互动+金融?没有人能准确预测下一次实时互动会在哪个土壤里开出什么样的花。

这就是为什么Soundnet每月为每位客户提供10000分钟的免费实时音频和视频使用时间。“10000分钟是一个很大的数字,足够开发者尝试大部分创意了。”他们希望人们实践对实时交互未来的每一种想象。

实时互联网的未来让人期待,但也让Soundnet这样的低级技术服务商感到紧张。

未来是多元的,多元就意味着碎片化,各种情况都可能出现,这就要求他们在技术上极其敏捷,才能应对每一个复杂的情况。

声网首席科学家钟升讲了一个最简单的例子。四个人在线开会,网络质量参差不齐。会有一种情况:

如果实时网络向网络最差的那一方让步,传输了画质很低的视频流,那么其他三个人在知道网络很好的情况下,只能看画质最差的。

但是如果视频流高质量传输,网络不好的会卡。

在这种情况下,声网必须实现网络的适应性和可扩展性,实时了解每个参与者的网络情况,使自适应的视频流能够分发和动态变化。

网络状况好的时候,画质会更清晰;网络不好的时候画面会自动变差,但是不能卡。网络好的时候,画质会自动调回来。

乍一看好像不是特别复杂,但是每个人的网络情况就像路上的车,速度无时无刻不在变化。实时了解每个参与者的网络情况,毫秒级反馈,并不容易。

声学网络使用机器学习算法来检测宽带的变化,实时估计网络拥塞并识别数据包丢失。

先不说机器学习算法的原理。简单来说,就像你每次出镇,都要拿出导航软件搜索目的地,让软件帮你预估路况,预估时间。所谓“发现带宽”,就是在互联网世界里,以毫秒为单位,一直引导网络流量,帮助它们按时到达目的地。

十年前,“不卡、不掉、不延迟”是一个很难达到的标准。在网络条件越来越好的今天,人们的需求也越来越高,从普清到高清再到超高清,从PC到手机再到AR、VR以及各种智能设备。道路越来越宽,越来越好,但是汽车的数量也在增加。完全避免堵车还是不容易的。“不卡、不掉、不延迟”仍然是一个接近但无法实现的目标(100%不卡、不掉、不延迟显然是不存在的)。

为了节省带宽成本,声网还是要“省钱,尽量把每一比特的网络流量用在刀刃上”。

比如他们对“低码高清”的研究,可以在你不注意的时候,降低你不太注意的地方的分辨率,在不影响观看的情况下,节省码率。(这个和我们之前写的优酷“窄带高清”差不多,不同的是声网是实时交互进行的。)

比如我们在观看180°或者360°的全动态视频,或者VR时,视野的中心可以显示得更清晰,边缘可以稍微模糊一些,这样既可以节省带宽,保证画面流畅,又符合人类的真实视觉感受(视野边缘比中心模糊)。

图片摘自RTE2020贝尔的演讲。

极端情况依然存在。虽然我们将来会有5G网络,但我们偶尔会遇到信号差和干扰的情况。还会导致通话卡顿、延迟、掉线。

虽然通过自适应网络传输方案,声网在70%丢包率的情况下仍能流畅播放,但往往需要牺牲画质和流畅度。

王声的人告诉我,最近几年,我开始用一种方法:可以用人工智能算法“插帧”,把低帧率视频变成高帧率,用AI超分辨率算法增加低分辨率视频的分辨率和细节。

所谓“插框”,就像是用手看书。当你不关注AI算法的时候,你以毫秒为单位把上一页加到每一页的后面,让画面看起来更流畅;“超分辨率”是指AI在你不注意的时候给屏幕增加一些细节。

由于实时交互,帧插入和超分辨率必须在毫秒级完成。

除了网络质量问题,他们未来可能会遇到各种情况:跨运营商、跨国家的用户,使用不同的设备屏幕、电脑、手机、手表、VR眼镜…以及各种可能的实时交互场景,从千人大会到一对一在线辅导。他们必须对它们感到舒适,而且技术上的挑战也不容忽视。

年前我去和Soundnet的人聊天的时候,或许是Soundnet的股价受到了Elon Musk做客的知名播客互动平台ClubHouse事件的影响,一下子涨到了一百多美元一股,翻了一倍多。我问他们的感受,汪静波说,我不评论Soundnet和Clubhouse的关系,但我可以谈谈股价波动对他们的影响,答案是什么都没有。

他说,在他加入Soundnet的那一年,他发现这家公司的人有一个特点。通常他们几乎不谈“数据涨没涨”、“股价涨没涨”之类的短期数据。人们谈论的更多的是如何解决客户的问题,如何应对未来。

我听了之后还挺羡慕他们的。心里有一定的未来和明确的目标就好,就像《海贼王》里的宝藏OnePiece,等着他们去寻找,心无旁骛的往前走。

毕竟人类不会有瞬移的能力。

然而,作家亚瑟·克拉克(arthur clarke)表示,任何足够先进的技术都与魔法没有区别。

我认为,今天我们可以拿起手机,通过视频与千里之外的人见面。或许在古人眼中,这和在空中开启魔法传送门没什么区别。

这些“魔法”不就是用普通的能力一代代积累起来的吗?超能力只是能力的积累。

所以,也许有一天,人类真的可以拥有“瞬间移动”的超能力,但那一定是人类世世代代怀着打破空之间极限的愿望创造出来的,就像龚宇用锤子移山一样。

最后,让我自我介绍一下。我是《科技普及》的作者谢瑶。每天,我让各种技术变得流行和有趣。想和我做朋友请关注【浅黑科技】!

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。

作者:美站资讯,如若转载,请注明出处:https://www.meizw.com/n/252002.html

发表回复

登录后才能评论