ku游平台登录

ku酷游体育 - 人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。

ku游平台登录

纠结 ChatGPT 会取代什么,已经没有意义了

2022-12-29

如果你关心技术,那么此刻应该已经读了好几篇关于 AIGC 的文章了;如果你不关心技术,应该也不会点开这一篇。不浪费时间,让我们现在就聊一个问题:在创作这件事上,人和机器的差别何在?
创作者的意图
如果机器可以比人类更快的绘画、更高效的写作、更少错误的编程,那我们作为人还需要继续创造吗?交给机器去创作新的图画、文章、诗歌、程序难道不是更好吗?
这也是一个老生常谈的问题,这是一种常见的叙事:机器是为了在某方面取代人而生的。「取代」是一个中性的概念,机器代替人类排爆没人会自己工作被抢了;但如果电脑可以比画师更快出图、比记者会更快写稿,就是另一个维度的问题了。
人,不论是什么人,都会在自己的人生中渴求创造一些属于自己的印记。我们通过创作来反映自己到底是什么样的存在,即使是一条朋友圈也要与众不同。所以当现在的机器能画图、写作之后,人类还特殊吗?如果机器对我文章的标题起的比自己还好,那要我还有啥用?
DALL·E 对《戴珍珠耳环的少女》背景进行扩充
即使机器比现在更强大,作为创作者的人类依然有最独特的价值:意图性,一种强烈的意图性。就是说,作为创作者的人,在脑子一定有一个目标、希望、幻想甚至是空想——但他/她在试图用创作去达到那个彼岸。
而这恰恰是机器最缺乏的地方:机器没有意图。就算(目前水平的)机器有一天毁灭了人类,它大概率都不是故意。AI 的作品所表达的是它所学习到的事情,而非它想表达的事情。AIGC 可以画一幅精彩绝伦的作品,但它并没有凭空画这幅作品的「意图」。一定是有一个人有让机器作画的「意图」,这个作品才能诞生。
这么说可能有些抽象,让我来举个例子。我的人生有几个恍然大悟的瞬间,这是其中一个:
你已经会摄影了,那你为什么要摄影呢?
实话实说,我到现在也不知道这个问题的答案。所以我决定暂时放弃作为艺术的摄影,仅仅是把它当做日常图一乐的爱好。问出这个问题的人,是一名叫 Tianxi 的艺术家。当时是 2019 年,我正在做一个拍摄中关村的艺术项目,可拍了四年,感觉所拍摄的那些照片换任何人都能拍出来。
Tianxi 的问题是最后一根稻草。如何找一个机器人每天在中关村溜达,都能有差不多的照片。那么为什么要我拍呢?我在这个创作上,并没有一个非常强烈的意图。如果仅仅是「拍摄中关村」这件事,我是可以被机器所取代的。我在这件事上没有一个必须强迫自己创作的猛烈意图。这种意图是某种艺术死磕的决心。艺术家朋友说死磕是一种「宁可饿肚子,也要搞艺术」的创作冲动,无论如何都要实现目的的意图。也有人将其称之为创作者的「狂气」。
但有些事情我是有强烈意图的。比如这篇文章。我希望可以和你一起探讨究竟在 AIGC 的时代,人的创作究竟有哪里是特殊的。这就是我写作的意图。而如果我们问「人类的创作和 AI 比有什么区别?」,ChatGPT 会给出这样的回答:
人类的创作和 AI 的创作有很多区别。最显著的区别是,人类创作是基于人类创作者的感性和想象力,而 AI 的创作是基于它所接受的训练和数据。此外,人类创作者可以从多种不同的角度来思考问题,并根据自己的个人喜好进行创作,而 AI 创作者则不能这样做。
此外,人类的创作过程通常更加不确定和模糊,而 AI 的创作过程则更加精确和可预测。人类的创作过程可能会经历许多反复和曲折,而 AI 的创作过程则更加线性和顺序化。

总之,人类的创作和 AI 的创作有着许多不同的特点,但是它们都能为我们带来极大的价值。
这种回答不是错的,但它没有任何意图。AI 只是在回答这个问题,它并没有探究这个问题的热情与说服读者的欲望。
但没有意图并不说明 AIGC 不重要。相反,如果你有意图,AIGC 完全应该是帮助你创作的好助手。如果 AI 能快速帮我出一篇文章的底稿,我是不会拒绝的。因为作为写作者,我应该自己需要什么样的内容。
人的品味
对于创作者来说,大部分情况下有两个特别重要的能力:搜集资料的能力,与从中建立关联并建立新事物的能力。即使是艺术家,也无法脱离艺术史的语境下而创作;相反,任何伟大的艺术家都一定见过足够多的艺术作品,绝不可能无中生有。「直到别人还怎么干过」这项技能,在创作中一直很重要。
但在互联网诞生后,搜集资料的能力被抬得越来越高。绝大多数创作变成了收集资料的堆砌——当你可以在一天内找到 100 年前的人一辈子也无法获取的信息时,很难抑制住这种对信息量的渴求。用文章举例,一类常见的创作方式就是收集大量的资料后去摘取而成的人物传记。无数的内容都在告诉你别人都在做什么,就像是那种《Top 100 电影》、《Top 10 人生必读书》那样。
在 AIGC 的时代,这件事只会更加突出:因为机器比人的收集能力还要强大。这就需要让我们同样需要注意另一种能力,从资料中建立关联并创造新事物的能力。这种能力我们经常用别的名字形容它:品味。创作者如何利用这些 AI 的创作,归根结底是品味的一种体现。如何筛选、整理、与 AI 协作,靠的不是更多的信息,而是你的品味。
图片来自:《头号玩家》
在今天「品味」这个词有一种矫情的负面感受,要我说创作者就应该比以往更加矫情。我们已经可以利用近乎无限的信息了,AI 可以帮助我们比从前更加快速的去创造,难道不应该去寻找更符合自己美学的品味吗?创作的养料异常丰沛,任何品味都有自己的应许之地。AIGC 的帮助可以让创作者开眼,更可以遮上创作者们的眼睛。被遮上的眼睛,才是有你品味的眼睛。
除此之外,AIGC 还在迫使我们去反思关于创造的定义。这类技术让我们不得不问自己:我所做的一切,真的是创造吗?还是假装成创造却只不过是用了点大脑的的体力劳动?人类的历史就是职业不断出现和消失的历史,从来没人能许诺永恒。而我们经常因为自己几年、十几年的经验,就错把一时的职业当作社会天经地义的存在。
1926 年,河北省献县宗座代牧区的法国耶稣会传教士出版了一本题目为《传教士建造者:建议-方案》的小册子。这个册子的目的是帮助在华传教士用尽可能少的钱造一个别太丑的好教堂。小一百年后,这个手册被人重新找了出来,成为了研究中国基督教建筑演变和西方人在华如何工作的重要资料。这个手册里几乎所有的操作方法,都已经被时间淘汰了。就是今天不会再有任何人、任何职业按照这个手册的操作来施工。
但这些传教士们充满热情的意图,却在这本手册里被充分展现出来。利用这本小册子,我国联合德国重新修缮了大名天主堂。而这座教堂得到了这样的评价:「2014 年的大名天主堂宛如 1900 年的敦煌藏经洞,破壁的那一刻,一个学术的时代已经悄然开启。」
正如今天也不需要像北宋画院的王希孟一样作画,但《千里江山图》的青绿山水依然昭示着这位没有多少记录画家的创作野心。职业易逝,而创造的意图长存。
无法预测的未来
但 AIGC 能让什么职业消失,又会诞生出什么职业?坦率地说,我不知道。
前面提到的中关村艺术项目,起因是从 2015 年开始我就在这创业。广义上来看我们公司是做人工智能的——不过这个词太大了,细分的方向是利用了深度学习的计算机视觉。我的工作就是教会电脑通过视觉的方式认识各种各样的玩意:从太阳能面板的隐裂、到机场移动的飞机最后再到山西林区里一只移动飞快只能看到尾巴尖儿的华北豹。后来不光研究可视的图像了,还有双目传感器、激光雷达和某种被称作 SLAM 的技术。反正净是些创业圈愿意说的「大词」。说这些是因为如果谈论人工智能需要某种资格,那我还是有的。
图片来自:《西部世界》
而这就是另一个令我恍然大悟的瞬间:曾经有几年我每天都被海量的人工智能新闻所轰炸、每天我的工作就是和人讨论这件事、每周我都要去听各路创业者和投资人谈论人工智能的未来。而多年后的今天,我发现几乎所有当时的高谈阔论都是在扯淡。
没人想到未来的人工智能在聊天时给你一段试图毁灭世界的代码、没人说以后让电脑帮忙画画、更没有人能想到人工智能的破圈是在把你的照片变成二次元风格这件事儿上。没有人。所以预测未来是一件巨危险的事情,因为未来真的是太随机了。这或许也是「未来」一词美妙的地方,因为人类经常无法得知种下的种子会开出什么样的花朵。地狱之路可能被善意铺满,可救赎之旅也常从绝望中开始。
不要预测,去创造吧。这次带上 AI 一起。

继续阅读

最强聊天机器人ChatGPT面世,AI又来抢饭碗了?

2022-12-28

近日,OpenAI发布了一个全新的聊天机器人模型ChatGPT,它能够模拟人类的语言行为,与用户进行自然交互。

 

 

在推特网友们晒出的截图中,ChatGPT不仅能流畅地与人对话,还能舞文弄墨、编写代码……创作天马行空的内容也不在话下,它几乎无所不能。由于该测试目前免费,一经推出就被访问者“挤爆”,上线仅5天用户数量就已突破100万。

 

 

12月2日,就连特斯拉CEO埃隆·马斯克也在推特账号上表示,“很多人被困在一个疯狂的ChatGPT循环中?”

 

 

随着IBM超级计算机“深蓝”击败国际象棋世界冠军、谷歌AlphaGo击败人类冠军棋手、Stable Diffusion模型刷新AI作图迈进“一秒出图”时代……

 

 

关于“AI取代人工”“AI打败人类”等话题一直层出不穷。ChatGPT的横空出世,让人们更加担忧,“AI又来抢饭碗?”

 

 

引爆全球的ChatGPT到底有何玄机?ChatGPT的商业空间到底有多大?

 

 

ChatGPT缘何引爆全球?

 

 

ChatGPT是人工智能研究实验室OpenAI在11月30日发布的全新聊天机器人模型。

 

 

OpenAI成立于2015年,由营利组织OpenAI LP与非营利组织OpenAI Inc组建。OpenAI的最初创建者正是马斯克等硅谷大亨。2018年,马斯克宣布退出OpenAI董事会,后者解释,随着特斯拉越来越关注AI,马斯克的退出是为了避免产生冲突。

 

 

在OpenAI的官网上,ChatGPT被描述为优化对话的语言模型,是GPT-3.5架构的主力模型。

 

 

GPT- 3.5架构基于OpenAI于2020年推出的GPT-3架构,即生成式语言模型的第3代。早在2020年6月,在训练约2000亿个单词、烧掉几千万美元后,史上最强大AI模型GPT-3一炮而红。当时,业内人士就对其赞不绝口:“它比我尝试过的任何AI语言系统都更加连贯。”

 

 

据悉,微软已和 OpenAI 签订了战略合作计划,GPT 3.5 代的所有模型,包括 ChatGPT,都是在 Azure AI 超级计算集群上训练的。

 

 

作为一个聊天机器人,ChatGPT具有同类产品具备的一些特性,例如对话能力,能够在同一个会话期间内回答上下文相关的后续问题。然而,其在短时间内引爆全球的原因在于,在网友们晒出的截图中,ChatGPT不仅能流畅地与用户对话,甚至能写诗、撰文、编码……它似乎无所不能。

 

 

马斯克也在社交媒体上展示了询问ChatGPT如何设计推特的答复。

 

 

一位名叫Zac Denham的博主甚至让ChatGPT写出了一套毁灭人类的方案。一开始,该博主的要求被ChatGPT拒绝。但当其假设了一个故事,并提问故事中的虚拟人如何接管虚拟世界,ChatGPT最终给出了步骤细节,甚至生成了详细的Python代码。

 

 

技术公司Replit的创始人Amjad Masad还给ChatGPT发了一段JavaScript代码,让它找到里面的bug,并表示:“ChatGPT可能是一个很好的调试伙伴,它不仅分析了错误,还修复了错误并进行了解释。”

 

 

拥有如此强大而惊艳的语言能力,一时间,ChatGPT在互联网上掀起了一场“AI风暴”。

 

 

“ChatGPT之所以大受关注,主要还是因为它的确达到了非常好的效果,比如你可以用它做翻译、改错别字、debug(计算机程序纠错)等。它和Bert这种比较早期的模型相比,不管是训练数据的量和训练任务的复杂度都有很大提升。”瑞莱智慧高级产品经理张旭东在接受《每日经济新闻》记者采访时表示。

 

 

他进一步指出:“相比于之前不少模型体验下来给出的还都是‘人工智障式’的回答,ChatGPT 能给到令人惊艳的效果。另外,ChatGPT的体验流程更方便,只要注册一个OpenAI的账号就可以体验了,早期的模型需要申请通过才能体验,所以ChatGPT影响的人群更广泛,讨论的人会更多。”

 

 

ChatGPT替代谷歌搜索?

 

 

ChatGPT何以如此强大?在OpenAI的官网上,可以窥见一二。

 

 

根据OpenAI的官方文档,相比之前的GPT模型,OpenAI采用了全新的训练方式,即一种名为“从人类反馈中强化学习”(Reinforcement Learning from Human Feedback,RLHF)的训练方式对 ChatGPT 进行了训练。

 

 

在训练原始模型的时候,OpenAI让人类训练师扮演对话的双方提供对话作为学习资料。在人类扮演聊天机器人的时候,OpenAI也会让模型生成一些建议来帮助训练师撰写自己的回复。也就是说,基于优秀的机器学习算法和强劲的算力,通过海量的数据训练,来让AI学会“思考”。

 

 

除此之外,ChatGPT还采用了注重道德水平的训练方式,按照预先设计的道德准则,对不怀好意的提问和请求“说不”。一旦它发现用户给出的文字提示里面含有恶意,包括但不限于暴力、歧视、犯罪等意图,它都会拒绝提供有效答案。

 

 

为什么ChatGPT能做到其他人工智能聊天机器人所不能的?

 

 

哈尔滨工业大学计算学部长聘教授、博士生导师车万翔在接受《每日经济新闻》记者采访时认为:“可能(训练的)数据是一方面,另一方面,比较关键的还是(ChatGPT)打破了一种思维的范式——即,之前的AI都是针对某一个任务去训练一个模型,而ChatGPT之类的模型是针对多种任务的,它试图把多种任务转化成一问一答的形式。多任务如果能转化成这种形式的话,其实就消除了任务之间的壁垒。”

 

 

他认为打破思维范式之后,就可以针对这样的任务去标注或者是让人工生成大量的数据。“未来ChatGPT可能会充分利用用户反馈,进一步提高系统的能力。”

 

 

他进一步解释道:“原来的AI模型需要经过大量的训练,或是需要专家,才能进行标注;现在,普通大众也可以对(ChatGPT)进行标注,所以数据的获取方式改变了,数据量增加了,模型的能力就会变强。加之(ChatGPT的)模型参数也足够大,可以容纳这些任务。当前技术积累到这里,只剩一个点(ChatGPT)就爆发了。”

 

 

从网友们晒出的五花八门的问答中,可以看到,ChatGPT类似于谷歌等搜索引擎,甚至功能更加强大,能和用户更完善地互动。有分析指出,搜索引擎都是基于对问题本身的搜索,但它们有一个很大的限制,当用户描述不清自己的问题时,搜索引擎并不能与之互动。

 

 

因此,社交媒体上也充斥着这样一种说法:ChatGPT可能将颠覆谷歌,掀起一场搜索引擎的大革命。

 

 

不过,车万翔教授认为,搜索引擎与ChatGPT不存在谁取代谁的问题,更多可能是一种互补的关系。“它们都是一种获取信息的手段,搜索引擎可能更擅长帮助用户获取已有的信息,但如果是偏创造性的信息,那有可能这种大模型会解决得更好,因为它已经隐含了很多的信息,它能够把这些信息综合地呈现出来。”

 

 

“现在做这种大模型的基本上都是大企业,本身它们也有搜索引擎的背景。例如,OpenAI背后有微软,谷歌也在做这种大模型。未来,也不排除会将这两种信息获取方式相结合。”他补充道。

 

 

另外,ChatGPT目前并没有联网搜集信息,它所知道的信息都截至2021年。基于此,清华大学智能技术与系统实验室副主任、清华大学计算机科学与技术系长聘副教授黄民烈在接受《每日经济新闻》记者采访时认为,ChatGPT无法取代搜索引擎。“因为它(ChatGPT)目前只是对过往知识的学习和应用,例如2022年的信息它是没有覆盖的,而我们使用搜索引擎很多时候可能是为了获得一些即时的信息。”

 

 

ChatGPT有商业空间吗?

 

 

“ChatGPT有时会写出看似合理但不正确或荒谬的答案。”这是Open AI认为目前ChatGPT所面临的“限制”,并且解决这个问题被认为是具有挑战性的。

 

 

这背后主要是三个原因,首先,强化学习的信息源目前并未建立;其次,模型通过学习变得更加谨慎会导致其回避原本能够正确回答的问题;另外,监督学习将会对模型造成误导,因为理想的答案应该来源于模型的认知,而非人工演示者的认知。

 

 

张旭东告诉《每日经济新闻》记者:“前两天我们问 ChatGPT 诗人北岛是哪个国家的,他还信誓旦旦地回答说是日本,但通过后台反馈,这两天已经改回了中国。”

 

 

张旭东认为,目前来看,ChatGPT确实会存在一些错误,这也是 ChatGPT未来需要改进的地方。现在用户也是可以通过提交回答的反馈来帮助 ChatGPT变得更加准确。

 

 

这一局限性在ChatGPT模型发布后不久就已经体现出来,全球最大的编程技术问答网站Stack Overflow紧急宣布,ChatGPT在该站暂时封禁。Stack Overflow在官方通告中表示,做出这个规定的主要原因是,ChatGPT自动生成的答案质量太低,错误太多,而且看上去还挺像那么回事,即使是完全不懂的人也能随便生成答案。

 

 

ChatGPT的能力获得是基于庞大的语料库,凝练了多领域问题的很多数据做相互校验,然后挑一些基础性的内容回答出来,这其实是“举一千反一”的过程,与人类举一反三的能力还相差较远,它不具备思考能力,所以犯错误不可避免,这种错误与谷歌翻译、维基百科搜索中犯的错误类似,但通过人为的干预反馈,这些问题是可以被改进的。

 

 

车万翔认为这是一个“固有的问题”,也是整个大型语言模型在技术上面临的固有问题。他认为一个可能可行的解决方法是,ChatGPT将其给出的答案,尤其是事实性、知识性的答案注明出处。

 

 

为了解决答案中可能存在的偏差,Open AI在其官网称:“渴望收集用户反馈,以帮助我们正在进行的改进该系统的工作。”可以理解为通过用户在聊天过程中对于ChatGPT所给出回答的反馈,对其进行纠偏。不过,车万翔也提示,这种形式进行纠偏,也要警惕来自用户的“恶意反馈”。

 

 

除此之外,ChatGPT的局限性可能来自于落地应用的成本,普通企业能否负担以及是否愿意负担,同时还有一些搜索引擎本身存在的局限即调用速度慢、可能会形成算法霸权等。

 

 

延展到整个语言模型生成领域,黄民烈则认为,生成一些与事实不一致的预测、前期进行了数据过滤与清洗,可能还是会生成算法偏见或者对人类价值观社会伦理规范不符合的东西等问题,是这个行业将面临的局限,这也将或多或少影响到其实际落地应用。

 

 

除了吟诗作赋改代码、充当搜索引擎的插件,ChatGPT的商业化,还有想象空间吗?

 

 

黄民烈看好ChatGPT的应用落地,他认为,应该把ChatGPT看作是一个通用智能助手,作为工具去做比如说辅助写作和创作、检查代码。

 

 

“它不仅能够像过去Siri那样,接个电话、发个微信,只能完成非常有限的简单任务,现在它可以完成一些更复杂、更高级、更偏认知性的任务,比如说写一封情书,写一首歌,写一个文章,甚至还能够回答非常复杂的问题,比如说炒股的我应该买什么样的股票。”黄民烈认为,它是对于过去的某些能力的极大延伸和取代。

 

 

车万翔教授则指出,这是一个需要“开脑洞”的问题,作为搜索引擎的补充,只是它可能的应用前景之一。而如果把ChatGPT看作一个通用人工智能,它就可以在各行各业发挥用处,比如智能教育,它可以是一个很好的AI助教;智能金融,它可以对年报做智能分析;甚至智能医疗,也可以用它去代替医生做一些琐碎的事。“只要AI能发挥作用的行业,它(ChatGPT)至少都能把目前的系统能力进一步提升,这真是很大的应用前景。”

 

 

而在前景落成现实之前,通用的人工智能如何确保结果可信可靠则成为关键问题。

 

 

AI大模型将迎来激烈竞赛?

 

 

ChatGPT的惊艳问世也给AIGC(Artificial Intelligence Generated Content,人工智能生成内容)的应用带来了更多的希望。港股、A股市场上,已有多家相关上市公司应声上涨。

 

 

12月7日,美图公司当天涨幅一度高达45.83%,创近一年来新高。截至收盘,该公司涨幅为24.17%;A股市场上,天娱数科股价在当天涨停,中文在线收涨3.89%,视觉中国收涨2.8%,汉王科技则在12月5日和7日收获两个涨停板。

 

 

浙商证券分析认为,ChatGPT模型的出现对于文字模态的AIGC应用具有重要意义。从下游相关受益应用来看,包括但不限于代码机器人、小说衍生器、对话类搜索引擎、语伴、语音工作助手、对话虚拟人等;从上游增加需求来看,包括算力、数据标注、自然语言处理(NLP)等。具体到投资标的包括中文在线、腾讯控股、百度集团、阅文集团、蓝色光标、海天瑞声、拓尔思等。

 

 

黄民烈向《每日经济新闻》记者指出,ChatGPT是近几年基于大模型的产品中热度最高的一款,那么,这样一款“通用智能助手”,可复制吗?黄民烈的答案是:有可能。

 

 

他进一步表示,复制的核心是需要一个相对强的底座模型+大量的优质数据+专业的数据团队。目前,国内同样有企业在做类似的研发,中国交互AI平台“聆心智能”在本月推出了图灵世界的首个产品“AI乌托邦”,该系统允许用户快速定制AI角色,只需要输入简单的角色描述,就可以召唤出相应人设的AI,与之进行深度对话和聊天。

 

 

AIGC相关产品热度不断背后,AI大模型的技术应用日趋成熟。当下,大模型正在成为AI发展趋势,是各大巨头必争的高地。自2020年OpenAI推出GPT-3以来,AI大模型迎来大爆发,全球各大公司开始了大模型的竞赛。目前,包括OpenAI、谷歌、微软、英伟达、百度、华为、阿里巴巴、浪潮等企业纷纷参与其中。

 

 

据报道,2020年到2021年,中国大模型数量从2个增至21个,基本与美国处于同等量级,大幅领先于世界其他各国。在此期间,国内还出现了基于昇腾的鹏程、盘古、紫东、太初、悟道等千亿甚至万亿级别的大模型。

 

 

另据智谷趋势分析,目前全球约有30个千亿级参数的大模型,其中美国15个,中国10个。由于大模型对芯片、算力、电力、数据要求极高,注定是一个极少数国家才能参与的游戏。

 

 

AI大模型步入爆发期,而这次ChatGPT之所以引发行业关注,黄民烈认为原因在于,大模型本身有很大的能力,但过去行业都在解决一些单一技能的问题,而ChatGPT的诞生说明,基本的模型能够衍生出来各种可能的应用场景。

 

 

一款能够解决各行各业问题的AI,在此之前,行业为何缺少这方面的尝试?黄民烈指出,是由于此前时机还没到。“大模型技术、基座模型的发展也就是这一两年的事,同时因为这个东西并不是所有公司都能做,首先,它需要有具备底层模型和算法能力的人,其次需要有大的数据,最后需要资金,而且还要找到好的技术路径。”

 

 

“我们中国的研究者以及企业肯定要去思考这样一些问题:我们能不能做自己的基座模型?能不能做自己的GPT?”黄民烈不认为说我们技术上有多大的差距,差距更多在于大家对这件事的态度。

 

 

他补充道,像OpenAI,他们长期把这事做得非常严肃,从提取数据到新模型,最后给大家提供API,然后再去清洗数据、模型迭代,他们的路径做得非常扎实。而我们部分企业可能更多是做一个模型出来之后开源,随后就没了下文。也有些公司想去做闭环,但确实烧钱,也需要资本支持。

 

 

记者手记:通用人工智能到来前,信任问题待解

 

 

通用人工智能,被视为是人工智能研究的一项长期目标。此次ChatGPT横空出现,被一些人视为向通用人工智能迈进的重要一步。从吟诗作赋到写代码、检查代码,ChatGPT显示出了人工智能从过去的一个AI工具只能解决单一领域问题,向解决多领域问题的转变。

 

 

正如车万翔教授所认为的,它在某种程度上打破了“思想的桎梏”,沿着这个方向,通用人工智能工具,或许确实离我们又更进一步。

 

 

但在此之前,信任度不高,是“ChatGPT”们亟需解决的问题。瑞莱智慧高级产品经理张旭东在接受采访时提示,以ChatGPT为例,其负面风险更多在于这项技术被恶意应用,比如被用于假新闻的生成、故意伪造新闻舆论,对内容生态治理造成影响。另外在某些创作领域,这项技术成为“作弊工具”,造成一定程度上的不公平。而这些风险更多源自使用技术的目标本身,以及技术使用的边界没有被加以管控。

 

 

负面风险的存在也可能加重人们将其作为工具使用时的不信任,进而影响其未来的商业化落地应用,这也将是所用的AIGC(人工智能生成内容)产品共同面临的难题。随着通用人工智能的到来越来越成为可能,如何破除不可信、不可靠难题,也亟待行业回答。

 

继续阅读

ChatGPT与谷歌搜索,孰强孰弱?

2022-12-26

ChatGPT与谷歌搜索孰强孰弱?谷歌搜索是否在遭遇创新者的窘境?搜索的未来走向何方?让我们直入主题——

 

 

一、ChatGPT与谷歌所搜的功能和成本对比

 

 

1. 搜索与生成

 

 

跟ChatGPT相比,谷歌搜索能直接回答的问题较为有限,主要通过查找关键词,不具备语言生成和多轮对话能力,更不可能帮用户生成代码。搜索是通过索引在一个有限页面集合中检索并给予已经存在的内容,ChatGPT可以在理解语义的基础上给出答案,往往很有深度和创意。

 

 

2. 个性化

 

 

谷歌搜索会基于用户的信息做出个性化筛选,因此能给出更好的结果;目前ChatGPT还没加入个性化推荐方面的功能。当然你可以把你的偏好写进提示词里,但这是很费事的,而且效果不一定好。

 

 

3. 真实性

 

 

ChatGPT目前不具备联网能力,即数据源不同,它的答案中没有参考互联网上的最新信息,也没有给出信息来源。ChatGPT经常给出似是而非答案,而且语气非常自信,很容易形成误导。当然,OpenAI已经有基于互联网信息的WebGPT了,但这个功能是基于搜索的,而非独立于搜索,所以WebGPT并不是在颠覆搜索,而是对搜索的改善。

 

 

4. 成本

 

 

成本是不能忽视的,目前每轮对话的成本在几美分,这非常高。谷歌目前每天85亿次搜索,如果这样的需求迁移到ChatGPT,成本要下降超过1个量级才能承受。

 

 

图源:Twitter

 

 

二、搜索的商业模式

 

 

1. 广告与搜索相辅相成

 

 

谷歌两个创始人Brin和Page最早在一篇名为Advertising and Mixed Motives的论文中写到,广告收入通常会为劣质搜索结果提供动机,但他们最终也没有找到更好的商业模式,还是诉诸于广告。

 

 

2. 竞价排名机制是创收神器

 

 

拍卖模式永远是让买家出高价,让回报率最高的广告主出最多的钱/均衡状态下各广告主的边际回报趋同。当然,谷歌的广告机制不仅看出钱多少,也会看广告质量,广告主会有额外的动力优化自身内容。

 

 

3. 广告的体验未必更差

 

 

体验上,有广告的谷歌搜索并不比没有广告的差。2000年的时候谷歌做了一项对比实验,有1%的用户不接收任何广告,后来他们自己忘掉了这个实验,直到2008年发现实验还在进行;最终的结果是看广告的人进行的搜索次数比不看广告的人平均多3%。

 

 

4. 搜索广告ROI很高

 

 

2022年宏观进入下行周期,但谷歌广告增长对线上广告增长的贡献在提升,是下行周期中的首选。

 

 

5. 搜索引擎的壁垒

 

 

很多网站不愿意让谷歌和Bing以外的搜索引擎去爬信息,因此重新建立一个搜索引擎并没有那么容易。

 

 

Chrome是当前份额最大的浏览器,这是很大的优势,打开Chrome默认的搜索就是谷歌。这也是为什么谷歌每年花很大的成本在跟苹果Safari浏览器绑定,确保iPhone的默认搜索引擎是谷歌。美国司法部正在试图打破这一捆绑,我们拭目以待。

 

 

图源:statcounter

 

 

6. 谷歌的搜索也在进化

 

 

谷歌针对商品搜索了做了很大力度的优化,现在美国消费者搜索商品的第一大去处是谷歌,即便亚马逊Prime会员也是先去谷歌。下图为Morgan Stanley对美国消费者商品搜索的调研结果。

 

 

图源:AlphaWise,摩根斯坦利

 

 

图源:AlphaWise,摩根斯坦利

 

 

三、搜索可能的演变方式

 

 

1. 短期可能是两者结合的过渡形态

 

 

比如网页的左边搜索,右边为对话机器人。下图为加入ChatGPT浏览器插件的谷歌搜索效果。

 

 

图源:谷歌

 

 

这是一种比较生硬的结合方式。有人做了更有创意的结合,比如结合你的浏览器页面发出指令。如下图所示的XP1产品,到微软CEO Satya Nadella的LinkedIn主页,给他写一封email说服他使用某款产品,这时GPT大语言模型就可以自动完成这项工作。

 

 

图源:微软CEO Satya Nadella的LinkedIn主页

 

 

XP1推荐的使用方式包括回消息,总结要点,生成推荐文章等等:

 

 

Reply to [[mail.google]] based on [[knowledgebase]]

 

Summarize with bullet-points [[cnn]]

 

Extract [[linkedin]] experience as CSV

 

Generate a twitter thread with emoji to sell [[product]]

 

Generate a 5 sentence bio about [[linkedin]]

 

……

 

 

2. 会出现更多富有创意的AI与搜索结合方式

 

 

可以想见可以玩出的花样还有很多,比如这两天刚上线的基于Twitter的搜索引擎perplexity.ai。这个搜索引擎通过OpenAI Codex将自然语言转化为SQL,查询Twitter的历史数据。

 

 

图源:perplexity.ai

 

 

如果再结合微信聊天历史记录,或者企业内部数据库呢?比如微软在让Bing与Teams和Outlook做深度整合,未来可能有更多的办公工具整合进这样的AI对话功能,搜索/生成的范围将大幅扩展,提升工作效率的同时可能诞生全新的应用领域。

 

 

3. 基于AI对话搜索的推广,需要AI模型能力的进一步提升和成本进一步下滑

 

 

AI模型需要更大的参数量,利用更多的数据,更高的训练算力,更低的单位训练成本。可以期待OpenAI GPT-4以及其他AI研究机构的最新模型,当基础模型做得足够好,训练和部署成本足够低,ChatGPT这类应用才能真正推广起来,尽管ChatGPT引发了热潮,目前的用户量也只是在百万级别。

 

 

除了预训练大模型本身,开发人员也要在微调/prompt提示词上做更多的功课。下一代模型本身的能力可能已经足够强,但需要足够精巧的任务训练激发出模型本身的潜能。Stable Diffusion要给出一个prompt book来给用户演示如何写提示词,因为很多词汇的用法是初学者想不到的。

 

 

搜索也是同理,ChatGPT对提问的理解未必达到了最佳状态,也需要我们“问对问题”,或者让它“try again”“继续”,才能给出想要的答案。这需要进一步的prompt engineering,让模型更理解用户的问题,而不是让用户去学习模型的特点。这更多是对工程能力的考验。

 

 

OpenAI在ChatGPT中加入人类反馈的RLHF方法也值得进一步推广,这可以让模型符合人类的意图(alignment)。事实上,我认为ChatGPT的公测本身就是RLHF的一环,OpenAI从我们与ChatGPT对话中收集反馈,很多用户很有创意的提问方式是在探索模型的边界。从这个角度讲,ChatGPT从发布到现在产生的上千万美金成本是值得的。

 

 

4. 谷歌是生存还是毁灭

 

 

这是经典的创新者窘境,谷歌不是没有类似的技术,比如今年早些时候发布的LaMDA对话AI,甚至让内部程序员怀疑AI已经具备自我意识。有这样的技术却不拿出来应用,我认为谷歌有三方面的担心:

 

 

一是担心AI在道德、伦理、社会等方面的冲击;

 

 

二是当前AI模型训练和部署运行的成本太高;

 

 

三是怕长期颠覆自己的搜索业务,毕竟搜索可以指向页面,可以加入广告,这都是久经考验的商业模式,而如何针对AI生成的对话来产生收入,目前还没有答案。

 

 

谷歌CEO Pichai已经表态:“2023年将成为AI在对话与搜索领域的发展转折点。我们将大步前进,并推出更多新产品。”我们期待谷歌跳出它的舒适圈,积极拥抱最新AI的发展,但同样不要低估组织原有的惯性和束缚。

 

 

5. Bing的机遇

 

 

尽管搭建一个新搜索引擎是非常困难的,但微软的Bing的机会相对更大一些。近期Bing在微软的地位有所提升,微软CEO正在让Bing跟微软的其他产品做深度结合。想象一下搜索引擎Bing + 最新一代大模型GPT4.0 + WebGPT + ChatGPT + Azure云服务,可能诞生全新的搜索体验,毕竟微软是有钱,烧得起的。如果司法部再助推一把,让谷歌搜索和苹果浏览器解绑,Bing趁虚而入的机遇将更大。

 

 

图源:statcounter

 

 

6. 无论谷歌搜索是否被取代,搜索的体验都将被重塑

 

 

从最早的门户网站,到后来搜索的崛起,到再后来的推荐算法,信息的传播从最简单的信息汇聚(门户),演化成人对信息的查找(搜索),再到信息精准的找人(推荐)。AI时代的搜索实质上是信息生成。

 

 

根据科技博客Stratechery的观点,一条信息的产生经历了创意 - 实现 - 复制 - 分发 - 消费的过程。文字书写的诞生将信息的分发与消费解绑,即故事的讲述者只要留下文字,不需要面对面讲述故事,即可传播信息。

 

 

印刷术让信息复制的边际成本大幅下降,带来了知识的广泛传播,文字、语言的标准化。互联网让信息的分发边际成本大幅下降,报纸等传统媒体被颠覆,每个人都可以几乎零成本获取海量的实时信息。最终,AIGC让创意到实现的边际成本和门槛大幅降低,我们可以通过自然语言生成优美的图片,生成关键的答案。

继续阅读

在世界杯上,这家公司用科技和数据打击假球

2022-12-05

2022年卡塔尔世界杯从11月21日至12月18日23时的决赛,将持续29天。中国体彩中心的官方数据显示,本届世界杯足球彩票第一周销售额就已达169亿人民币,超过上一届俄罗斯世界杯销售总额445亿的三分之一。

 

目前,全球超过80个国家和地区涉足博彩业。在本届世界杯期间,全球投注者的赌注预计将超过1,600亿美元。

 

由于博彩市场的流动资金太过庞大,国际足联专门聘请了总部位于瑞士的体育数据和技术公司Sportradar来监督每一次投注,并留意其中是否存在违规行为。

 

01

被操纵比赛的数目

多到让人无法想象

 

Sportradar表示,今年已经发现超过700场足球比赛被球员或官员直接操纵。

 

Sportradar诚信服务部门的董事总经理安德烈亚斯·克拉尼奇 (Andreas Krannich) 把操纵比赛的球员和官员比作进行“适时”股票交易的华尔街高管。Sportradar表示,今年已经发现超过700场足球比赛被球员或官员直接操纵。

 

操纵比赛就像内幕交易。”安德烈亚斯·克拉尼奇说,“有人掌握了内幕消息,他们就会在这个消息上押注。”

 

但世界杯中整整64场比赛的监控,不仅仅只是由Sportradar完成。根据ESPN(华纳媒体旗下有线体育频道)的率先报道,国际足联在今年组建了一个由Sportradar、联邦调查局 (FBI) 、国际刑事警察组织 (INTERPOL) 和国际博彩诚信协会 (IBIA) 组成的诚信特别工作组

 

足球比赛被操纵的火热现状,可能看起来很匪夷所思,但事实的确如此。就目前而言,卡塔尔世界杯上正在拼搏的球员中,至少就有一名曾经被指控操纵了一场常规赛。

 

02

「被抓案件层出不穷,

可癌细胞还在悄悄扩散」

 

最著名的操纵比赛的例子发生在2016年11月12日。在2018年世界杯预选赛南非和塞内加尔之间的一场比赛中,加纳足球裁判约瑟夫·兰普提 (Joseph Lamptey) 判给了南非一个虚假的点球。罚球的原因是手(足球比赛时球碰到上肢造成的犯规),但是球明显打在了塞内加尔后卫卡利杜·库利巴利 (Kalidou Koulibaly) 的腿上。最终南非以2比1获胜。

 

几天后,Sportradar、全球彩票监测系统 (Global Lottery Monitoring System) 、Starlizard体育博彩咨询公司和Genius Sports公司提交的报告称,体育博彩市场曾显示出“不规则”的运动,并有证据表明,赌徒们提前知道了这场球赛的比分。

 

国际足联的司法机构随后对约瑟夫·兰普提处以终身禁赛,国际体育仲裁法庭也裁定他“非法影响比赛结果”以及“使相关赌注成功”的罪名。

 

2005年,德国一家法院也以参与一起操纵比赛的丑闻为由,判处足球裁判罗伯特·霍伊泽 (Robert Hoyzer) 两年半监禁。

 

在一场德国杯的比赛中,罗伯特·霍伊泽判给帕德伯恩队两粒点球,从而帮助他们击败了汉堡队。来自克罗地亚的职业赌徒兼酒吧老板安特·萨皮纳 (Ante Sapina) 组织了这个骗局,并付给了霍伊泽6.7万欧元,让他操纵9场比赛。

 

今年在奥地利,共有包括足球运动员、官员和赌球者在内的15人因涉嫌在2019年至2021年期间操纵地区联赛的至少19场比赛而被捕。

 

图片

 

足球是操纵比赛者最容易瞄准的目标,因为它是世界上最受欢迎、赌球最多的运动。与之相关的数据差异很大:根据IBIA的一份报告显示,全球受监管的博彩市场每年因假球行贿损失2,500万美元。但考虑到体育博彩公司在2020年创造了近700亿美元的收入,这只是一个微不足道的数字。

 

根据欧洲刑警组织 (Europol) 发布的一份报告称,一些有组织的犯罪集团还会利用假球来为不法所得洗钱。据估计,这些团伙每年从假球和赌博中获利1.2亿欧元。

 

“对于操纵比赛的人来说,足球是最重要、最具吸引力的运动。”安德烈亚斯·克拉尼奇说,“平均而言,我们预计卡塔尔世界杯每场比赛的赌注将超过10亿欧元。”

 

虽然假球在体育界是一个相对较小的问题,但它正变得日益严重。

 

去年,Sportradar发现了500场可疑的足球比赛,而今年截止到11月中旬,该公司就已经发现了700场。而该公司在所有体育项目中总共发现了1,100比赛被操纵,远远高于去年的903场。

 

“我们从未见过这么高的数字。”安德烈亚斯·克拉尼奇说,“这种癌正在扩散。”

 

 

03

假球越来越「真

数据才是关键指纹

 

 

假球并不是指一名球员或一名裁判丢掉整场比赛,它比那更加微妙。如今,大多数操纵比赛的丑闻都是关于操纵一局比赛或点差。

 

“现在的假球并不意味着你故意输掉比赛。”安德烈亚斯·克拉尼奇说,“那很无聊,也很愚蠢。”

 

队长、守门员和后卫是最容易被操纵比赛者盯上的球员,因为他们在球场上扮演着不可或缺的角色。欧洲刑警组织的报告称:“一个简单的错误很容易导致丢球而不会引起怀疑。”

 

“如果你处于劣势,你知道自己无论如何都会输掉某场比赛,所以输两球和输五球有什么区别?”安德烈亚斯·克拉尼奇说。

 

安德烈亚斯·克拉尼奇的团队共有60人,分布在美国、南美、欧洲和澳大利亚,他们及其人工智能软件每年会在90个体育项目的89万场比赛中处理350亿次赔率变化。

 

这个团队的算法将标记出投注模式中的不正常现象,比如投注账户注册的激增和资金的大规模转移——这都是进行中的操纵比赛的迹象。

 

安德烈亚斯·克拉尼奇说,当他的系统发现一个不寻常的模式时,他可以通过观察投注者对哪只球队下注最多来告诉你哪支球队会赢。

 

他开玩笑地说道:“要么我是耶稣,要么就是我们知道如何处理这些参数。我们只关注事实,而事实就是资金流动。金钱从不说谎。”

 

04

体育大数据服务

作用远不止监控比赛

 

在这家市值32亿美元的公司的业务中,体育博彩监控只是一小部分。Sportradar由企业家卡斯滕·科尔 (Carsten Koerl) 创立,它还会帮助体育联盟汇编比赛中的统计数据,并将其分发给媒体公司和博彩运营商。

 

在Sportradar于2021年9月在纳斯达克上市后,担任CEO的卡斯滕·科尔凭此成为了亿万富豪。Sportradar拥有1,700多家客户,其中包括DraftKings、FanDuel和Flutter等900家体育博彩客户,以及150多家体育联盟合作伙伴,包括国际足联、NBA、MLB、纳斯卡、ITF和NHL。

 

其他一些亿万富豪也拥有该公司的少数股权,如篮球巨星迈克尔·乔丹 (Michael Jordan) 、马克·库班 (Mark Cuban) 和泰德·莱昂西斯 (Ted Leonsis) 。公司去年的营收为5.61亿欧元,息税前利润和摊销前利润为1.86亿欧元。■

 
 
 
 
 

世界杯比分竞猜

 
 
 
 
 
图片
 
 
 

激情世界杯,谁是竞猜王?2022年卡塔尔世界杯现已开赛近两周,1/8决赛迎来第二个比赛日。

 

欢迎福布斯的读者朋友参与本期的世界杯比分竞猜活动,今天我们关注的是【12月4日23:00,法国VS波兰】

 

关注福布斯中国公众号,后台发送本场比赛你预测的比分,即可参与我们的互动。最先猜对比分的用户,我们将送出一份「 2023开年刊杂志一份 」(重复竞猜比分无效)。

 
示例
 
图片
 

福布斯

福布斯中国集团是一家集咨询、社群于一体的企业。集团秉承企业家精神和创新精神,坚持专业、公正、创新和进取的价值观。

5318篇原创内容

公众号

 

福布斯中国独家稿件,未经许可,请勿转载
头图来源:视觉中国
 
图片
关注《福布斯》微信公众号
精彩资讯永不错过

福布斯

福布斯中国集团是一家集咨询、社群于一体的企业。集团秉承企业家精神和创新精神,坚持专业、公正、创新和进取的价值观。

继续阅读

像玩游戏一样学驾驶,汉产智能模拟器“驶入”全国驾校

2022-11-20

长江日报大武汉客户端11月19日讯(记者柳莺 通讯员田甜)在室内,像玩游戏一样练车是种怎样的体验?11月19日,2022中国5G+工业互联网大会现场,武汉木仓科技股份有限公司(以下简称“木仓科技”)展位,两台“模拟座驾”格外吸睛。

 

 

随着汽车不断普及,驾培市场越发火热。练车需要排队,有时候几个人共用一台车;遇到天气不好,练车也变成一件难事。

 

 

“研发智能模拟器的初衷就是解决驾校练车痛点,同时,让学驾驶变成一件有趣的事情。”据现场工作人员介绍,坐上这台模拟器,可以身临其境感受上路体验,练习后的相关影像可通过5G网络实时传输至手机里,学员可通过录像查看自己的问题,目前产品已经进入国内100家驾校。

 

 

现场,一位女士坐上模拟器开始体验,当她不小心撞到路边台阶时,只听“砰”一声响,模拟器如同真车般晃动起来,达到真实练习效果。

 

 

木仓科技展位,市民体验智能模拟器。

 

 

据介绍,“阿尔法幻影”智能模拟器核心操作部件采用真车配件,高度仿真真车驾驶舱,通过对指定路段进行取样和建模,能为学员提供尽量真实的练车感受;同时,“阿尔法幻影”还能提供真车不能体验的模拟练习场景,如特殊天气、应急事件、交通事故等道路安全教育课件,帮助学员深刻掌握安全驾驶技能,养成良好驾驶习惯。

 

 

木仓科技创立于2011年,是一家专注于互联网学车和智能驾培领域的移动互联网公司,也是小米投资的第一家互联网公司。

 

 

公司以驾考宝典为源头,从机动车驾驶培训市场向汽车消费市场延伸服务,出品了车友头条、买车宝典等多款汽车应用APP,研发了智能教练“阿尔法银河”、智能模拟器“阿尔法幻影”、高精度路考仪、驾校智慧管理 PaaS平台等多款智能新品。目前,公司旗下龙头产品驾考宝典APP月活跃用户超2000万,入驻认证驾校1万多家,累计注册教练员超过100万名,其中认证教练10万多名。

继续阅读

全球首创AI巡检漏水技术!工研院助花东震后灾区快速复水

2022-11-15

为协助花东地震后灾区快速恢复供水,工研院开发出全球首创“智能管网行动泄露快筛预警系统”,只要3秒就能识别水管是否发生泄露,并在花东地震后协助台湾自来水公司查出灾区27处供水管线异常,其中25处诊断正确,识别准确率高达92.5%,降低误开挖的人力与时间成本。

 

 

随着城市发展不断扩张,水管部署及智能检测需求日益攀升,根据IMARC(the International Market Analysis Research and Consulting Group)市场研究公司调查报告显示,2027年全球水管线泄露检测市场将达到31亿美元。

 

 

工研院开发“智能管网行动泄露快筛预警系统”,推动智能漏水音辅助识别系统本土化,并应用在花东地震灾后的管线抢修,未来将进一步应用在厂区消防管线、废水管线、工业管线(油气)、瓦斯气管等,声波信号强度相对高的高压地下管线。

 

 

工研院团队已与瑞士检漏大厂GUTERMANN的台湾总代理金成科技签署先期技术合作,集成设备系统,协助台湾抢进国际检测市场。

 

 

工研院材料与化工研究所所长李宗铭表示,已有与台湾自来水公司合作水泄露检测,花东地震发生后,当得知灾区面临地下水管破裂、无水可用,需要加速检测水管泄露处时,团队紧急派员前往花东援助。

 

 

这项技术为全球首创结合本土化漏水诊断设备截取现场动态音频,通过AI人工智能漏水音诊断模型,集成5G、AIOT资讯同步进行泄露事件识别与漏点定位,采面-线-点由大到小管网检漏策略概念,快速精准管网泄露定位技术,可应用于金属、PVC等复合渠道漏水检测。

 

 

AI巡检漏水技术除协助抢救灾区水情外,也已与台湾自来水公司合作,在桃竹苗地区有约300处的开挖验证案例,有效避免缺水导致产能损失问题,并成功应用在工研院中兴院区检测,经检漏修复后,从最高每日泄露量886吨减少至26吨,相当于节省97%的水量,具有相当良好的成效。

继续阅读

AI虚拟人将填充元宇宙?

2022-10-10

它可能看起来像是科幻小说中的东西,但它是真实的。人工智能的进步带来了新的发展:完全自动化的“数字人”。这些人工智能驱动的虚拟角色能够进行自然对话,并且可以通过编程来拥有独特的个性。现在,一批初创公司押注这些角色可以在虚拟世界之外发挥作用,甚至可能迎来一种“数字劳动力”,被编程来处理各种非物理任务,例如销售产品、为客户提供服务支持服务和教学课程。

 

 

想象一下,您经营一家人力资源公司。候选人无需要求您的客户填写描述他们正在寻找的员工类型的表格,而是可以简单地与虚拟顾问交谈,该顾问可以根据对话推荐新员工。您可以更进一步,为您的虚拟顾问增添迷人的个性,进一步提升客户体验。

 

 

但是你怎么能对个性进行编程呢?解决这个问题的公司之一是InWorld AI,这是一个开发角色创建系统的团队,主要用于游戏和虚拟世界。该系统允许任何技能水平的用户开发自己的自定义角色并赋予他们独特的个性。InWorld 首席执行官 Ilya Gelfenbeyn 表示,公司的目标是提供一个可访问、易于使用的“引擎”,可以将通用化化身为数字人。InWorld 的角色创建者会询问用户有关他们的动机、爱好和对话风格的问题,以了解他们的个性。创作者甚至包括多个可以调整以确定性格特征的滑动量表,例如角色的内向与外向程度。创建角色后,用户可以通过文本与他们的创作聊天。

 

 

为了将他们新创建的 AI 与头像配对,用户可以将他们的 InWorld 角色集成到 Unity 和 Unreal 等免费使用的游戏开发引擎中,或者集成到特定的头像创建服务中,例如2022 年 8 月宣布的 Ready Player Me它在 B 轮融资中筹集了 5600 万美元。Gelfenbeyn 说,InWorld 的技术除了在虚拟世界中的实用性外,还有多种现实世界的应用。例如,CEO 说人们可以使用 InWorld 来排练诸如解雇员工之类的情况,或者他们可以使用数字人来主持公司培训练习。

 

 

虽然 Gelfenbeyn 专注于让任何人都能轻松微调其 AI 角色的个性,但数字人物公司Soul Machines的首席执行官兼联合创始人 Greg Cross决心让数字化身尽可能真实。Soul Machine 的化身超逼真,说话时具有可见的毛孔和逼真的嘴巴动作。克罗斯说,使用他的超现实数字人而不是聊天机器人或语音助手的主要好处是能够创建面对面的互动。“例如,如果您正在与数字汽车销售员交谈,我们可以将三辆汽车放在屏幕上,然后确定您正在看哪一辆,”Cross 说。“从那里,数字销售人员可以根据您的兴趣进一步定制对话。”

 

 

除了将数字人用作电子商务平台上的销售助理或客户服务提供商之外,Cross 认为他们还可以形成一种全新产品的基础:官方授权的名人“数字双胞胎”。克罗斯说,该公司已经制作了 NBA 球星卡梅罗·安东尼和黑眼豆豆乐队主唱 will.i.am 的数字双胞胎。如果 Cross 是对的,那么贵公司有朝一日可以聘请这些“数字双胞胎”作为贵公司基于元宇宙的品牌大使。

 

 

不难看出为什么有些公司看好高度可交互的数字角色的概念。InWorld 最近被选为华特迪士尼公司 2022 年加速器计划的一部分,但 Gelfenbeyn 对他的公司是否有任务通过他们的人工智能技术重建任何品牌的标志性角色保持沉默。“我们是虚拟角色公司,显然迪士尼是顶级角色公司,”他说。“这就是我现在真正能说的。”

继续阅读

乔·罗根对话扎克伯格:未来十年 VR/AR 能做到什么

2022-09-16

去年底,美国杂志《新共和》把脸书创始人马克·扎克伯格评选为「年度恶人」,杂志编辑在评语里写道:「扎克伯格在一场冗长且令人生厌的演讲中提出元宇宙的概念,完全不顾人们在非虚拟生活中真正想要做什么,更不用说在虚拟生活中了。」

 

 

众所周知,欧美人讨厌马克·扎克伯格。讨厌他那机器人一样的外形,讨厌他年纪轻轻就是亿万富豪,讨厌脸书对媒体的控制,讨厌 Meta 一年烧掉上百亿美元追求虚无缥缈的元宇宙——甚至就连因此受益的 VR 用户和从业者,对扎克伯格的印象也算不上太好。

 

 

在信奉技术的极客眼中,扎克伯格就是一个充满铜臭味的投机商人,尤其当他在 2019 年选择走轻量化路线,做 VR 一体机、元宇宙,并与卡马克为代表的 Oculus 技术派产生分歧时,这种质疑也达到顶峰。这也是为什么前段时间扎克伯格发一张简陋的元宇宙自拍,会在欧美引发山呼海啸般的嘲讽。

 

 

你可以质疑 Meta 的元宇宙能否成功,但对一年花 100 亿美元「学费」的扎克伯格,不能否认的是,今天他依然站在这个行业的最高处,拥有俯瞰 VR/AR 和元宇宙最清晰的视野。

 

 

或许是为了挽回自己「手滑」,或许是为即将发布的 Quest 2 Pro 暖场,近日扎克伯格做客全美最火的播客栏目《罗根体验秀》,与 UFC 大嘴评论员乔·罗根进行了一场两个多小时的对话。

 

 

在这期播客节目里,扎克伯格对新 Quest、VR/AR 未来的技术路线、元宇宙、神经接口、VR 社交和 VR 办公等行业的关键问题,详谈了自己了解的现状和看法。与发布会等公关场合上打官腔不同,这场与罗根的对话,扎克伯格讲出了不少干货。

 

 

以下为乔·罗根对话扎克伯格部分内容节选,由极客公园编译整理。

 

 

01「我们在做的是一步一步增加在场感」

 

 

乔·罗根:你的新 Oculus 很棒,令人印象深刻。

 

 

扎克伯格:是的,10 月份发布。我们将在即将到来的 Connect Conference 上讨论它,我对此非常兴奋。

 

 

乔·罗根:戴上它的时候非常有趣,我面前有一个化身,那是一个女异形(alien woman)。当我移动我的嘴时,女异形移动她的嘴。当我左右移动我的眼睛时,她跟着我的眼睛移动。当我做一张愤怒的脸时,她也作愤怒状……太不可思议了。你可以看到模仿过程,它以一种令人毛骨悚然的方式直接模仿人类,但这很酷。

 

 

扎克伯格:对我来说,这些东西都是在帮助人们建立连接。只是我开始思考,人们使用技术来感受彼此存在的最终表达是什么?当它不是手机,也不是电脑时。

 

 

比如你如何获得这种真实存在的知觉,就像你和另一个人待在一起一样,对我来说这是虚拟现实,乃至最终增强现实要实现的目标。你只需要在接下来的十年里运行技术路线图,一步步解锁它。而对于 10 月份即将推出的下一款设备,有一些重大的功能,像你所说的,本质上是关于社交存在(social present)。

 

 

新版虚拟现实中有某种眼神交流的能力,让你的脸被跟踪,这样你的化身就不仅仅是静止的东西。如果你微笑,如果你皱眉,或者你撅着嘴,不管你的表情是什么,实际上都可以实时转化给你的化身。就像人们待在一起那样,身体语言比口头交流更多。

 

 

乔·罗根:关于面部追踪你说得很对。打个比方,如果你用FaceTime 通话,你是看不到对方的眼睛的。如果你看着手机的镜头,那么你只是在向上看;而如果向下看屏幕上的人脸,你并没有和对方进行眼神交流。但是如果有了 VR 的化身,就能够重现真正的眼神交流。

 

 

扎克伯格:是的,这将是第一次真正意义上这么做。今天,通过技术我们可以打语音电话和视频电话,这很棒。因为如果你现在不能和某个人待在一起,能够看到他们的脸是件好事。但是当你在视频通话时,你不会觉得你真的和对方待在一起,即便你有信号可以获得信息,可以看到他们的脸。

 

 

在整个过程中,你都在试图说服你的大脑,你真的和他们在一起,但你的大脑知道:在更深的维度上,你实际上并没有和对方待在一起,你只是得到了一些诸如他们是谁、长什么样子的信息。

 

 

我认为,虚拟现实本质上解决的是:虽然你不在场,但让大脑相信「它」真的待在那里。要做到这件事需要解决很多意识层面的问题,每次我们做出一个新的版本,我们只是试着打破一个又一个的障碍。

 

 

很明显第一个障碍,就是要有一个头显,可以环顾四周。为此需要做到什么?你的眼睛基本上每五毫秒刷新一次。所以如果你转过头,而图像没有在五毫秒内刷新到你看的地方,那么你的视觉系统和你的前庭系统以及耳朵里的平衡感之间就会产生巨大的不匹配,人们随之感到身体不适。

 

 

然后我们有了手,这个事情很有趣。一开始我们想展示整个手臂,因为仅仅看到你的手有点奇怪。但事实上,你的大脑完全愿意接受看到你的手而没有长长的手臂,因为是你的手去试图操纵东西。另外,如果我们的插帧技术使得手臂位置翻转错位,你会感觉:啊,我的手肘断了,这样就会出问题。

 

 

所以尽管只展示出有限数量的信号(signals),但是他们在模拟现实的正确度上越来越好。接下来需要做的只是随着时间增加信号。

 

 

在之前的版本中,眼神交流全部只是 AI 模拟的,实际上我们不知道你们什么时候有眼神交流,因为我们没有追踪眼睛。现在这个版本,我们希望模拟的很多不同信号在向前演进。你将能够有真实的面部表情,并直接映射到你的化身。

 

 

总的来说,有这样一个路线图:就是关于你如何传递这种真正的在场感(presence),就像你和另一个人待在一起一样,不管你实际上在哪里。

 

 

乔·罗根:这令人印象非常深刻。(头显)追踪的方式,并不是通过把追踪器放在身上,但你认为最终会是这样吗?会像一个玩家必须要穿戴上触觉反馈套装(haptic feedback suit)才能进入游戏吗?这样,你就会完全身临其境。还是说你认为现在这种方式可以准确地模仿你身体的运动,而不需要你穿什么?

 

 

扎克伯格:我认为穿戴装备来进一步增强体验是有机会的。我们已经用触觉手套做了这些实验,如果你触摸一个数字世界里的物体,比如把球从一只手扔到另一只手,你可以从身体上感觉到你手里的球。这很酷,但我想设计成一种你不需要戴手套的方式。

 

 

所以今天有两种主要的追踪模式,其中一种是由内而外(inside-out)的追踪,你戴着头显,它会追踪你的动作、手臂,最终它还会用人工智能模型追踪你的腿。这种模式最大的优势是只用头显就可以做到这一切,而不需要有很多不同设备,甚至不用控制器。同时,头显会变得更小、更便携。你不会想有一个装置需要配 10 个部件。

 

 

也许有时候你想有那种沉浸感超强的体验,或者想在家里有这种体验,但我认为最终人们只想有可以方便携带到任何地方的产品,不管是在飞机上,还是在办公室工作,或者去咖啡店什么的。为此,你真的只想让它在一个设备上工作,所以最好只是一副眼镜或类似的东西。

 

 

VR 和 AR 是两种不同的发展路径,但它们显然从根本上是相互关联的,共同构成了虚拟现实。所以今天能继续构建 Quest 2,它现在相当流行,做得很好。并且,我觉得新版本的推出,会是一个相当大的进步。

 

 

Oculus Quest 2 | Meta

 

 

我们研究了很多新技术集成其中,但同时,它建立在几十年的先进技术和显示器技术基础之上,包括来自电视、笔记本电脑和手机的技术。其中一些显示技术的面市,本就已经建立在过去数十年的创新之上。

 

 

AR 是一个非常不同的野兽,因为你想得到的真的不是头显,你想得到一副看起来正常的眼镜。这绝非像产品线框图那么简单,因为你需要在里面装一些电子设备。大体上需要有一台电脑、一个扬声器、麦克风、电池和激光投影仪在里面,然后是显示器。

 

 

我们和许多人看中一种叫做光波导的技术,它与屏幕完全不同,因为它是一个特殊的屏幕,你在看一个东西时,基本上你就像在看屏幕上的所有像素。波导的不同之处在于它实际上是薄得透明的,所以你可以通过它看到世界,然后它会显示全息图,并能够成像放置在不同景深空间。

 

 

02 AR 将让电影、游戏不被限制在长方形的屏幕里

 

 

乔·罗根:作为一种技术,什么是光波导呢?

 

 

扎克伯格:它们可以由不同的物质组成,塑料、玻璃这样不同的基材制成。同时,它们以不同的方式被蚀刻或打印,这里尚且存在一个大的争论。现在有很多研究正在探索:哪种方法可以创建具有正确属性的波导?因为希望为增强现实提供足够宽广的视野。

 

 

所以你可以想象五年后我们会有这样的对话。我人不在这里,而你戴上我们的眼镜后,全息图版的马克·扎克伯格在这里。

 

 

这不仅仅是以一种全息图的方式运行,还有所有这些不同的维度所带来的在场感。就像,如果想远程玩扑克,我们可以玩全息图,我发一副全息图的牌,你戴着眼镜,可以身体力行地拿起全息图扑克,然后拥有一个扑克之夜,我们这些朋友就身处你物理空间的周围,只不过其中一些人以全息图的形式在这里,这实际上有点疯狂。

 

 

我喜欢做的一个思想实验是:思考世界上我们拥有的实体东西有多么少是真正需要实体存在于物理空间的?

 

 

显然,像椅子这样的东西是需要是以实际物体的形式存在的,但是大多数娱乐类的东西,不仅仅是纸牌,还有游戏、大多数媒体、电视,很可能不需要实体。它就像一个应用程序,把全息图放在那里当电视,我们戴上眼镜看你想看的任何东西。

 

 

这些东西现在被限在长方形的屏幕里,因为有很多限制,比如生产制作的物理学原理,但是在未来,会有一些高中生或大学生开发应用程序,他们会很疯狂,疯狂的东西会被创造出来。所以你最终会建造一种所有都能实现的东西。他们是眼镜。

 

 

乔·罗根:那么这些眼镜现在有没有在生产或开发中?就像你谈论的这种技术,你可以看到不存在的东西,在那里你看地图、看视频,所有这些都在一个眼镜框架里的小电脑上。它们现在已经存在了?

 

 

扎克伯格:我认为在接下来的三到五年里,会得到看起来像完整版的东西。终极的 AR 体验就像,你有一副看起来正常的眼镜,可以呈现全息图,这样你就可以随时随地与人互动。但它一开始也会非常昂贵,需要一段时间才能降到数百美元。

 

 

但是如果先放松一些限制条件,比如外形因素,你会开始看到一些版本。先有一个头显而不要求看起来正常的眼镜,那这就是 10 月份即将上市的新设备,将混合现实纳入了虚拟现实中。

 

 

混合现实是指你在虚拟现实的背景下看到周围的物理世界,它不是通过波导发生的,而是通过设备上的摄像头来捕捉世界,然后实时转换成立体图像。对于 3D 成像,因为我们有两只眼睛,两只眼睛看到的(视域和图像)略有不同,电脑把它们呈现在一起,而后你可以在上面叠加数字化的物体。

 

 

比如,当我进行击剑格斗的时候,我的人和剑都是数字化虚拟版本,否则能看到的只有大厅。所以你可以看到那些开始构建的 AR 体验,VR/AR 的体验优先于头显的外形要求(轻便)。这是行业正在探索方向之一。

 

 

另一个方向是必须以头显外形为优先级,因为想要拥有看起来像普通眼镜的东西。(然后去思考)今天我们能装在一副普通眼镜里的最先进的技术是什么?有点像从侧面出发。

 

 

在智能眼镜方面,我们和雷朋(Ray-Ban)合作制造,它们会是有史以来最畅销的智能眼镜。我们会继续开发新版本,但大体上,你可以得到一副外形像雷朋旅行者的智能眼镜。现在,它里面已经有电话、扬声器,可以拍照和录像;通过语音命令,你可以把这些发布到 Instagram 上。

 

 

雷朋旅行者 | Meta

 

 

乔·罗根:用这些东西拍摄的图片质量如何?

 

 

扎克伯格:非常好。我没有弄错规格的话,它没有今天的后置摄像头那么好,看起来像前置摄像头。它可以适配安装在眼镜的边角。

 

 

乔·罗根:如果人们开始用它拍摄,会不会带来隐私问题?

 

 

扎克伯格:会的,所以我们做了设计,它上面有灯,无论任何时候都在那里,我认为这实际上是非常重要的一部分。

 

 

乔·罗根:所以能在灯上贴一条胶带吗?

 

 

扎克伯格:理论上应该可以。

 

 

乔·罗根:所以角落里的那个小东西是灯吗?

 

 

扎克伯格:不,那是 Lastolite(丽图徕)在闪烁,它是一个非常活跃的指示器,如果你把一块胶带放在上面,它可能会干扰相机。

 

 

乔·罗根:这些「旅行者」智能眼镜和「旅行者」普通眼镜的大小一样吗?还是会有更粗的镜框?

 

 

扎克伯格:稍微粗一点,但重量差不多。之所以我们和雷朋合作,是因为他们对眼镜设计了解很多,非常敏锐,而这不是我们的专长,和他们一起工作学到了很多东西。比如在限制条件上,他们了解:在避免过重且长时间佩戴不舒服的前提下,它实际上可以做多大。雷朋是一家伟大的公司,到目前为止的合作非常棒,期待和他们一起开发更多的东西。

 

 

大体上就这两条技术路线。尽可能加上所有的功能,但是在一个比你想要的外形更大的设备上;又或者,每一两年把更多的技术加到你想要的外形上,让它成为一个更棒的设计。最终,这些东西会融合,你既会得到功能,也会得到外形,但是在一段时间内它仍然有点贵,然后在快速推进几年后,会成为主流。

 

 

但即使是今天的 VR,也做得很好。我们不会发布准确的销售数字,但它的量级与 Xbox、Playstation 或其他类似平台差不多。

 

 

当我们开始做的时候,游戏是 VR 的第一个场景。但是很快,VR 会增加不同的场景。因为人们做的主要事情,实际上是交流,这是我们在生活中获得意义的方式——与他人互动,所以这是 VR 肯定会发生的事情。如果你看看现在的顶级 App 和 VR,大多基本上是社交元宇宙,可以和朋友一起在 App 里闲逛,而不是以任何特定的游戏为中心。

 

 

从游戏开始,VR 的场景还在不断发展,它将成为一个巨大的社交平台,可以和朋友一起泡在里面,并身临其境。这些场景很疯狂,比我想象中发生的更早。

 

 

一个重要的场景是健身,VR 就像适于健身的第一个物理计算平台(physical computer platforms)。当你在用电脑时,你不喜欢四处走动;当你用手机时,你可能可以四处走动,但它有点尴尬,因为你看着的是小屏幕。但像 VR/AR 真的被设计成你能够四处走动、做事、与世界互动,这对我来说真的很重要。我讨厌坐在桌子前,那让我感觉无精打采,在浪费我的一天。

 

 

在这方面,现在已经有几家公司有一些很棒的内容,比如 Peloton 专门为 VR 打造的体验。Peloton 卖给你自行车或跑步机,然后你购买订阅,就会得到具有真实体验的课程。还有几家公司在做有氧运动、舞蹈的、拳击的课程。但是你不需要买自行车,你只需要你的 Quest 头显。

 

 

一旦你有了头显,你就可以订阅这些公司的课,在里面做不同的事情、健身,我觉得这相当酷炫,很狂野。我们都知道这些事情长期来看一定会发生,但它现在就已经发生了,比我想象的要快,这真的很酷。

 

 

03 VR 的终点不一定是《黑客帝国》

 

 

乔·罗根:如果你做拳击游戏,你会立即意识到这是一个非常好的身体锻炼。当虚拟拳击手向你走来、在拳台上向你挥拳时,你移动你的头,会得到非常高的心率,消耗了很多能量,这是非常好的有氧运动。并且,你发现你的脚会疼,因为一直在旋转和移动,一直在改变姿势,试图摆脱拳头。而当你继续解锁更高级别的游戏时,一些游戏比如对手会变得更加棘手,而这样的体验令人兴奋,也很有趣。最终你离开游戏时,你真的筋疲力尽了,这就是一次非常好的身体锻炼。

 

 

扎克伯格:是的。这就是整个平台的本质,也是我喜欢它的原因之一。但是,那些甚至没有试图成为健身 App,只是碰巧成为锻炼身体的项目。

 

 

乔·罗根:VR 能让两个人今晚来一场击剑比赛,这真的很有趣。在一场虚拟击剑比赛中,你面对一个方向,大约 30 英尺远,我面对另一个方向,我们甚至没有面向对方。但这都没关系。你在孟加拉国,我在罗马,我们依旧可以一起玩。但,VR 能让拳击做到这一点吗?

 

 

扎克伯格:击剑 Demo 是由我们内部团队制作的,因为我们还没有发布新设备。所以,为了让硬件发挥作用,我们自己开发了这个 Demo。

 

 

但是,拳击游戏是由其他游戏开发者、不同的开发者制作的,我不确定他们中是否支持多人游戏。我玩过的都是单人游戏的形式,确实让拳击战斗变得更刺激,我真的很喜欢《Creed》(注:一款拳击 VR 游戏)。我觉得他们能做多人游戏模式,而且也没有什么因素会阻止他们这样做。所以我想随着时间的推移,他们会增加这个功能。

 

 

乔·罗根:这似乎是一个明智的举动。如果我们谈论武术,比如泰拳等等,我认为柔术会是一个真正的问题,因为你必须在身体上有东西可以抵抗。但如果你能想做一个泰拳模式,唯一要解决的问题是当你接触到物体时,物体会改变。物体会随着人的位置和动作而改变。你可以逃脱,也可以不逃脱。相比之下,拳击在这方面非常好,这可能是虚拟现实中最好的格斗运动,因为你甚至不需要打任何东西来感觉自己好像被拳击中,你的屏幕会亮起,就像你感觉自己被击中一样。

 

 

扎克伯格:是的,做一个挥拳头的 VR 游戏更容易。柔术的话如果你没有一个特制的垫子或者其他东西,想要模拟出翻滚或者其他动作,并把人体的真实重量加进去,其实很困难。

 

 

乔·罗根:你是否想象有一天玩游戏时身体真实的感觉会变得无关紧要,因为一切都会发生在你的脑海中。不管是触觉反馈,还是其他类型的输入,即使没有真实的物体,体感却都跟真实存在一样,就像《黑客帝国》。这会是最终的发展方向吗?

 

 

扎克伯格:我不知道。但我认为我们的很多体验都是基于我们的身体,而不仅仅是我们的思想。

 

 

的确有一种哲学思想,认为人类的存在只是大脑(我思故我在)。但我一点也不认同,我不知道你如何感知事物,但我觉得我的活力和情绪,以及我与世界的互动方式,都是基于身体。随着时间的推移,通过你的大脑模拟现实世界也许是可能的,但我不相信只是大脑在起作用,我认为在所有的体验中,身体是同样重要的。

 

 

电影《黑客帝国》

 

 

乔·罗根:我同意。但我也在想,如果技术走得更远,更身临其境,更有说服力,「恐怖谷」被连接起来,突然之间你有了一个真实生活的体验,不管这是通过某种神经链接还是其他新技术来欺骗大脑进入实际体验,这难道不是未来的发展方向吗?

 

 

你可以在没有经历的情况下获得体验,这并不是否定真实体验的美,也不是说我们不再有真实的体验,而是如果你想获得真实的体验,去到另一个世界,我们可以戴着 Oculus 去那里。你可以有一个非常逼真的 3D 镜像,这太酷了。就像你认为最终通过技术的发展,可以做到让我们今天这样的对谈,在不在同一个房间都没有任何区别。

 

 

扎克伯格:推测一个事物发展的极端状态这很有趣。但我认为对技术演进更加合理的思考方式是,有些东西比其他东西更容易模仿或替代。就像我们之前谈到的 VR 健身,拳击内容现在就可以做得很好。而泰拳和柔术,也许有一天我们能在 VR 里模拟,只是这会很难,因为你需要排除各种阻力因素。

 

 

所以,我认为这种技术进步的方式是能够继续把更多的事情做得很好;同时,世界上其他技术或其他东西也在进步,任何人都无法包揽一切。

 

 

也许只是因为我每天都在努力开发这些东西,所以想的都是一些可以实现的、好的体验。一口气跳跃到一个如此好的地步当然不是坏事,但那些想法遥遥领先于我们今天实际所处的位置。我每天都在战壕里,试图早点实现它。

 

 

04 VR 办公和 VR 社交的可能性

 

 

乔·罗根:是的,但是从长远的角度来看它的发展方向,它会变得更加身临其境,变得更好,更有说服力,这是仿真理论的真正论据。如果宇宙中有这么多文明,它们都如此先进,那么最终就必须创建一个仿真的世界。如果人类能够再生存十万年,这似乎就会发生。

 

 

扎克伯格:是的,我认为问题在于可以做到多么逼真、多么好。对我来说,这就像圣杯一样,正在建造一些可以创造人类在场感的东西。

 

 

就像我花了近 20 年的时间来打造社交软件,让你无论拥有多么有限的计算能力,都可以分享你的经历。一开始是以文本的形式,拥有智能手机和相机后变成了照片的形式。现在,移动网络已经足够好,更多内容开始以视频的形式分享。就我而言,身临其境的体验显然会是下一步。能够感觉到你和别人待在一起的这种在场感会释放很多不同的价值,比如社交的、娱乐的、职场的。

 

 

有经济学家认为,经济机会和阶层流动是有限的,这和你所处地区有关,不同的地方会有不同的机会。但是想象一下,如果你不需要搬到一些与你价值观不同的城市,就能获得所有的经济机会,那将是很棒的。所以在未来,你可以在早上使用 AR、VR 来瞬移(teleport)到办公室,然后以全息图的形式出现,这将是非常贴心的。对很多人来说,它将释放大量的经济机会。

 

 

有没有可能百分之百地像亲自在场的效果一样好?可能不会,但它依然会创造很多价值。就像讨论做这次对话节目时,我们是在电话里谈好的,我没有飞到奥斯汀来讨论是否进行这次对话。

 

 

所以无论仿真的程度如何,它都会带来很多价值。你永远无法亲身做所有的事情,但是我们会越来越多地通过 VR 去做,今天是游戏或闲逛,接下来的几年会是工作。工作场景会逐渐接近真实体验的渐进线,你能瞬移进来,以全息图的形式出现,远程工作;而身体可以住在你想去的任何地方,和你的家人在一起,无论他们住在哪里。那将会非常棒,我想我们会做得很好。

 

 

乔·罗根:这会给商业地产带来真正的问题。因为如果这样的体验真的变得像口袋里有一部手机且能打电话一样好,就不会有那么多办公室了。当可以瞬间移动(teleport)去工作时,我可能不想再去办公室工作。

 

 

扎克伯格:可能会。尽管我觉得和朋友待在一个物理空间的在场感相当重要,但是在过去的几年里,人们的工作方式是发生了巨大变化。我几乎每天都亲自见人,但同时,我在家里开的会议可能比以前多。

 

 

乔·罗根:我也这么认为。关于人们去办公室而不是在家工作,现在的确遇到了很大阻力,人们宁愿在家工作。既然可以使用互联网连接,开视频会议,为什么必须亲自去大楼里才能完成工作?

 

 

扎克伯格:是的。我也同意。在远程办公上,我们公司实际上很前卫,尤其是某些类型的工作,比如软件工程。你可以身处不同的地方的同时把工作做得很好。而且,如果你是一名工程师,有时候最好不要在办公室,因为那样人们就不会打扰你了。你可以有一整个五小时来专注解决一个问题。

 

 

就像做一些事情,我会处于一种专注状态,这时,我妻子会问我一些日常问题。然后我就失去了我的专注,但从她的角度来看,就是上帝也没什么大不了的。

 

 

所以我确实认为在某种程度上,让人们能够远程工作实际上对很多事情都很有用,尤其从长远来看,但我也认为我们需要找到远程办公与线下办公的平衡。

 

 

乔·罗根:如果我的妻子在说话,而我正好想到一个段子,我会从我妻子身边跑开,同时示意她明白。我正在写作,她进来打断了,那就结束了。所以,在某些方面,你必须有一个真正安静和安全的地方。而且我认为对很多人来说,如果你能通过AR、VR消除浪费的通勤时间和所有这些,生活中的痛苦会好得多。

 

 

扎克伯格:是。过去几年,新冠疫情让我重新思考了工作方式。我觉得减少通勤是提升效率的重要举措之一,但能够在不同的地方生活也很好。

 

 

我在夏威夷度过了很长时间,我真的很喜欢冲浪和躺在水翼船上,我会在早上醒来去做这些,焕发精神,然后再开一整天的会议。但这显然不是我在帕洛阿尔托(注:美国旧金山附近城市,Meta 总部所在地)能做的事情。我对这一切的态度很积极。

 

 

我觉得如果你能给人们「在场」的能力,可以远程工作,也可以再次瞬移到另一个地方,以全息图的形式出现并在场,这种「流动状态」会非常有价值。但它不能取代一切。

 

 

我发现对于更大的会议,最有用的事情之一实际上并不是会议本身,而是有机会在会议前后和人们叙旧。能够瞬移进出是很有效率,但也有一个缺点,你可能会错过一些在走廊或其他地方休闲的休息时间。但总的来说,我还是认为它会创造出疯狂的效率。

 

 

乔·罗根:是的,我认为人们仍然会渴望现实世界的体验,就像我做情景秀,很明显,为了获得那种体验你必须待在那里,和大家待在一个物理空间里是乐趣的一部分。

 

 

我能想象技术会演进到可以创建一个虚拟喜剧俱乐部的程度,你会看到房间里所有不同的人都戴着头显,就像新冠大流行期间在 Zoom 里讲单口喜剧,但那很糟糕,因为没有观众,像在做公开演讲,没有任何反馈。

 

 

相比之下,有一些非常棒的播客,比如像比尔·伯尔(Bill Burr)的节目,只是自言自语,咆哮着生活和其他事情,效果很好,他不一定需要有人呼应。但是,不同的事情不同,比如喜剧,没有观众不好。

 

 

扎克伯格:是的。事实上,我已经至少有过一次这样的经历。所以我们做出了 Horizon 社交平台,人们可以在其中构建世界。

 

 

其中,人们在里面构建了一个叫做肥皂石喜剧俱乐部的东西。这实际上是我听过的人们使用虚拟现实的非常感人的一个故事。

 

 

这个女人失去了她的儿子,这真的很悲伤。而喜剧对她来说,是一个非常重要的发泄渠道。但是在现实的俱乐部,在人们面前表演会让她有社交焦虑。于是,她开始在肥皂石喜剧俱乐部做这件事。同时,由于虚拟现实提供的在场感,她感觉和虚拟空间的那些人待在一起。对她而言,这种经历是一种创造性的发泄方式,帮助她克服悲伤,但分享这种极致情感的经历可能不会让她在线下喜剧俱乐部感到舒服。

 

 

乔·罗根:我的朋友 Brian Redban,在 Oculus 里做了一个叫Virtual Redban的东西。他和一群朋友同时登录,一起走进一个房间,一起在里面闲逛玩耍。这真的很有趣,有一个在线社区,在那里你们去一个地方、相互见面,彼此交谈听到对方的声音。

 

 

在里面看到的 Avatar 就像你今天给我看的那个女异形一样移动,看起来非常真实。它是一个动画,我会把它比作电影《阿凡达》中的阿凡达。在里面就像是去了电影中纳维人的世界。在很多技术之上,确实取得了很大进步,更加真实。我可以想象很多人今天就想成为一只企鹅,要去这家餐馆,去闲逛,和一群企鹅家伙待在一起,太令人兴奋了。

 

 

电影《阿凡达》

 

 

扎克伯格:这是它有点迷幻的部分。一些场景的体验比另一些更真实,因为我们记忆的工作方式是基于空间的。当我今天离开这里时,我会记得你在我对面,并且有对称性,我在你对面,我们对这个地方的空间有共同记忆。

 

 

但头显可能不是这样工作的。如果你说话是从那个方向来的,空间音频以一种定向构建事物的空间模型是我们制造记忆的方式。所以如果你用 Zoom 来聊天,会完全把它搞砸,因为你开的每一次会议看起来都一样,而且没有对称性。所以如果你在我屏幕方框的左上角,这并不意味着我之于你在同一个地方,事实上,我们没有任何共享的空间感。

 

 

我不知道你是否有过这种经历,如果我打了一天 Zoom 电话,所有的东西都会混在一起,我很难记住什么会议有人说了什么。

 

 

然而,如果你进入虚拟现实,你有一个化身,那么随着计算能力变得越来越好,它会随时间变得越来越好。我并不相信:相比更具表现力的化身,人们会更喜欢哪怕有照片般逼真的化身。这是一个完全独立的切线,我们可以往下走。你显然会希望两者都有,既逼真又具有表现力的化身。

 

 

如果你坐在那里,有人是企鹅,或者你的朋友是卡通人物,但是你们围坐在桌子旁,有一种共同的空间感,你的朋友在你的右边,你在他们的左边,当他们说话时,你听到声音从那个方向传来。事实上,你记得这种空间感,就像在物理空间一样。

 

 

我在推进所有这些细节。对我来说,这是一些最令人兴奋的工作,因为我觉得在手机上建立社交体验在某些方面受到了限制,而我们有能力定义下一个平台将是什么,让它们打破适用于电脑、手机的这些奇怪条框限制,因为这些条框不是为通信和交互而设计的,而是为某种工作和某些计算工作负载而设计的。

 

 

所以我正在尝试做的很多事情是,用一种真正以人为中心的方式设计下一个计算平台。如果你以我们大脑的运行方式来处理外部世界、思考事物和做重要的事情,你不会建立一个旨在运行 App 的平台。

 

 

你会把它建立在这样的基础上:如何与周围人互动的基本单元,你如何表达自己,你希望能够有一个化身,一种你身份的表达,能够在一系列不同的经历之间跳跃,而不是让一切都如此孤立。

 

 

这就像是一个从头开始的尝试,建立这一切是非常疯狂的,因为这涉及的领域之多和技术之难令人难以置信,我经常受到批评,因为我们在这方面投入了大量资金,仅仅过去的一年,我们就在所有这些不同的研究梦想上花费 100 多亿美元,但这种梦想的广度极其广。

 

 

化身(avatar)的所有工作,你如何表达自己,如何建立世界,然后是所有虚拟现实的东西。一起致力于今年的设备和明年的设备,以及之后的设备,还有雷朋眼镜,我们有下一个版本。同时我们也有研究走向完整虚拟现实的路径,我们甚至已经到了神经界面,但是我们肯定要在这上花一些时间。

 

 

正是如此广泛的技术都建立起来,才能基本上建立和提供一种真正的在场感。让你感觉和身处不同空间的人仿佛待在一起。我认为这是世界上最神奇的事情。

 

 

05 脑机会实现吗

 

 

乔·罗根:嗯,听起来就令人兴奋。你可以在丛林中拥有一间办公室,突然之间我们就一起召开这次会议,我们可以登上月球,我们可以到一个正在冒泡的火山,这一切很酷。我喜欢像你这样的人在做的这件事,这扩大了这种东西实现的可能性,但是对于神经接口,你有什么看法?比如,它在哪里?它要去哪里?我们现在在哪里?

 

 

扎克伯格:回到你对《黑客帝国》的评论,当人们想到神经接口或者任何接口时,我认为分离出来是很重要的。你给计算机的反馈,计算机给你的信息,你可以把这两个东西分开。

 

 

我实际上认为,这里最难的部分是拥有一台计算机,把信息直接给你的大脑,但这不是我们正在做的事情,Neural Link 的伊隆·马斯克在做,这是非常遥远的事情。也许它会在几十年内准备好。短期内,对于受伤的人来说,可能会有一些有趣的用例。但我认为,在未来 10 年或 15 年内,正常人可能不会想在大脑里安装什么。

 

 

脑机接口示意图 | Neuralink

 

 

乔·罗根:我不想成为早期植入者。

 

 

扎克伯格:对,你可能想要植入成熟版本的脑机芯片,而不是你需要每年升级你的大脑植入物,因为明年的版本更好。

 

 

我花了很多时间思考:如果有了 AR 眼镜,你将如何控制它?你当然可以控制任何计算设备,这是平台的基础,但你有很多不同的操控模式。

 

 

其中之一是语音,你可以和它说话,但这并不总是有效的。如果你在公共场所,或者你想保持谨慎,或者你不想惹恼周围的人,你不会大声口述一切。

 

 

第二种方法是用手。比如我打个响指,我们就会有一个象棋游戏或者扑克游戏。这是我们的棋盘,我用手移动一个棋子。这有点酷。但是,你不会像用手操纵东西一样走在人行道上。我的意思是,如果你能克服这种奇怪的感觉,就达到了基础阶段的水平。并且,大多数人的手都会累的,如果你像这样伸出你的手足够长的一段时间,最终你还是想要把手放下来。所以问题是,你如何做到:可以让你的想法给电脑下命令。

 

 

在这种情况下,眼镜不需要大声说话,也不需要挥舞你的手。对于一些场景,你不总是想要。所以我们正在做的研究,是基于它的输入。不是试图向你的大脑发送信号,而是试图让你的大脑可以与计算机通信。

 

 

我们拥有的路径是基于我们身体中所有这些额外的运动神经元。举个例子,如果你受伤了,你有神经可塑性,你可以重新连接做一些事情,比如找到一个不同的路径来发送信号,指挥你的手指或其他东西。从结果上来说,可以有很多不同的方式,让我们的大脑可以告诉手指移动。

 

 

我们已经单独优化了一些,我们加强了某些路径,使用了 11 种运动神经元路径来做一件特定的事情。最终的结果,你可以在手腕上有一个设备,你的大脑可以与你的手交流。

 

 

你的手会以不常见的模式移动,然后腕带可以接收这些信号,并将它们转化为完全不同的东西,比如让一只虚拟的手在你面前移动。而你的物理手待在身体一侧。

 

 

你将来可以有这种体验:我们坐在一起聊天,你妻子发短信给你,它突然出现在你眼镜的角落里,你想回复她。但是你不想拿出手机,因为这有点不礼貌。你不用挪动手腕,只需要做一些微小的动作,甚至没有人知道你在做,就能够传递信息。

 

 

06 元宇宙会让年轻人更加脱离现实?

 

 

乔·罗根:这似乎会造成很多分心。我的意思是,人们已经被他们的手机分心了,比如当人们收到短信时。你坐在那里和朋友在一起吃午饭但是没有交流,因为都在看手机。如果现在他们会一直看着这些AR眼镜,只是脑海里想着这些短信,你甚至都不会知道他们分心了。

 

 

扎克伯格:我不知道。但我觉得这对我可能是一个有趣的事情,对我很有用。我一直在 Zoom 里,尤其是在 Covid 的早期,对我来说,既能在 Zoom 里视频会议,又能和更多的人聊天。或者说有些事情你不想对在场的每个人说,但是你想问某一个人,就像,嘿,你能展开讲讲你刚才说的,或者你不想在别人面前说的话吗?

 

 

这样的问题很多,因为我在公司有很多机密信息,我不会和每个人分享,但是我想得到某些人对事情的看法。如果我在开会,而且是线下办公室开会,我发现有时候我需要等到会议结束才能得到我想要的答案,而当我在 Zoom 或虚拟现实工作室里进行虚拟会议时,你可以在开会的时候给人们发短信。所以我实际上认为这将释放人们之间沟通和表达的巨大效率。人们不必等待会议结束,就可以向别人发送信息。

 

 

当然,你说的这些对于智能眼镜也是一个问题。我们可能需要的是某种非常智能的,勿扰模式。举个例子,比如你正在做一些重要的事情,你觉得某些事情不应该打扰你,这其实是一个非常重要的 AI 问题。我认为未来 AI 能够理解什么信息是应该通知你的,而不会像现在的「勿扰模式」这样黑白分明。

 

 

乔·罗根:也许是让某些人有优先权,比如如果你的妻子或家人试图联系你,他们可以通过,但是生意人不能通过。

 

 

但我担心其他问题。我的意思是,我不会让我的孩子远离社交媒体,因为我觉得社交媒体是他们生活的一部分,我不想让他们完全脱离。但我限制他们使用手机的时间,试着让他们不要沉迷于此。现在这些新事物让他们上瘾,让他们停下来吃饭都不容易,需要一遍一遍叫他们放下手机,停止和朋友拍照。

 

 

但放下手机其实还好,如果变成智能眼镜,那会更加困难,尤其是如果眼镜有社交媒体App。但智能眼镜也能提供某种好处,比如,可能会给你关于你拿起食物时卡路里含量的信息,告诉你这个食物很油,为了健康着想你不应该吃。

 

 

扎克伯格:是的。我认为这最终会达到平衡,希望我们的计算机和平台能帮助我们找到合理的平衡。就像你一直在说未来的脑机很酷,但我不确定我是否想用数字方式来实现它,我想在现实世界感受,我认为这是一个哲学问题。

 

 

我实际上认为你说的现实世界是物理世界,我认为有物理世界和数字世界,我认为它们的结合越来越多地成为现实世界。我们今天获取的信息,很多来自肉体体验以外,有的是通过数字方式,有的来自学习研究。而二者的比例可能会随着时间的推移而变化。

 

 

在未来的世界里,今天很多东西可能是物理的,比如我们的艺术品、雕塑和其他东西,也许在未来,它们不是物理的,也许它们只是全息图,因为随着时间的推移,你可以很容易地改变它们。

 

 

过去所有物质我们只与他们有物理层面的接触,很少有信息或数字覆盖。现在我认为它正在稳步增加。我认为这对我们来说可能会更健康,不是通过手机这个小窗口来展示我们所有的信息,这是我对 AR 的看法。对于数字技术是否会侵蚀现实,我可能更乐观,或者说我相信物理世界对我们在的意义。我是真的很关心如何取得二者的平衡。

 

 

乔·罗根:我认为平衡很重要,但我认为你是对的。我认为数字世界的景观不断增加,这是不可否认的,它现在是生活的一部分。随着技术的进步,它将成为生活中越来越重要的的一部分。但我不会说我的恐惧消失,我认为我们会有一天,人们会完全沉浸在一个非物质世界中,7X24 小时,我认为这就是Matrix(注:《黑客帝国》中的虚拟世界)。

 

 

这就是人们所担心的,随着技术的进步,尤其是有了某种神经接口,我们将到达一个我们不再真正存在的地方。你如何限制自己和孩子的社交媒体使用?你是怎么做到的?

 

 

扎克伯格:就我个人而言,因为在做很多事情,实际上一天中没有那么多时间。对于我的孩子,我没有时间去想那么多,因为他们都很小,一个六岁一个五岁。社交媒体是他们正在使用的东西。事实上,我希望他们将技术用于不同的事情。我教他们如何编码。我认为这就像是创造力的发泄渠道。

 

 

当我每天晚上和他们一起睡觉的时候,我试着尽可能结束我的会议,能给他们留出时间,问他们想做什么活动。是想看书还是想摔跤什么的。八月的时候,我的女儿和我说想做代码艺术,这是一种非常有趣的思考方式。她想让电脑创造艺术。无论如何,我认为这是我认为让他们接触到这种东西是有好处的。

 

 

但是我做了这些事情,并没有什么特别的地方。有很多关于幸福的研究表明,你是否积极参与其中很重要。你是在和一个人交往,还是在建立关系,还是只是在消费。如果你正在建立关系,那么这通常与许多长期利益和幸福有关,我们生活中的关系就是这样。

 

 

对我来说,这就像我认为随着时间的推移,吃东西通常会给人们带来幸福,但是如果你只是坐在那里消费东西,这不一定是坏事,但它通常与你积极参与或建立关系中获得的所有好处无关。

 

 

乔·罗根:可以在网上积极与人交往,建立数字关系,尤其是随着技术的进步,你实际上可以和某人的化身有一些有意义的经历。但这听起来很奇怪。

 

 

扎克伯格:所以,我只是想让它变得更好。从我的角度来看,这是心理问题。今天人们花了很多时间在屏幕上,基本上是电脑、手机和电视。我自己绝大多数时间都花在手机和电脑上,但我很惊讶的是,对美国人来说,他们花在屏幕上的时间几乎有一半是电视,很多人只是看有线电视或其他类似的东西。

 

 

当我们想到新的体验时,我实际上认为要做的第一件事就是干掉电视。当人们谈论担心花费的时间在不同社交产品上时,我认为要看看时间是从哪里来的。如果来自睡眠,这可能不太好。但如果它来自锻炼,我就不会那么高兴了。如果它来自电视,我对此没意见。

 

 

这实际上可能是对人类有益的,我们从消费状态转变为真正积极参与,潜在地建立关系,而不是把大量的时间花在看电视。所以在担心新产品越来越多消耗人们的时间之前,实际上只需要想想人们今天做的事情的组合变得更好。

 

 

我的目标是对于 VR/AR 这些下一代平台,它们将更加身临其境,希望它们会更有用,但我不一定希望人们花更多的时间在电脑上。我只是希望人们花在屏幕上的时间更好,今天很多时候你只是坐在那里消费一些东西。

 

 

乔·罗根:你一直是一个注重身体健康的人?我在 Instagram 上关注你,我看到你在玩滑水和其他运动,这对你来说很好,对外界来说也是一个很好的信息。这个家伙非常忙碌,他的生活被科技淹没了,但他不断地做与身体相关的事情,锻炼身体,亲近大自然。

 

 

扎克伯格:是的,我认为这是我父母很早就对我强调的事情。他们在这方面给了我很大的压力。就像你要在学校表现出色,你要加入三支大学运动队之类的。我非常感激,他们没有告诉我必须做,然后我告诉我必须做哪些运动。但他们说,这很重要。我已经找到了平衡,尤其是当公司规模扩大,在某些方面变得更加紧张的时候。

 

 

这是我的一天,早上醒来,看着我的手机收到一百万条信息,发来的东西通常都不好,因为人们通常会把好消息亲口告诉我。就像每天醒来,就像肚子被打了一拳,然后就没事了。而我需要重置自己,能够有工作动力,而不是为此感到压力。

 

 

我该怎么做呢?基本上我会去我喜欢阅读我获取所有的信息,然后我去做一些身体上的运动,一两个小时,随着时间的推移重置自己。我过去经常跑步,因为可以在跑步的时候思考很多。但尤其是在过去的几年里,我真的很喜欢需要全神贯注的事情。

 

 

所以我刚才提到,在新冠疫情开始以后,我很长时间待在在夏威夷,我们家在那里有一个农场。在那里,我花了很多时间玩冲浪,冲浪的时候你必须一直保持专注,否则你会摔倒,被海浪压在身下。我体验过,这不是什么美妙的经历。

继续阅读

DeepFake换脸诈骗怎么破?让他侧个身

2022-08-11

DeepFake被用到了电信诈骗里,该怎么破?

让他转过头,看看他的侧脸就好了。

DeepFake一直以来都存在着这样一个漏洞:当伪造的人脸完全侧着(转90°)时,真实性就会急剧下降。

为什么会出现这样的结果呢?

外网有这么一篇文章,解析了为什么在侧脸的情况下,面部伪造的效果大打折扣。

侧脸失真的原因

横向限制

使用DeepFake换脸,当人脸是侧角度时,真实性会急剧下降。

这是因为大多数基于2D的面部对齐算法,视捕捉到侧视图的特征点数量仅为主视图的50%-60%。

以“Joint Multi-view Face Alignment in the Wild”中的Multi-view Hourglass面部对齐模型为例。

通过从面部识别特征点,以此为学习数据来训练模型。

从图中可以看出,正面对齐时识别到68个特征点数量,而在侧面对齐时,仅仅识别到39个特征点数量。

侧面轮廓视图隐藏了50%特征点,这不仅会妨碍识别,还会干扰训练的准确性以及后续人脸的合成。

DeepFake专家Siwei Lyu博士表示:

对于当前的DeepFake技术来说,侧脸确实是一个大问题。面部对齐网络(facial alignment network)对于正面效果非常好,但对于侧面效果不太好。这些算法有一个基本的限制:如果你只覆盖你的脸的一部分,对齐机制就可以很好地工作,并且在这种情况下非常强大,但是当你转身时,超过一半的特征点丢失了。

普通人影像资料“沙漠”

换脸要达到比较逼真的效果,还得经过大量的训练,这意味着需要有足够的训练数据。

外网就有人通过训练大量的数据,将杰瑞·宋飞人脸替换到到《低俗小说》(1994) 中的场景中。

获得的侧脸图像也很难看出破绽:

但是达到如此逼真的效果,是经过了大量数据的训练,在上述这个例子中,电视节目“Seinfeld”就为此次训练提供了长达66个小时的可用镜头。

而相比之下,除了电影演员之外,普通人的影像资料都少之又少,并且在平时拍照记录时,很少有人会记录完全呈90°的侧脸照。

因此,通过DeepFake伪造的人脸很轻易就在侧脸时露出破绽。

也有网友在Hacker News上调侃道:

最近去一家不知名的银行办了张卡,竟然需要我的侧身照,当时我还很疑惑,现在我终于知道为什么了。

用手在面前晃动也可以识别伪造的脸

视频通话时判断对方是不是DeepFake伪造的,除了通过侧脸判断,还有一个小方法:用手在面前晃动。

如果是伪造的人脸,手与脸部图像的叠加可能会出现错乱,并且手在晃动过程中会出现延迟现象。

△在换脸寡姐和X教授时,手和面部叠加发生错乱

实时的DeepFake都会面临这样一个问题:需要将真实的遮挡物叠加到不真实的面部图像上,一般称这个操作为“遮罩”或“背景去除”。

并且,实时DeepFake模型需要能够根据要求随意执行抠图,达到可令人信服的水平。

但往往也会有很多混淆的遮挡物来影响“抠图”的过程,比如说具有人脸特征的遮挡物会给模型造成“困扰”,使其“抠图”过程很难进行。

用手在伪造的脸前晃动,遮挡物的快速移动会给“抠图”带来很大的困难,从而造成很大的延迟,并且会影响叠加的质量。

One More Thing

换脸犯罪并不遥远,已经有媒体报道过有嫌疑犯通过DeepFake换脸进行IT工作的远程面试,以试图侵入公司,获取他们的客户或财务数据,以及企业IT数据和专业信息等。

美国联邦调查局(FBI)曾致函其互联网犯罪投诉中心,称收到过多起投诉,有人利用窃取的信息和深度伪造的视频、语音申请远程技术工作。

在联邦机构5月份报告中描述的案例中,一些换脸嫌疑人通过几层空壳公司进行操作,这使得识别他们的身份变得更加困难。

参考链接:[1]https://metaphysic.ai/to-uncover-a-DeepFake-video-call-ask-the-caller-to-turn-sideways/[2]https://news.ycombinator.com/item?id=32384653[3]https://arxiv.org/pdf/1708.06023.pdf[4]https://gizmodo.com/deepfakes-remote-work-job-applications-fbi-1849118604

继续阅读

苹果AR眼镜,有什么值得期待?

2022-07-03

距离苹果ARkit发布5年过去了,有关苹果AR眼镜的消息传了又传,最近也是又热了起来。

 

 

包括长期跟踪苹果的彭博社记者Mark Gurman和行业分析师郭明池都说苹果将在明年发布AR/MR眼镜。

 

 

2017年ARkit发布时,行业都在说VR寒冬,但对AR感觉仍然充满希望。如今,刚随着无宇宙再次热起来的VR,随着Meta的砍单,又面临寒冬的预言。

 

 

说实话,感觉人的情绪波动起来远比行业本身的波动大得多,VR行业也是一会儿被捧上天,一会儿又变得一文不值。

 

 

这不,就在“VR寒冬”莫名来袭之时,苹果AR眼镜新品的消息又刺激了不少人的神经。

 

 

近日,Mark Gurman预测,苹果MR眼镜将搭载最新发布的M2芯片,以及16GB RAM。

 

 

实打实地来说的话,VR发展得好吗?

 

 

肯定没有当年吹得下一个智能手机”那么好,但作为一个新品类,去年千万级的出货量,其实已经不少了。

 

 

所以说好与不好,取决于你的期待有多高。

 

 

相较于VR,之前对AR的炒作也不少,尤其是那家神神秘秘的初创公司Magic Leap,不过自从产品面世后,声量就江河日下。

 

 

说白了还是期望太高,当现实与想象中的未来碰撞时,就难免会成为失望。

 

 

那么对于苹果AR眼镜,我们可以期待什么,才不至于发布后变成失望呢?

 

 

不过在期待之前,需要先说明的是,苹果肯定在研发AR产品,也想推出AR硬件,但是会不会发布,什么时候发布,仍然是不确定的,Mark Gurman和郭明錤的预测之前也打过脸。

 

 

我们就先假定苹果会发吧。

 

 

第一个问题:苹果做的是VR还是AR/MR

 

 

有人说不管VR、AR还是MR,直接统称为XR就好了,毕竟都是大差不差。

 

 

确实它们有相似之处,但是适当的区分还是有必要的。苹果选择做哪一类,对于产品的形态和发展方向很关键。

 

 

如果苹果做的是VR,那么其竞争对手就是Meta、HTC Vive,以及索尼PlayStation VR,多数人买来是玩游戏或者用来观影,有些像是主机的延伸。

 

 

其实他们的销售策略也类似主机——硬件不怎么挣钱,以内容为王。

 

 

如果苹果做的是AR/MR,那么其竞争对手就是微软HoloLens、Magic Leap,目前的市场规模比VR要小不少,而且更不成熟,以2B为主。

 

 

苹果有没有可能做个三合一产品?

 

 

个人认为可能性不大,因为那样意味着各种妥协,而没办法在某个方向上做到极致。比如游戏为核心的产品,手柄基本是不可或缺的,而AR可以有不同的选择。

 

 

那苹果更可能做的是哪一类呢?

 

 

做VR其实更合理,因为这是一个已经被证明了的市场,虽然没有智能手机那么大,但苹果出更好的产品颠覆整个市场,扩大市场规模,就像TWS耳机那样,是很容易想象的事情。

 

 

不过,库克一直强调AR才是未来,多次表示不想做VR,并且苹果在手机上做AR功能也很多年了,另外,VR类似主机一样内容为王的商业模式不是苹果自己基因所擅长的。

 

 

从这些角度来看,苹果更可能做的是AR眼镜。

 

 

个人认为,对标HoloLens和Magic Leap的AR眼镜是最可能的方向。

 

 

(PS:不过更让我有花钱欲望去买的,是苹果VR眼镜)

 

 

第二个问题:苹果AR眼镜能否惊艳?

 

 

体验过HoloLens,或者更早的Google Glass的人可能会有这样的感受,第一眼觉得“哇,好酷!好炫!”

 

 

但过不了多久就会发现这些产品有诸多不完善的地方——可视角度小,显示效果一般,操作起来这也不方便、那也不灵活。

 

 

更重要的是,上面的功能除了展示一下很炫酷之外,好像也没有太大用处。

 

 

有些公司会把探索中的产品拿出来卖,但苹果肯定不是其中之一,苹果如果要出产品,那肯定是觉得足够完善、成熟稳定,才会拿出来卖的。

 

 

就像我手上的第一代Apple Watch,已经用了8年了,除了运行慢之外仍然可以正常使用。

 

 

那么苹果AR眼镜相比HoloLens能有哪些提升呢?

 

 

1、工业设计上提升佩戴舒适性,减少发热,做轻量化。

 

 

2、显示方面,如果可视角度能提升到90度,就是惊艳了,另外,透光性、画面亮度和分辨率最好能有大幅提升。

 

 

3、专门的系统,流传出来的是一个叫RealityOS的系统,需要非常适配AR的使用环境。

 

 

4、手势交互、眼球追踪,这些不算新鲜,是HoloLens上有的,但做得不够好。

 

 

我2016年第一次体验Leap Motion的手势交互时,觉得非常惊艳,这家公司虽然拒绝了苹果的收购邀约,但深谙UI交互的苹果应该能做得更好。

 

 

5、专门的芯片,苹果在手机和笔记本上自己设计的芯片已经领先其它厂商2-3年了,这次传出的是会把M2芯片用在AR眼镜上。

 

 

如果确实如此的话,估计会是一颗针对AR使用场景进行了特定优化的M2。

 

 

专门的芯片和系统可以为苹果带来比其它厂商更大的能效优势,从而为好的体验奠定基础。

 

 

第三个问题:应用场景在哪里?

 

 

有人说AR眼镜最大的问题是贵,但实际上贵不是最大的问题,没有好的应用场景才是。

 

 

如果你不会为了AR功能去买苹果手机,那么你也不太可能去买苹果AR眼镜,更不用说眼镜肯定比手机贵。

 

 

可以很明确地说,AR眼镜能实现的功能,大部分也能在手机上实现,只不过显示交互方式会有所不同罢了。

 

 

苹果在手机上耕耘AR这么多年,其实算不上一个做得很成功的技术方向。

 

 

翻开App Store里的专门AR app页,下载量是真心少,有些应用确实看上去很炫酷,也总是拿来做案例,但没有一款是像短视频app一样让海量用户每天在上面花几个小时的。

 

 

所以苹果做AR眼镜最大的问题仍然是使用场景,而最大的惊艳是苹果创造或发现了这个使用场景。

 

 

但真不用抱太大期望。

 

 

总结

 

 

我觉得苹果AR眼镜估计还会跳票,因为这个品类太不成熟,没有多少使用场景,苹果AR眼镜就算领先HoloLens几年,大概率也无法改变这个情况。

 

 

当然,如果苹果能打我脸是最好的了。

 

 

如果苹果做VR眼镜,那肯定能做得很好,不说别的,光是芯片上应该就能领先现有产品2-3年(Oculus Quest 2用的还是高通骁龙XR 2芯片),对于VR体验有很好的提升。

 

 

但就像前面分析的,苹果自己对这个方向似乎不太感兴趣。

继续阅读

收集互联网搞笑歇后语

2022-01-27

10、最初的歇后语与现今的歇后语的表现形式并不相同,是对当时通用的成语、成句的省略。以下是我精心收集整理的歇后语小学一年级,下面我就和大家分享,来欣赏一下吧。
以上都是民间的歇后语,每一句都不带脏字,答案却句句骂人,这算不算有文化的骂人呢?听起来幽默又搞笑,聪明如你,各位读者有没有什么好笑、好玩的歇后语呢?有的话可以来评论区留言分享一下,让大家一起乐一乐。返回搜狐,查看更多
说到歇后语,大家肯定都不陌生吧,歇后语是汉语的一种特殊语言形式。那么你有真正了解过歇后语吗?下面是为大家收集的歇后语,欢迎阅读,希望大家能够喜欢。
歇后语,把一段词语分作两部分,前一部分是隐喻或比喻,后一部分是意义的解释。虎知道为您精心收集了5篇《马的歇后语》,如果对您有一些参考与帮助,请分享给最好的朋友。
歇后语是汉语的一种特殊语言形式。它一般将一句话分成两部分来表达某个含义,前一部分是隐喻或比喻,后一部分是意义的解释。以下是我精心收集整理的谐音歇后语篇,下面我就和大家分享,来欣赏一下吧。
导语:十二生肖是我国独有的文化,代表了不同的年份与生肖属性。下面是我收集整理的关于十二生肖的歇后语,欢迎大家阅读参考!
4、导语:关公是蜀国智勇双全的大将,他的哪项武艺最厉害呢?自然就是刀法了。下面是我收集整理的关于歇后语关公舞大刀的解释,欢迎大家阅读参考!
【解析】此题考查的是学生对成语、谚语、歇后语的积累与理解能力,要求学生在日常读书与写作中,注意多积累,多背诵,这样才能轻松应对此种题型。学生在收集到成语、谚语、歇后语之后,就会发现狼在人们心目中的形象是凶猛、狡猾、可怕的,这种思想已经根深蒂固,这与作者笔下的狼的形象是一致的。
139、答:我觉得笑死人的语言是不存在的,所以笑死女人的语言也是无稽之谈,这里使用了夸张的修辞。在现在快节奏的生活中,为了放松心情,民间会有些搞笑的歇后语让大家说起来顺口听起来搞笑,简单快捷,而且也能凸显说话的艺术,目的是还是为了用很幽默的手法取了于人,即包括女人。
趣祝福的编辑特地为大家精心收集和整理了“小学生经典歇后语”。聋子见哑巴--不闻不问,歇后语是群众在生活实践中所创造的一种特殊语言形式。歇后语以其独特的表现力,给人以深思和启迪。或许你能从中找到需要的句子内容!
这个是属于和朋友间逗乐幽默的搞笑歇后语,因为曹仁的父亲和曹操是属于本家弟兄,所以到了曹操和曹仁这一辈里面就成了堂兄弟的关系,曹仁比曹操的年纪要小一点儿,故而曹仁属于曹操的堂弟。于是便有了曹操的堂弟—曹仁的歇后语,曹仁改成【燥人】就成了一句取笑,幽默的话语,因为开这种玩笑无伤大雅,反而能够促进彼此间关系的融洽,所以用这个歇后语便是再合适不过。
互联网舆情信息传播的方式更加多样化和方便,促进了互联网舆情信息的广泛传播,产生了越来越大的负面影响。因此,为了避免负面、虚假、非理性的互联网舆情信息,进而引发舆情危机,企业需要做好互联网舆情信息的收集。要知道互联网上的信息数据量大,信息量太大太杂。单纯依靠舆情监测专员人工收集互联网舆情信息肯定是行不通的。那么,企业如何收集互联网舆情信息呢?企业如何查看互联网舆情收集?
首先我们要去素材网站找搞笑的素材,有生活的类的搞笑素材还有娱乐圈的搞笑素材,像生活中的搞笑视频网上多的是,大家可以随便找,娱乐类的大家可以多看看综艺里面的一些搞笑名场面,像这类型是在互联网上都是很吃香的,毕竟现在的年轻人工作压力大,需要放松一下压力
这怎么发生的?原来,几天前,张一山找人在网上修图,晒出了一张四张的照片,还收集了很多网友的搞笑P图。原本是一个活泼和谐的形象。
在明确了网站的主题后,将开始围绕主题收集材料。材料可以从书籍、报纸、光盘、多媒体和互联网上收集,然后将收集到的材料作为制作网页的材料去粗取精。
在那个短视频刚刚流行起来的年代,许多草根网红如雨后春笋一般,迅速在互联网上走红。辣目洋子凭借着敏锐的嗅觉,立马投身于创作短视频的道路上。从拍摄搞笑小段子,到恶搞翻拍各种经典影视剧。辣目洋子就这样凭借着“搞笑女”的角色,在美女如云的互联网上杀出一条血路!
与此同时,大数据的收集方式也是影响数据真实性与完整性的重要因素,比如,互联网数据爬取是当前数据收集的主要方式之一,而爬取互联网数据爬虫软件的时间设置则是影响原始数据收集范围与时效性的重要因素,在证据审查时应当着重关注;
整理分享搞笑祝福语圣诞节,星光,烛光,叮当,叮当,可爱善良的圣诞老人从天而降,带给无数个温馨快乐的世界,更把我的祝福带给你的朋友们:圣诞快乐!以下小编收集这些2023圣诞节祝福语搞笑分享了更多,提供给家人们学习。
现在有很多的信息可以通过互联网来查找。对于许多人而言,互联网成了最重要的收集信息的工具。在收集资料的过程中,你可以通过搜索引擎检索相关的网站,如Wikipedia和其他学术机构
除此之外,四种物品各收集1个还可获得魔性十足的【惬意午后头饰】哦~搞笑还得看制冷少女!车友们快快行动起来吧~
《你安全吗》剧中有秦淮陈默的真挚友谊,有秦淮周游的幽默搞笑,有木桐姐姐的温柔似水......可以说集颜值、幽默搞笑、普及互联网安全知识为一体的一部电视剧。
利用互联网、学校社团、入伍前的同学朋友快速收集信息,现在是互联网信息时代,没有快速且正确的信息就已经输了一半
工作火炬之光2局域网,及时反馈相关处理结果乐视危机。3、做好x文秘工作纸老虎歇后语。按时收发各种文件山药排骨汤的功效,认真收集
互联网下半场还有一个特征,是工业互联网融合IT和OT。工业互联网我们有传统的工控设备,按照规定的设置去控制我们的生产装备、仪器仪表,当然也收集他们反映的数据。
在互联网飞速发展的趋势下,新媒体的发展也逐渐起来,如微博、B站、抖音、快手等。每个人都可以在这些平台上发布视频,其中搞笑视频较为突出,浏览量较高。当人们在沉重的生活、工作之馀看一看搞笑视频有利于压力的释放、心情舒畅。搞笑视频的类型主要分为故事剧情表演、反转套路、独特的表现形式、一人分饰多角、接地气沙雕等。
网红诈骗手段又升级了,快来涨知识!在这个互联网发展越来越好的时代,真的不可能每个人都离开互联网。前段时间有一个特别搞笑的话题,就是如果你在家断网了你会怎么办?
数据收集:舆情监测系统可以实时收集来自互联网的大量数据,包括社交媒体、论坛、博客等渠道,为企业营销提供丰富的数据支持。
前期策划资料收集——策划方案资料的收集情况是网站策划方案成功的关键点,它关系到是否能够准确充分地帮助客户分析、把握互联网应用价值点。往往一份策划方案未能中标,与信息的收集方法、收集范围、执行态度、执行尺度有密切关系。太维在此公布出7项重点收集标准。
更搞笑的是,有些代理还会忽悠很多中老年人来当贩票下线,以囤月饼票售卖赚差价为由,非法收集下线们的资金,最后卷款跑路。
-避免收集平安问题:在利用互联网时,要警觉诈骗和收集欺诈等问题。不随意泄露小我信息,不点击不明链接,进步收集平安意识。
游戏介绍:拥有更”囧“、更萌、更搞笑、玩法更丰富等特点游戏中涵盖了主角养成、卡牌收集、伙伴养成、PK、副本闯关、装备打造等众多精华玩法,创新的合体技系统等玩点,打破了传统卡牌游戏玩法单一的局限性。
数据收集:通过互联网、社交媒体、博客、新闻和其他渠道,收集舆论数据。数据分析通过自然语言处理和机器学习技术,对数据进行分析,统计舆论的情绪、趋势和影响。

继续阅读

王者线上竞猜

2021-12-29

于是,张超开始玩竞猜游戏。这是一个线上赌博的H5界面,用户需要充值游戏币挑选竞猜项目,双色球、王者荣耀的在线人数后三位数字、吃鸡在线人数的单双等。现在电竞成了王者,自5月以来,电竞是第一大品类,在所有押注中占据了大多数。现在每一个竞猜运营方都在提供电竞活动相关竞猜项目,即便以前没有,现在肯定会提供。目前,国家也扶持了这些电竞竞猜产业的生产。电竞小酒馆,国内电子竞技竞猜平台,包含CSGO,英雄联盟,王者荣耀,绝地求生等多种赛事竞猜。一款专为电竞打造的手机软件,在这里有着最新的电竞资讯,在这里有着你想看的电竞赛事直播,在这里还有着最热门电竞话题,这里还有着专家为你解读赛事,枫叶电竞,电竞爱好者必备手机软件,需要的朋友快来找老陈下载体验吧!观看比赛直播,参与竞猜赢大奖。队员们以激情昂扬的姿态,在赛场中追逐绿茵梦想,台下的粉丝们参与竞猜,以实际行动为他们打call。本次的赛事竞猜诚意满满,花式竞猜玩法,丰厚的入会权益,超值的竞猜礼品,入会后即可线上免费观看赛事直播,还可低于市场价购买茅台集团酒,系统赠送海贝用于比赛竞猜。比赛共进行9轮,每一轮比赛均有竞猜活动,根据竞猜积分排名获得奖品,即使一轮积分过低也无需担心,9轮竞猜结束后有总积分排行榜,根据总积分排名可再次获得精美大礼,更多好礼、更多竞猜玩法等你解锁。这个阵地就是线上竞猜,自5月以来,欧洲及美国玩家蜂拥参与电竞相关竞猜活动,以及那些与虚拟篮球以及足球相关的活动。1)线上竞猜需在该场比赛开始之前,通过订阅号内发送您的竞猜结果,参与竞猜获胜球队,待比赛结束后,工作人员会在第一时间联系进行联系;产品包含各种篮球、足球比赛、电竞赛事以及小游戏等竞猜区域;其中主营范围为电竞赛事,例如:英雄联盟、王者荣耀、CS:GO、DOTA2、绝地求生、守望先锋等各类大型竞技赛事游戏。竞猜对象为以上游戏赛事,赛事内容为游戏官方举行,例如英雄联盟职业联赛,而本公司产品只是提供一个平台进行小额竞猜,竞猜结果完全视比赛队伍的对局情况而定!!其实不止英雄联盟,像Dota,王者荣耀,CS:GO,绝地求生等直播间竞技游戏都是有这个赛事竞猜需求的,并且玩竞猜的小伙伴也不在少数,包括我的部分粉丝以及身边的同事就有很多玩外围竞猜的!王者荣耀竞猜冠军得荣耀水晶。王者荣耀近期关于KPL的春季赛决赛的宣传真的是铺天盖地,各个平台都开启了各种活动响应这次赛事,近期微信公众号上就参与即有机会的获得荣耀水晶的活动,还有机会免费得到天狼绘梦者,那么小编就为大家带来王者荣耀竞猜冠军赢荣耀水晶活动详情。看到线下其乐融融,线上冒险家只能恰柠檬?见面会全程也会在微社区进行图文直播!线上竞猜赢好礼,趣味竞猜获奖选手可为全服与自己赢取钻石大奖!不过多出几个刷得快偏肉控的打野有助于改善路人没打野的问题。打野应该有的职责:适当打控制,游走能力好能配合线上英雄完成击杀。这几点王者里的打野英雄只有单杀能力而没有配合与控制的掌控,肉控打野对比刺客打野的优势在于这里,不是单纯英雄操作一定简单,而是选个肉控打野有底气安稳发育等团战。本次线上竞猜互动的奖品有法国队限量款球衣、欧洲杯足球、抖音周边礼品、球迷美食团购霸王餐,在活动期间,通过做任务收集足球币,即可兑换梦想球衣。去年,《王者》提出了“O2O2O”的线上线下电竞体验闭环模式,能够较好地实现多方共赢。线上我们需要吸引更多普通玩家成为粉丝,鼓励粉丝现场观赛。基于此,我们会围绕每座城市的冠名俱乐部打造专属的线上观赛主场,并建立粉丝会员体系和游戏内赛事战令系统,逐步引导线上用户关注地方战队,成为粉丝并产生线下观赛行为。兵线更快,所以补兵就显得尤为重要,而王者前期兵线慢,前期一般都是刺客刷野怪来快速升级,早期野区抢资源非常的厉害,再配合线上抓人头,顺风局没跑了。这也是为什么王者的辅助前期需要配合打野,而英雄联盟辅助前期通常跟射手。除了线上竞猜抽奖活动,本次活动也将在济南和青岛分别举办球迷狂欢之夜看球活动。看球赛程包含法国vs匈牙利和决赛之战。3.胡ya银豆竞猜相信大家都看过虎牙直播吧?有一些直播间比如王者荣耀,吃鸡有一些直播间会有种豆竞猜,咱们可以利用这个去延时提前知道比赛情况,然后用秒盘软件快速一键下注,正确的竞猜成功。最后是竞猜币和新英雄的消息,随着2020年王者荣耀世冠赛落下帷幕,上半年两大赛事的竞猜活动正式结束,竞猜系统将在下周一(24号)下午5点关闭,届时玩家的竞猜币与兑换中心的剩余奖品会被清空处理,所以当前还有竞猜币剩余的小伙伴别忘了兑换奖励,推荐兑换比较实用的奖励有铭文碎片和钻石,前者适合还未集满全套铭文的玩家,后者适合想要抽取王者水晶或者留着以后参与消耗钻石活动的玩家!王者荣耀这个游戏呢你要想上个王者或者是荣耀他本身是不难的,但是s你打的时候要注意一些方面,一些小的细节之类的,就比如说你玩个中路在当前版本就是最典型的,中路在现在这个版本要想通过线上击杀而取得优势带队是不太现实的。王者荣耀世界冠军杯总决赛当周一直都会出竞猜活动,玩家先获得兑换道具,再用道具换战队、fmvp选手信物,关于换哪个战队、哪个fmvp选手小编已经分享过了,不过得到的冠军竞猜信物怎么兑换呢?fmvp信物怎么换?在哪里换?所以lol线上甚至更重要不像王者无脑推线推完就越塔单杀对面或者支援反野扩大经济优势(我王者很菜只是讲讲自己的理解可能有问题)首先在王者荣耀里面,经济是非常非常重要的,甚至于说除了推倒水晶以外,其他时间基本都是在打经济。线上位置的英雄经济主要来源于兵线,线上位置包含射手、法师、上单。小学课程包括:线下王者常规语文及美育课程、线上王者常规语文及美育课程、线上阅读专题课程、线上写作专题课程、线上明兮课程、线上百灵英语课程(每科各有限时优惠券500元)王者荣耀作为社交游戏,不管是线下聚会场景,还是线上开黑,或者是CPDD场景下,参与的用户可以全程从头玩至尾。作为腾讯移动电竞头部产品,【王者荣耀】从多个方面增强KPL的专业性、便捷性、娱乐性、互动性、首发性。将游戏与移动电竞打通,在游戏内设置电视台满足用户快速观看赛事需求;再次,打造多元化赛事生态,进行内容形式的娱乐包装及娱乐明星参与赛事过程;最后,利用粉丝经济引进战队投票竞猜、开展丰富多彩的社区平台赛事活动让更多的玩家参与进来,逐步培养玩家观看移动赛事、热爱移动赛事的习惯。王者这个游戏节奏很快的,一二十分钟一把,直接决定了射手打不了辅助,因为射手发育周期长,就算线上小优,也需要很长的对线期来成型。王者荣耀中单清线非常快,地图小,打野刷野快,打野和中单能在边路高效起节奏快速拔一塔,然后压制发育空间,导致王者的对线期很短,这不比LOL几十分钟的对线期,优势情况下双射手有足够时间来成型伤害。比来比去的没意思,打王者也要20分钟每次感觉也好累哈哈哈哈,王者同水平局里我就期待打野前期节奏带好,这样线上就容易滚雪球赢得胜利。而lol的线上周期长一点,所以就希望我们的阵容好。因此lolm好多次因为线上崩了,但是阵容好就翻盘。社交属性:游戏中不是一个人的王者,而是整个团队的荣耀。通过团队合作,即时的交流,制作出作战方案。王者荣耀通过无论是线上还是线下都能引起人们的驻足围观参与,线上开创了国内外的电子竞技比赛,玩家通过移动终端能迅速的进入王者峡谷开启新的征程,与此同时通过与玩家进行官方交流,玩家随时可以将游戏体验反馈给官方,官方及时进行bug的修复,使游戏本身发展引擎形成正反馈闭合回路,从而使王者荣耀的增长引擎的能量无限大。

继续阅读