导读:动态,意味着自运行?听上去倒是有点像修仙小说里的“小千世界”了!
【钉科技编译】在今年的GPU技术大会上,Facebook 的人工智能团队展示了可以让用户生成基于文本描述的独特影像(钉:这句简直是玄之又玄)的神经网络。团队成员首先键入了“海滩”一词,之后就出现了一片油画般的沙滩。因为影像中有一大片云,他们键入了“海滩—云”,一片新的万里无云蓝天下的沙滩就出现了。(钉:没搞懂,这里的意思是说技术有问题吗)最后,他们键入“夕阳下的海滩-云”,橙色日落下的海滩就出现了。
作为一种尝试模仿人脑运行方式的算法,神经网络已经成了人工智能领域的宠儿。
Facebook 所做的就是用图片训练他们的神经网络,把某些特定的单词和特定的图像类型联系起来,图片的数量达到数百万。(钉:好像也不是很多)
技术的关键在于提高系统结合图文的能力,要通过各种要素进行识别,这样才能做到面熟之后,立即成像。
首先进行的是2D图像的训练,比如油画,同时,如果应用到3D领域,这项技术应该会大有可为。构建一个虚拟现实空间需要大量的3D素材,如果能够凭借描述生成,将会大大缩短制作周期,现在看来,这个目标应该并不遥远。
谷歌的DeepMind神经网络,从2D到3D的发展过程不到一年。
当然,说是一回事,实际操作中总会遇到很多困难的。首先要调整识别算法,从2D升级到3D,当然视觉计算和三维运算都会推动这一进程;其次,因特网上并没有足够的3D素材来供给训练,开发者需要找到结合2D与3D图像识别的方式,一个令人比较振奋的消息是虚拟现实(VR)和增强现实(AR)技术的普及会带来更多的素材。(钉:高兴地太早了,先普及了再说吧,把希望寄托在外力智商总是很不靠谱的做法。)
笔者认为,十年内能够生成3D影像的神经网络将问世。这项技术会让虚拟世界的建构变得简单,像标题中说的一样。(钉:一样你大爷,全文也没发现“动态”这个概念,这作者一定是猴子请来的……)
(编译:钉科技小灰 From:uploadvr by:SKY NITE)
- QQ:61149512