亚博网赌安全有保障机械设备有限公司欢迎您!

人工智能的想象力在哪里?微软的这个机器人画家告诉你答案-亚博网赌安全有保障

时间:2021-08-19
本文摘要:标准:人工智能需要构建什么?毫无疑问,它可以帮助构建很多东西,但微软最近开发的人工智能技术引起了我们对人工智能的理解。在计算机识别和自然语言处理的基础上,微软开发了可以根据用户叙述绘制的机器人,它还可以帮助用户重建不一定叙述的细节。目前,微软已经通过官方博客公布了这一成果,(公众号:)并对该博客展开了不改变本意的编译器。 例如,假设被拒绝手里拿着稿纸和毛笔,画一张关于黄色身体、黑色翅膀和短喙的鸟的照片。

亚博网赌安全有保障

标准:人工智能需要构建什么?毫无疑问,它可以帮助构建很多东西,但微软最近开发的人工智能技术引起了我们对人工智能的理解。在计算机识别和自然语言处理的基础上,微软开发了可以根据用户叙述绘制的机器人,它还可以帮助用户重建不一定叙述的细节。目前,微软已经通过官方博客公布了这一成果,(公众号:)并对该博客展开了不改变本意的编译器。

例如,假设被拒绝手里拿着稿纸和毛笔,画一张关于黄色身体、黑色翅膀和短喙的鸟的照片。(大卫亚设,Northern Exposure)我不会再画鸟的大致轮廓了。

然后检查变化,查看黄色身体部分,用黄色刷子填满鸟的身体。然后用黑毛笔完成鸟的翅膀,最后检查,画着几个闪闪发光的鸟喙。为了创造更生动的形象,你可以画出鸟儿栖息的树干。

现在机器人也能像你一样做这件事了!微软实验室正在开发的新人工智能技术需要从字幕文本叙述中提取单个单词分解图像。网站arXiv.org上公开的一项研究表明,行业标准测试结果显示,该技术与以前的文本和图像分解技术相比,创造了近3倍的图像质量。

研究人员简单地称之为画画机器人,这种技术可以分解从普通田园风景(如养牛)到滑稽的无意义(如漂浮的双层公共汽车)的所有图像。每幅图像都包含文本说明中未提及的细节,指出这种人工智能技术享有一种人工想象力。“如果你用Bing搜索一只鸟,你就不会得到一张鸟的照片。(阿尔伯特爱因斯坦,Northern Exposure(美国电视),)但是在这里,照片是电脑从头开始逐像素创立的。

”位于华盛顿州雷蒙德的微软实验室、深度自学技术中心的首席研究员和研究负责人Xiaodong He回答说。“这些鸟在现实世界中可能没有3354。

他们只是指出电脑对鸟类想象力的一个方面。”这个图形机器人技术完成了他和他的同事过去5年来一直在探索的计算机视觉和自然语言处理的交叉学科研究。他们从自动写照片字幕—— CaptionBot ——的技术开始,然后换成了向盲人提出关于图像(特别是简单的图像)的明确问题的另一种技术。

(威廉莎士比亚,Northern Exposure(美国电视),摄影)这些研究工作需要训练机器学习模式来识别对象,完成不道德语言和自然语言之间的互动。现在我们要用文字分解图像。“该组织的博士后研究员、论文年度发行人邱园黄回答说。”所以这就是循环。

“图像分解是比图像字幕更具挑战性的工作。小组副研究员彭川张补充说,这是因为这个过程需要画出题目中不包含的细节。他说:“这意味着要运营人工智能的机器学习算法,想象图像的缺陷部分。

”精细图像分解微软绘图机器人的核心是一种称为“分解处理网络(Generative Adversarial Network,GAN)”的技术。网络由两个机器学习模型组成,一个用于在文本叙述中分解图像,另一个称为鉴别器,用于通过文本叙述来判断分解图像的真实性。

生成器试图通过假照片识破鉴别器,同时展开鉴别器进行判别。两者共同作用,发生器将大到极点。微软的绘图机器人对包含该图像和标题的数据集进行了培训。这使您能够学习模型自学如何使单词与该单词的视觉图像响应相匹配。

例如,GAN学会了在题目说鸟的时候分解鸟的形象,在一定程度上自学鸟的形象会是什么样子。他说,这是我们坚信机器可以自学的根本原因。

GAN在非常简单的文字说明(如青鸟和常青树)中生成图像时效果很好,但在更简单的文字说明中,效果不好,如绿色皇冠、黄色翅膀和红色腹部的鸟。这是因为整个句子被用作生成器的单个输出。其中详细的信息再次丢失。

因此,分解的图像不是在叙述中密切给出的,而是模糊地带绿色和黄色的鸟。在人类的绘画过程中,我们反复提及文本,密切叙述我们正在画的形象领域和单词叙述。为了猎杀这种人的特性,研究人员创立了他们所谓的attentional GAN或AttnGAN,他们在数学上模仿了人类的注意。

将输出文本分解为单个单词,并将这些单词与图像的特定区域相匹配。“注意一个人的概念。我们用数学展开计算。”他解释道。

这个模型还在教育数据中自学人类称为常识,利用这个自学概念来填补回到想象形象的细节。例如,训练数据中的许多鸟类图像显示躺在树枝上的鸟,因此AttnGAN一般会让它们栖息在树枝上,除非文本中另有说明。从数据来看,机器学习算法自学鸟站在树枝上应该属于这种常识。

“张说。作为测试,该团队为漫画视频确保了绘图机器人所需的字幕。例如,“一辆红色的双层公共汽车漂浮在湖面上”。

它分解了模糊与众不同的双层公共汽车图像,类似于2层甲板线或2层甲板线,漂浮在群山环绕的湖面上。这个视频显示机器人内部有争吵,船只能漂浮在湖和公交车的文本叙述之间。

“我们可以控制我们的叙述,思考机器如何反应。”“他这样解释。”我们可以介入并测试机器到底教了什么。这台机器已经有了一些背景常识,但仍然可以按照你拒绝的方式运营。

有时候这可能有点滑稽。“将此文本实际应用于图像的分解技术可以应用于实际应用,可以用作画家和室内设计师的素描助手或语音控制的照片美化工具。

预示着更强大的计算能力,他想象这种技术可以分解以电影剧本为基础的动画电影,还可以为电影制作者增加一些人力成本。(威廉莎士比亚,温斯顿,电影) (然而,目前这项技术还不完全。对图像进行仔细检查后,总能发现瑕疵,如不是黑色的而是蓝色的喙、水果和带有基因突变的香蕉。

(威廉莎士比亚、哈姆雷特)这些遗漏明确指出,不是人类的电脑创造了这样的形象。约翰肯尼迪,电脑名言)尽管如此,AttnGAN图像的质量比以前最差的GAN图像质量提高了近3倍,这是通往加强人类能力的人工智能道路上的里程碑。

”人工智能和人类生活在同一个世界,所以要找到互相交流的方法。他解释说:“语言和视觉是人类和机器沟通的两个最重要的方法。”除了微软的小东河、彭川张和邱元黄之外,合作伙伴还包括前微软实习利海大学的陶旭、杜克大学的哲根、罗格斯大学的韩章、李海大学的小磊黄。

参考资料1。读者对AttnGAN的研究论文2。

对微软公司的视角和语言智能的AI研究成果有更多的了解。3.如果你查一下CaptionBot和Seeing AI,4 .数十年的计算机视觉研究,《Swiss Army Knife》Viablogs。


本文关键词:人工智能,的,想象力,亚博网赌安全有保障,在哪里,微软,这个,标准

本文来源:亚博网赌安全有保障-www.property-launches.com