近距离观察俳句甲板鹤鹭背后的人工智能

你可能已经听说过俳句甲板Zuru是世界上第一个由人工智能驱动的演讲创作工具。它是如此独特和强大,以至于我们已经提交了一项将结构化内容转换为演示文稿的专利。

俳句甲板Zuru甲板甲板Vimeo.

那么,这到底是什么意思?

以下是《Zuru》的一步一步我们的共同创始人和首席技术官凯文·,谁表明,人工智能不仅仅是一个时髦词。事实上,俳句甲板祖鲁使用在周到的方式从枯燥的辉煌变换演示了许多不同类型的人工智能的(以及专有的海量数据)。

步骤1:解析和数据结构

人工智能的类型使用:自然语言处理

演示文稿转换过程开始上传PowerPoint或主题文件,或在Evernote的创建的轮廓。(我们的目标是能够输入更多的文件类型很快。)

首先,Haiku Deck Zuru的解析引擎提取文本,将其从二进制文件转换为可分析(并最终转换)的结构化数据。

祖鲁寻找并提取任何自定义图像,分析其中的图像放置在每张幻灯片并通过计算多少幻灯片区域中的每个图像占用的评估的重要性。如果一个重要的自定义图像识别,祖鲁中心对齐它,使之与俳句甲板的视觉风格吻合。

在这个阶段,祖鲁也使用自然语言处理,以条带的话向下到其最有意义的根,删除重复,规范文本,并确定有意义的复合词(例如,“太空针”而不是“空间”和“针”)。这个处理阶段是用于稍后确定适当的图像的关键。

人工智能演示:俳句甲板祖鲁

接下来,Zuru将查看文本的布局,注意列表项、标题和副标题、标题和副标题等模式。它通过分析文本的大小和位置来智能地识别页脚文本,并锁定哪些文本重要,哪些文本不重要。

祖鲁还分析了在较高的水平,以评估它如何遵循呈现的最佳实践,并确定演示,这将需要更多的人工干预的文字。例如,是否有太多的子弹,或者一般太多的话?

第二步:关键词分析

使用的人工智能类型:机器学习

这就是Zuru背后的人工智能变得非常有趣的地方,因为Zuru使用(匿名的)数据,它从Haiku Deck用户创建的数百万份报告中收集数据,为每一张幻灯片推荐一个漂亮的、相关的图像。

使用该巨型数据集(其不得不使用线性回归模型来嘎吱嘎吱36小时),祖鲁长相在载玻片上的每一个可能的关键字如何频繁地出现在演示文稿,对如何经常它已被用于作为图像搜索项和实际选择作为图像的结果。

例如:

  • “Love”经常出现在演讲中,但它不常被用作图片搜索词。所以当Zuru在幻灯片上看到“爱”时,它就不太可能选择这个词进行图像搜索。
  • “狗”经常出现,也经常被选中。所以当Zuru在幻灯片上看到“狗”时,它更有可能选择这个词进行图像搜索。
  • “太空针”并不经常出现,但经常选择。So when Zuru sees “Space Needle” on a slide, it is very likely to select that phrase for the image search (and, if you remember from step 1, it’s smart enough to look for the iconic structure instead of pictures of stars or sewing).

祖鲁也考虑到其中的幻灯片给定的关键字出现(例如,出现在头一个字可能比出现在第5子弹一个单词更重要),它是如何频繁地出现在幻灯片上,以及如何频繁地给定字已经出现在其他幻灯片。所有这些计算帮助确定用于图像搜索的最佳或多个术语来使用。

步骤3:图像选择

接下来,祖鲁确实为排名最高的关键字的图像搜索,返回数百极其高质量的、知识共享许可的图像在几毫秒内。凯文精心设计这一步能够处理图像搜索的大量非常迅速,在并行,所以感觉瞬间给用户。

因为我们所有的自然语言处理和标准化已经完成(见步骤1),以及我们健壮的专有数据集(参见步骤2),超过90%的图片搜索术语出现在我们列出的70000年最受欢迎的图片搜索术语,它允许Zuru建议非常出色的图像快速、准确。


Haiku Deck Zuru背后的数据- 创建与俳句甲板,演示软件,激发

由我们的团队手工策划的图像,或Haiku Deck用户经常选择的图像,上升到顶部——当然,Zuru将继续变得更聪明,每创建一个新的演示文稿。

步骤4:图像优化

人工智能的类型中:计算机视觉,K-均值聚类

一旦Zuru确定了适合幻灯片背景的完美图像,它就会将图像转换为实验室色彩空间,这种格式与人类感知光线的方式密切相关。Zuru使用一种叫做K-means聚类的方法来分析调色板,去除灰度,对准图像中出现最频繁的颜色。Zuru提取图像中最突出的颜色,并对它们进行亮度分析,将它们与数百个专业设计的调色板进行比较,以选择理想的颜色用于幻灯片的前景和背景。

接着,进行祖鲁亮度分析,以确定文本(顶部,中部或底部)的最佳位置,以及是否需要为最佳的可读性和对比度的文本屏幕。

人工智能演示:俳句甲板祖鲁

最后,Zuru调整缩放和图像的位置,使幻灯片背景完全居中。

第五步:收尾

在这个阶段,Zuru会分析presentation的内容,确定高层次的类别(例如房地产、营销、教育),并从中选择合适的字体我们全部的主题库

Kevin使用Zuru的目标是使用数据和人工智能在几分钟内完成90%的演示,让演示创造者能够很容易地审查和调整结果。

在最后一个阶段,Zuru将指出哪些地方可以通过删减文本来改善演示效果,并确定哪些地方需要更多输入以选择正确的关键字或图像。用户既可以在Zuru中进行正确的编辑,也可以导出。pptx格式直接在PowerPoint中进行编辑(直到最近我们才认为这是可能的)。

声音复杂吗?嗯,这是 - 这是我们爱凯文和他的团队的众多原因之一。好消息是,虽然祖鲁是幕后复杂的,这是我们所有的人非常重要,用户体验十分简单。

想试试祖鲁吗?请给我们发一份ppt或大纲gallery@www.script-one.com.我们会跟祖鲁比对然后寄给你,看你怎么想。

如果你已经说服了(因为我),你可以成为创始会员并成为第一个去尝试之一。