近距离观察俳句甲板鹤鹭背后的人工智能

你可能已经听说过俳句甲板Zuru是世界上第一个由人工智能驱动的演讲创作工具。它是如此独特和强大,以至于我们已经提交了一项将结构化内容转换为演示文稿的专利。

俳句甲板Zuru甲板甲板Vimeo.

那么,这到底是什么意思?

以下是《Zuru》的一步一步我们的联合创始人和CTO Kevin谁表明人工智能不仅仅是一个流行语。事实上,Haiku Deck Zuru以思想的方式使用许多不同种类的人工智能(以及大量的专有数据)来改变乏味的演示。

步骤1:解析和数据结构

使用人工智能的类型:自然语言处理

演示文稿转换过程以上载的PowerPoint或Keynote文件开头,或者在Evernote中创建的轮廓。(我们的目标是尽快输入更多的文件类型。)

首先,Haiku Deck Zuru的解析引擎提取文本,将其从二进制文件转换为可分析(并最终转换)的结构化数据。

Zuru寻找并提取任何自定义图像,分析图像在每个幻灯片上放置在每个幻灯片上,并通过计算每个图像占用的幻灯片区域的大量幻灯片区域来评估重要性。如果识别出一个重要的自定义形象,Zuru中心并将其对准,使其适合Haiku Deck的视觉风格。

在这个阶段,Zuru还使用自然语言处理来将单词剥离到最有意义的根,删除重复,标准化文本,并识别有意义的复合词(例如,“空间针”而不是“空间”和“针”)。该处理阶段对于稍后识别适当的图像至关重要。

人工智能演示:俳句甲板祖鲁

接下来,Zuru将查看文本的布局,注意列表项、标题和副标题、标题和副标题等模式。它通过分析文本的大小和位置来智能地识别页脚文本,并锁定哪些文本重要,哪些文本不重要。

Zuru还分析了文本,以评估高度,遵循呈现最佳实践的程度,以及识别需要更多手动干预的演示文稿。例如,有太多的子弹,还是太多的单词?

第二步:关键词分析

使用的人工智能类型:机器学习

这就是Zuru背后的人工智能变得非常有趣的地方,因为Zuru使用(匿名的)数据,它从Haiku Deck用户创建的数百万份报告中收集数据,为每一张幻灯片推荐一个漂亮的、相关的图像。

使用此巨大数据集(使用线性回归模型需要36小时),Zuru在演示文稿中查看幻灯片上的每个可能的关键字的频率,与其用作图像搜索术语和频率实际上选择了图像结果。

例如:

  • “Love”经常出现在演讲中,但它不常被用作图片搜索词。所以当Zuru在幻灯片上看到“爱”时,它就不太可能选择这个词进行图像搜索。
  • “狗”经常出现,也经常被选中。所以当Zuru在幻灯片上看到“狗”时,它更有可能选择这个词进行图像搜索。
  • “空间针”常常出现,但经常选择。So when Zuru sees “Space Needle” on a slide, it is very likely to select that phrase for the image search (and, if you remember from step 1, it’s smart enough to look for the iconic structure instead of pictures of stars or sewing).

zuru还考虑到幻灯片中出现给定关键字的位置(例如,标题中出现的单词可能比第5个子弹中出现的单词更重要),幻灯片上出现的频率,以及给定的频率Word已经出现在其他幻灯片中。所有这些计算有助于确定用于图像搜索的最佳术语或术语。

步骤3:图像选择

接下来,Zuru对最高排名最高的关键字进行图像搜索,返回数百个极其高质量的、知识共享许可的图像在毫秒的问题。凯文精心设计了这一步骤,能够处理大量的图像,并并行地非常快速地进行搜索,以便对用户瞬间感觉。

因为我们所有的自然语言处理和标准化已经完成(见步骤1),以及我们健壮的专有数据集(参见步骤2),超过90%的图片搜索术语出现在我们列出的70000年最受欢迎的图片搜索术语,它允许Zuru建议非常出色的图像快速、准确。


Haiku Deck Zuru背后的数据- 使用Haiku Deck创建,演示文稿软件激励

由我们的团队手工策划的图像,或Haiku Deck用户经常选择的图像,上升到顶部——当然,Zuru将继续变得更聪明,每创建一个新的演示文稿。

第4步:图像优化

使用人工智能的类型:计算机愿景,K-MEASE集群

一旦Zuru确定了适合幻灯片背景的完美图像,它就会将图像转换为实验室色彩空间,这种格式与人类感知光线的方式密切相关。Zuru使用一种叫做K-means聚类的方法来分析调色板,去除灰度,对准图像中出现最频繁的颜色。Zuru提取图像中最突出的颜色,并对它们进行亮度分析,将它们与数百个专业设计的调色板进行比较,以选择理想的颜色用于幻灯片的前景和背景。

接下来,Zuru执行亮度分析以确定文本(顶部,中间或底部)的最佳放置,以及是否需要文本屏幕以获得最佳可读性和对比度。

人工智能演示:俳句甲板祖鲁

最后,Zuru调整缩放和图像的位置,使幻灯片背景完全居中。

第五步:收尾

在这个阶段,Zuru会分析presentation的内容,确定高层次的类别(例如房地产、营销、教育),并从中选择合适的字体我们全部的主题库

Kevin使用Zuru的目标是使用数据和人工智能在几分钟内完成90%的演示,让演示创造者能够很容易地审查和调整结果。

在最后一个阶段,Zuru将指出哪些地方可以通过删减文本来改善演示效果,并确定哪些地方需要更多输入以选择正确的关键字或图像。用户既可以在Zuru中进行正确的编辑,也可以导出。pptx格式直接在PowerPoint中进行编辑(直到最近我们才认为这是可能的)。

声音复杂吗?好吧,它是 - 这是我们喜欢凯文和他的团队的许多原因之一。好消息是,虽然苏鲁在幕后复杂,但对我们所有人来说,用户体验很简单,这对我们来说非常重要。

想试试祖鲁吗?请给我们发一份ppt或大纲gallery@www.script-one.com.我们会跟祖鲁比对然后寄给你,看你怎么想。

如果你已经令人信服(正如我),你可以成为创始会员并成为第一个尝试它的人之一。