仔细看看Haiku Deck Zuru背后的人工智能

你可能已经听说过Haiku Deck Zuru.是世界上第一个由人工智能提供支持的演示文稿创作工具。它是如此独特,强大的是,我们提交了一个专利,将结构化内容转换为演示。

Haiku Deck Zuru.甲板甲板Vimeo.

所以......这是什么意思?

这是Zuru一步一步的步行我们的联合创始人和CTO Kevin谁表明人工智能不仅仅是一个流行语。事实上,Haiku Deck Zuru以思想的方式使用许多不同种类的人工智能(以及大量的专有数据)来改变乏味的演示。

第1步:解析和数据结构

使用人工智能的类型:自然语言处理

演示文稿转换过程以上载的PowerPoint或Keynote文件开头,或者在Evernote中创建的轮廓。(我们的目标是尽快输入更多的文件类型。)

首先,Haiku Deck Zuru的解析引擎提取文本,将其从二进制文件转换为可以分析的结构化数据(以及最终,转换)。

Zuru寻找并提取任何自定义图像,分析图像在每个幻灯片上放置在每个幻灯片上,并通过计算每个图像占用的幻灯片区域的大量幻灯片区域来评估重要性。如果识别出一个重要的自定义形象,Zuru中心并将其对准,使其适合Haiku Deck的视觉风格。

在这个阶段,Zuru还使用自然语言处理来将单词剥离到最有意义的根,删除重复,标准化文本,并识别有意义的复合词(例如,“空间针”而不是“空间”和“针”)。该处理阶段对于稍后识别适当的图像至关重要。

介绍人工智能:Haiku Deck Zuru

接下来,zuru看文本是如何布局的,注意到列表项,标题和字幕,标题和子标题等模式,等等。它分析了文本的大小和放置,以智能地识别页脚文本,并在哪个文本中归零,并且不是。

Zuru还分析了文本,以评估高度,遵循呈现最佳实践的程度,以及识别需要更多手动干预的演示文稿。例如,有太多的子弹,还是太多的单词?

第2步:关键字分析

使用人工智能的类型:机器学习

这就是苏卢背后的人工智能真的很有趣的地方,因为zuru使用它已经从Haiku Deck用户创建的数百万呈现的介绍来建议每个幻灯片的美丽相关图像。

使用此巨大数据集(使用线性回归模型需要36小时),Zuru在演示文稿中查看幻灯片上的每个可能的关键字的频率,与其用作图像搜索术语和频率实际上选择了图像结果。

例如:

  • “爱”常见于演示文稿,但它并不经常被用作图像搜索项。因此,当Zuru在幻灯片上看到“爱”时,为图像搜索选择该词的可能性不太可能。
  • “狗”常常出现,经常被选中。因此,当Zuru看到幻灯片上的“狗”时,更有可能选择用于图像搜索的字。
  • “空间针”常常出现,但经常选择。So when Zuru sees “Space Needle” on a slide, it is very likely to select that phrase for the image search (and, if you remember from step 1, it’s smart enough to look for the iconic structure instead of pictures of stars or sewing).

zuru还考虑到幻灯片中出现给定关键字的位置(例如,标题中出现的单词可能比第5个子弹中出现的单词更重要),幻灯片上出现的频率,以及给定的频率Word已经出现在其他幻灯片中。所有这些计算有助于确定用于图像搜索的最佳术语或术语。

第3步:图像选择

接下来,Zuru对最高排名最高的关键字进行图像搜索,返回数百个非常高质量的,创意共享许可的图像在毫秒的问题。凯文精心设计了这一步骤,能够处理大量的图像,并并行地非常快速地进行搜索,以便对用户瞬间感觉。

Because of all the natural language process and normalization we’ve done already (see step 1), as well as our robust proprietary data set (see step 2), more than 90% of image search terms appear in our list of the 70,000 most popular image search terms, which allows Zuru to suggest standout images incredibly quickly and accurately.


Haiku Deck Zuru背后的数据- 使用Haiku Deck创建,演示文稿软件激励

由我们的团队策划的图像,或者被Haiku Deck用户频繁选择,而且当然,Zuru将继续与创建的每个新演示文稿更聪明。

第4步:图像优化

使用人工智能的类型:计算机愿景,K-MEASE集群

一旦苏鲁识别出幻灯片背景的完美图像,它将图像转换为实验室颜色空间,格式密切映射到人类感知光的方式。Zuru使用名为K-means群集的过程来分析调色板,删除灰度级和归零在图像中最常见的颜色。Zuru在图像中提出了最突出的颜色,并对它们进行亮度分析,将它们与数百个专业设计的彩色调色板进行比较,以选择幻灯片前景和背景的理想颜色。

接下来,Zuru执行亮度分析以确定文本(顶部,中间或底部)的最佳放置,以及是否需要文本屏幕以获得最佳可读性和对比度。

介绍人工智能:Haiku Deck Zuru

最后,Zuru调整图像的变焦和放置,使幻灯片背景完美地居中。

第5步:完成触摸

在这个阶段,Zuru分析了演示内容以确定高级类别(例如,房地产,营销,教育),并选择合适的字体我们完整的主题图书馆

Kevin与Zuru的目标是使用数据和人工智能在几分钟内使用数据和人工智能在那里提供90%的方式,并使演示文稿创建者审查和微调结果非常容易。

在这个最后阶段,Zuru将指出修剪下调文本可以改善演示的区域,并且还识别其需要更多输入以选择正确的关键字或图像的幻灯片。用户可以在zuru中进行编辑,或者将重新出口到.pptx格式,直接在PowerPoint中编辑(直到最近,我们甚至没有想到)。

声音复杂吗?好吧,它是 - 这是我们喜欢凯文和他的团队的许多原因之一。好消息是,虽然苏鲁在幕后复杂,但对我们所有人来说,用户体验很简单,这对我们来说非常重要。

想试试祖鲁吗?向我们发送PowerPoint或轮廓gervate@www.script-one.com.。我们将通过Zuru运行它并将其发送回您以查看您的想法。

如果你已经令人信服(正如我),你可以成为宪章并成为第一个尝试它的人之一。