仔细看看Haiku Deck Zuru背后的人工智能
你可能已经听说过俳句甲板Zuru是全球首款搭载人工智能演示创建工具。它是如此独特而强大的,我们已经提交了一份专利结构化内容转变成一个演示文稿。
俳句甲板Zuru从甲板甲板在Vimeo.
所以......这是什么意思?
这是Zuru一步一步的步行我们的联合创始人兼首席技术官凯文谁表明人工智能不仅仅是一个流行语。事实上,Haiku Deck Zuru以思想的方式使用许多不同种类的人工智能(以及大量的专有数据)来改变乏味的演示。
第1步:解析和数据结构
使用的人工智能类型:自然语言处理
演示文稿转换过程以上载的PowerPoint或Keynote文件开头,或者在Evernote中创建的轮廓。(我们的目标是尽快输入更多的文件类型。)
首先,Haiku Deck Zuru的解析引擎提取文本,将其从二进制文件转换为可以分析的结构化数据(以及最终,转换)。
祖鲁寻找并提取任何自定义图像,分析其中的图像放置在每张幻灯片并通过计算多少幻灯片区域中的每个图像占用的评估的重要性。如果一个重要的自定义图像识别,祖鲁中心对齐它,使之与俳句甲板的视觉风格吻合。
在这个阶段,Zuru还使用自然语言处理来剥离单词,直到它们最有意义的根,去除重复,标准化文本,并识别有意义的复合词(例如,“Space Needle”而不是“Space”和“Needle”)。这个处理阶段对以后识别合适的图像至关重要。
接下来,Zuru将查看文本的布局,注意列表项、标题和副标题、标题和副标题等模式。它通过分析文本的大小和位置来智能地识别页脚文本,并锁定哪些文本重要,哪些文本不重要。
Zuru还分析了文本,以评估高度,遵循呈现最佳实践的程度,以及识别需要更多手动干预的演示文稿。例如,有太多的子弹,还是太多的单词?
第2步:关键字分析
使用人工智能的类型:机器学习
这是背后祖鲁人工智能变得非常有趣,因为祖鲁使用(匿名)数据已经从数以百万计的俳句甲板用户创建的建议为每张幻灯片一个美丽的,相关影像展示的聚集。
使用该巨型数据集(其不得不使用线性回归模型来嘎吱嘎吱36小时),祖鲁长相在载玻片上的每一个可能的关键字如何频繁地出现在演示文稿,对如何经常它已被用于作为图像搜索项和实际选择作为图像的结果。
例如:
- “Love”经常出现在演讲中,但它不常被用作图片搜索词。所以当Zuru在幻灯片上看到“爱”时,它就不太可能选择这个词进行图像搜索。
- “狗”经常出现,也经常被选中。所以当Zuru在幻灯片上看到“狗”时,它更有可能选择这个词进行图像搜索。
- “空间针”常常出现,但经常选择。So when Zuru sees “Space Needle” on a slide, it is very likely to select that phrase for the image search (and, if you remember from step 1, it’s smart enough to look for the iconic structure instead of pictures of stars or sewing).
zuru还考虑到幻灯片中出现给定关键字的位置(例如,标题中出现的单词可能比第5个子弹中出现的单词更重要),幻灯片上出现的频率,以及给定的频率Word已经出现在其他幻灯片中。所有这些计算有助于确定用于图像搜索的最佳术语或术语。
步骤3:图像选择
接下来,Zuru对最高排名最高的关键字进行图像搜索,返回数百个非常高质量的,创意共享许可的图像在几毫秒之内。Kevin精心设计了这个步骤,以便能够非常快速地处理大量的图像搜索,同时,让用户感到即时。
因为我们所有的自然语言处理和标准化已经完成(见步骤1),以及我们健壮的专有数据集(参见步骤2),超过90%的图片搜索术语出现在我们列出的70000年最受欢迎的图片搜索术语,它允许Zuru建议非常出色的图像快速、准确。
Haiku Deck Zuru背后的数据-用Haiku Deck制作,这是一款激发灵感的演示软件
由我们的团队策划的图像,或者被Haiku Deck用户频繁选择,而且当然,Zuru将继续与创建的每个新演示文稿更聪明。
步骤4:图像优化
使用人工智能的类型:计算机愿景,K-MEASE集群
一旦Zuru确定了适合幻灯片背景的完美图像,它就会将图像转换为实验室色彩空间,这种格式与人类感知光线的方式密切相关。Zuru使用一种叫做K-means聚类的方法来分析调色板,去除灰度,对准图像中出现最频繁的颜色。Zuru提取图像中最突出的颜色,并对它们进行亮度分析,将它们与数百个专业设计的调色板进行比较,以选择理想的颜色用于幻灯片的前景和背景。
接下来,Zuru执行亮度分析以确定文本的最佳位置(顶部、中间或底部),以及是否需要文本屏幕以获得最佳的可读性和对比度。
最后,Zuru调整缩放和图像的位置,使幻灯片背景完全居中。
第5步:完成触摸
在这个阶段,祖鲁分析文稿内容,以确定高层次类别(例如,房地产,市场营销,教育),并选择合适的字体我们的主题全库.
Kevin与Zuru的目标是使用数据和人工智能在几分钟内使用数据和人工智能在那里提供90%的方式,并使演示文稿创建者审查和微调结果非常容易。
在这个最后阶段,Zuru将指出修剪下调文本可以改善演示的区域,并且还识别其需要更多输入以选择正确的关键字或图像的幻灯片。用户可以在zuru中进行编辑,或者将重新出口到.pptx格式,直接在PowerPoint中编辑(直到最近,我们甚至没有想到)。
声音复杂吗?好吧,它是 - 这是我们喜欢凯文和他的团队的许多原因之一。好消息是,虽然苏鲁在幕后复杂,但对我们所有人来说,用户体验很简单,这对我们来说非常重要。
想试试祖鲁吗?向我们发送PowerPoint或轮廓gervate@www.script-one.com..我们将通过Zuru运行它并将其发送回您以查看您的想法。
如果你已经令人信服(正如我),你可以成为宪章并成为第一个尝试它的人之一。