仔细看看Haiku Deck Zuru背后的人工智能
你可能已经听说过俳句甲板Zuru是世界上第一个由人工智能驱动的演讲创作工具。它是如此独特和强大,以至于我们已经提交了一项将结构化内容转换为演示文稿的专利。
俳句甲板Zuru从俳句甲板在Vimeo..
那么,这到底是什么意思?
以下是《Zuru》的一步一步我们的联合创始人和CTO Kevin他表明,人工智能不仅仅是一个时髦词。事实上,Haiku Deck Zuru使用了许多不同种类的人工智能(以及大量的专有数据),以深思熟虑的方式将乏味的演示变成精彩的演示。
步骤1:解析和数据结构
使用的人工智能类型:自然语言处理
演示文稿转换过程以上载的PowerPoint或Keynote文件开头,或者在Evernote中创建的轮廓。(我们的目标是尽快输入更多的文件类型。)
首先,Haiku Deck Zuru的解析引擎提取文本,将其从二进制文件转换为可分析(并最终转换)的结构化数据。
Zuru查找并提取任何定制图像,分析图像在每张幻灯片上的位置,并通过计算每张图像占幻灯片面积的多少来评估其重要性。如果确定了一个重要的定制图像,Zuru会将其集中并对齐,使其与俳句甲板的视觉风格相匹配。
在这个阶段,Zuru还使用自然语言处理来将单词剥离到最有意义的根,删除重复,标准化文本,并识别有意义的复合词(例如,“空间针”而不是“空间”和“针”)。该处理阶段对于稍后识别适当的图像至关重要。
接下来,zuru看文本是如何布局的,注意到列表项,标题和字幕,标题和子标题等模式,等等。它分析了文本的大小和放置,以智能地识别页脚文本,并在哪个文本中归零,并且不是。
Zuru还分析了文本,从高水平上评估它遵循演示文稿最佳实践的情况,并确定需要更多人工干预的演示文稿。例如,是否有太多的子弹,或太多的词?
第2步:关键字分析
使用的人工智能类型:机器学习
这就是Zuru背后的人工智能变得非常有趣的地方,因为Zuru使用(匿名的)数据,它从Haiku Deck用户创建的数百万份报告中收集数据,为每一张幻灯片推荐一个漂亮的、相关的图像。
使用这个巨大的数据集(必须处理36小时使用线性回归模型),Zuru看着频率每个幻灯片上的关键字出现在演讲,与频率已经作为一个图像搜索词实际上选为一个图像结果。
例如:
- “Love”经常出现在演讲中,但它不常被用作图片搜索词。所以当Zuru在幻灯片上看到“爱”时,它就不太可能选择这个词进行图像搜索。
- “狗”经常出现,也经常被选中。所以当Zuru在幻灯片上看到“狗”时,它更有可能选择这个词进行图像搜索。
- “空间针”常常出现,但经常选择。So when Zuru sees “Space Needle” on a slide, it is very likely to select that phrase for the image search (and, if you remember from step 1, it’s smart enough to look for the iconic structure instead of pictures of stars or sewing).
zuru还考虑到幻灯片中出现给定关键字的位置(例如,标题中出现的单词可能比第5个子弹中出现的单词更重要),幻灯片上出现的频率,以及给定的频率Word已经出现在其他幻灯片中。所有这些计算有助于确定用于图像搜索的最佳术语或术语。
步骤3:图像选择
接下来,Zuru对最高排名最高的关键字进行图像搜索,返回数百个极其高质量的、知识共享许可的图像在毫秒的问题。凯文精心设计了这一步骤,能够处理大量的图像,并并行地非常快速地进行搜索,以便对用户瞬间感觉。
因为我们所有的自然语言处理和标准化已经完成(见步骤1),以及我们健壮的专有数据集(参见步骤2),超过90%的图片搜索术语出现在我们列出的70000年最受欢迎的图片搜索术语,它允许Zuru建议非常出色的图像快速、准确。
Haiku Deck Zuru背后的数据- 使用Haiku Deck创建,演示文稿软件激励
由我们的团队手工策划的图像,或Haiku Deck用户经常选择的图像,上升到顶部——当然,Zuru将继续变得更聪明,每创建一个新的演示文稿。
第四步:图像优化
使用人工智能的类型:计算机愿景,K-MEASE集群
一旦Zuru确定了适合幻灯片背景的完美图像,它就会将图像转换为实验室色彩空间,这种格式与人类感知光线的方式密切相关。Zuru使用一种叫做K-means聚类的方法来分析调色板,去除灰度,对准图像中出现最频繁的颜色。Zuru提取图像中最突出的颜色,并对它们进行亮度分析,将它们与数百个专业设计的调色板进行比较,以选择理想的颜色用于幻灯片的前景和背景。
接下来,Zuru执行亮度分析以确定文本(顶部,中间或底部)的最佳放置,以及是否需要文本屏幕以获得最佳可读性和对比度。
最后,Zuru调整图像的变焦和放置,使幻灯片背景完美地居中。
第五步:收尾
在这个阶段,Zuru会分析presentation的内容,确定高层次的类别(例如房地产、营销、教育),并从中选择合适的字体我们全部的主题库.
Kevin使用Zuru的目标是使用数据和人工智能在几分钟内完成90%的演示,让演示创造者能够很容易地审查和调整结果。
在最后一个阶段,Zuru将指出哪些地方可以通过删减文本来改善演示效果,并确定哪些地方需要更多输入以选择正确的关键字或图像。用户既可以在Zuru中进行正确的编辑,也可以导出。pptx格式直接在PowerPoint中进行编辑(直到最近我们才认为这是可能的)。
声音复杂吗?好吧,它是 - 这是我们喜欢凯文和他的团队的许多原因之一。好消息是,虽然苏鲁在幕后复杂,但对我们所有人来说,用户体验很简单,这对我们来说非常重要。
想试试祖鲁吗?请给我们发一份ppt或大纲gallery@www.script-one.com.我们会跟祖鲁比对然后寄给你,看你怎么想。
如果你已经令人信服(正如我),你可以成为创始会员并成为第一个尝试它的人之一。