β

对机器学习时代设计工具的再思考

百度MUX 6 阅读

许多人似乎很担心人工智能会取代我们的工作,甚至让我们失业。我却看到了一个更乐观的未来的可能性,那就是机器时代我们应当更加关注如何利用机器学习来帮助我们轻松的完成工作。


机器时代的人们越来越多的参与到创造性的活动中。可用于设计的工具、平台和设备的种类也越来越多,并且它们的成本也呈下降的趋势。有了这些设计工具,你可以自己拍电影,录制专辑,设计一个城市或者打印自己的花盆,所有的这些,你都可以在家里的电脑上,甚至你的手机上轻松完成。大家也会很想要尝试一下自由创作带来的兴奋感受吧。

尽管设计工具的价格变得更便宜,也让人们更容易获得和使用,但这并不意味着创建一个高质量的图像或讲述一个引人入胜的故事会变得更容易。想要做原创或者有美感的东西仍然需要具备专业知识、实践和经验的积累。

设计工具和编程语言给我们带来一股非常强大的力量,我们可以利用设计工具做一些真正属于自己的事情,但前提是我们必须了解如何使用它,否则它并不会成为真正属于我们的力量。

设计工具+机器学习

我有一个建议,我们可以利用机器学习帮助我们简化设计工具,但不去限制它们的表现力,更不要剥夺设计师的创造力。但这似乎与我们的认知背道而驰,当我们想到机器学习或人工智能时,我们首先想到的是自动化。

原创设计需要做很多的决定并占用很多的时间,这是一个我们无法回避的事实。因此,设计工具走向了两个极端

其中一种是采用“一刀切”的方法,通常可以在消费级别的设计工具中找到,这一类型的工具通过强制用户进入少数预设的模板来简化设计过程。

另一种类别是采用了“一应俱全” 的方法,通常作为专业的设计工具来使用,这一类工具提供大量的初级功能,并引起用户极高的学习兴趣,但通常在使用方式上与用户的思维方式不一致。

起初,机器学习似乎提供了一个相比“一刀切”方法稍微复杂一些的版本,这一方法是通过将决策性的任务从设计师身上转移出去,从而简化设计过程。我承认机器学习可以用这样的方法,特别是在早期,但它其实也提供了更丰富的可能性。虽然我们不能真正改变设计过程中涉及的决策数量,但我们可以改变这些决策所涉及的内容。

我想浅谈几种机器学习的方法,我们可以通过这些方法改变我们对设计软件的操作方式,并通过它做出决策。这些方法分别是:发现特征、探索式设计、描述式设计、流程组织和对话系统。

我认为这些很有可能在不影响设计师创造力的前提下,帮助我们简化设计的过程。或许更令人兴奋的是,这些方法可以让设计师将他们的全部注意力都放在设计本身,而不是学习如何通过这些设计工具来实现他们的想法。换句话说,设计师将会控制这些工具,而不是被工具所制约。

发现特征

当设计师坐下来设计时,也许他们对最终产品有一个确切的描述,也许他们没有。无论在哪种情况下,他们都需要找到一种方法,并且通过一系列的操作来将空白的画布转换成为最终的产品。这使我想起一句名言:

“每块石头里面都有一尊雕像,雕刻家的任务就是去发现它。” ——米开朗基罗。

我喜欢这句话,因为它把艺术和设计过程比做一种探索。

一块大理石有它既定的边界,在这些边界之内,有无限可能的雕塑同时存在,而艺术家的工作就好比是发现大海里的针,这里说的针是可以满足一系列特定要求的特征组合。这与化学家寻找一种新的分子,或者厨师寻找一种新的风味是类似的。

对上述的这些问题来说,他们探索的空间可能是完全不同的,但过程上有一定的相似性,因为每个设计问题都与特定的一组相互关联的属性和约束有关。

举个例子

让我们来看看在设计家用物品(如酒杯)时可能需要考虑的一些因素。如果我们想要把玻璃做得更高,我们可能需要加宽底座来防止它翻倒。在这里,需要针对这一个约束而改变两个属性。

当我们第一次遇到这个问题时,我们可能没有意识到它内在的约束:“这个属性在什么样的比例下会导致玻璃杯翻倒?”

我们通过进行实验来获得专业知识,并学习到两个属性之间的关系以及物理世界施加给我们的一组最初的未知约束。让我们把这个探索空间想象成一个非常大的图谱,其中每个可能的最终状态都由一组唯一的坐标表示。

在这张图谱中,软件的每一个功能就像一条路,在一个特定的方向上帮助我们探索部分内容。专业设计工具中的一个初级功能就相当于一条小道一样,因为它在地图中只移动了很短的距离。

如果我们想把玻璃杯变大,我们可以通过一系列的初级命令来完成,或者我们可以将这些命令提炼成一个高级功能,就像那些消费级的设计工具中的功能一样,这一功能更像是一条高速公路。它的优势就在于它可以运用相对较少的操作步骤给我们提供更多帮助。然而问题出现了,高速公路只有在常去的地方才有出口,如果司机想要去一个不是大家都非常熟悉的地点,那么他只能在小道上行驶,并且还需要更多的操作步骤。

同时,在大多数消费级的设计工具中,甚至没有提供我们走小路(指设计工具中的初级功能)的途径。也许有一个离出口不远,跟指定的目标很接近的另一个目标,而这个目标又更合我们的预期,但我们却没有办法到达,我们甚至可能不知道这个目标的替代者对我们的总体设计目标会有怎样的影响。

因此,高级工具虽然在在设计效率上具有很大优势,但它也会降低设计的表达能力或在空间内进行转换的能力。许多用户会选择在更容易实现的目标上停下来,这使得图谱上的大片区域未被探索。一个有着明确目标的用户可以找到一条非常迂回的路径来到达最终的目的地。但是,如果目的地的确切属性没有提前出现在在用户的脑海中,那么他或许不太可能有机会到达那里。

因此,高级工具可能会使得图谱上的一小片区域完全无法到达,将探索空间碎片化,这会使得图谱上出现更大我们所不能到达的区域。从这个意义上说,消费级的设计工具不但不会扩大人们所能到达的范围,反之,他还会阻碍我们的创造力。

如果我们想要保持自由的创造力,我们要么需要坚持使用初级的的功能,要么生成大量的高级功能,这些高级功能将具有更广泛的可能性,但同时也会在一定程度上牺牲工具的简洁性。

理想情况下,每当我们出发时,这些高级功能都会为我们建造一条新的高速公路,这样我们就可以通过非常少量的操作轻松的到达目的地,但这在预先设定的高级功能集中是不可能的。

机器学习使我们能够通过观察用户的行为来推断用户相关的大量信息以及他们希望达到的目标。我们可以创建一个学习工具,来学习设计者操作软件的行为,相比试图通过预先设定的高级功能集来预测设计者的需求,这个做法要实际的多。在过去的几年中,一种被称为“递归神经网络(recurrent neural networks)”的机器学习系统已经被证明了特别擅长学习序列模式,并且这些系统已经被广泛应用于诸如文本或音符的下一字段的预测中。

我们可以利用这种递归神经网络来发现工具中初级功能的常用序列,并动态合成与设计者当前活动相关的特定功能,而不是绕着一组预先设定好的高级功能构建设计工具。自定义高级功能的自动生成中使用的用户行为模式,不仅限于从单一的设计者行为中提取,也可采用从多个设计者的行为中提炼的方法。类似于根据用户喜好来推荐音乐或电影的推荐系统,可以通过在众多设计师中发现一种模式,根据设计者在工作流程中的习惯,向其推荐相关功能。

工具制造商可以利用推荐系统,更好地解决设计人员,以及他们消化信息、做出决策和与软件交互的各种方式的多样性问题。它将使工具制造商可以更好的满足设计师的需求,而不是一味地提供预先设定好的单一的静态功能或工作流程,然后让设计师去适应。推断大量用户的行为模式,工具制造商可以更好地理解系统中提供的各功能之间的隐含关系。这将为工具制造商提供更多关于如何改进其软件的重要意见。采用这种方法,工具制造者的角色将从高级功能的整体管理转向创建更细化的界面元素。从预设的系统规则和界面元素,到智能生成,这意味着工具制造者将放弃对软件某些方面的控制。但是,这样做能更好的协助设计人员去完成一些制造者没有预期到的任务。

探索式设计

每个人都有一种天生的美学和设计感 ,即感受愉悦或有用的东西。由于我们没有经验,因此很多人缺乏方法将这些直觉应用于设计领域来进行创意产出。设计工具不仅应该帮助我们在已知的领域执行设计,还应该帮助我们在新设计领域建立专业认知。如果我们在街上随机选取一群人,给他们一张白纸,然后要求他们设计出他们心目中理想的客厅,许多人其实不知道从何下手。

但是,如果让他们访问Pinterest,并要求他们通过挑选喜欢的元素来设计客厅,那么许多人就会觉得容易很多。这种“所见即知”的感觉会形成一种强大的动力来促使用户参与到设计中。用户不需要去了解工具背后运行的原理。相反,当他们看到实际的应用效果后,就能确定是否喜欢它。

此前,我们进行了一个关于二维空间搜索的可视化研究。虽然范围有限,但这种可视化的方式为设计提供了一种直观而细致的机制。用户只需选择一个位置即可搜索到与之相关的任何可能的设计。

这种可视化的组织形式还能使用户在给定的搜索空间内为特定的效果建立清晰的心理模型。当然,现实世界中的设计问题很少只是由两个维度组成的。可以利用低维的图谱来展现出设计中的那些高维度特征(注:“降维”机器学习系统的作用是可以降低时间复杂度和空间复杂度,节省提取不必要特征的开销,当数据能有较少的特征进行解释时,我们可以更好的解释数据,有助于我们提取知识。降维的方法便于实现数据可视化)

在上面的动画中,我将一组树叶轮廓的图像输入到降维系统中。随着训练的展开,  该算法会重新配置每个叶子在二维图谱中的位置,相似的叶子被安排在相邻的位置。最终,这个过程将创建一个连续的二维图谱,它展示了叶子可能出现的一系列的变化过程。

一旦训练完成,该系统可以重建与图谱中任何二维坐标相关的图像。完成训练后,该系统中与坐标点相对应的图像还可以重新进行编辑,但值得注意的是,即使没有提供排序的样本也可以完成这一训练,这样就为各种创新设计提供了一个简单并且快速的途径。我们可以自由的查看图谱中的任意位置,并且可以从中探索叶子在各个维度中可能演变出的形态,但前提是必需要符合叶子的这一概念。我们能够非常自由的查看到图谱中与坐标一一对应的每个图像,并且还可以在它们之中进行切换。

如果对想要设计的东西有一个成熟的想法,那么可以用特定的方法来实现它。但是,如果我们想进一步探索,看看还有什么可能的东西,那么上面的这种“降维”方法可以帮助我们从解决方案中跳脱出来,并尝试新的东西。

或者,这种可视化的图谱也可以暂时叠加在设计之上。这种方式允许用户在探索元素变化的同时,也能实时预览变化后的效果。

我们可以在这种探索性的界面中更改设计元素,而不用再重新进行设计。

例如,假设我们已经使用Bezier路径创建了一个橡树叶的图形,接着我们想要它变成枫树叶。如果在传统的设计软件中去做的话,我们需要不断调整Bezier路径。作为设计师,我们似乎习惯了这种工作流程。但事实上,这与目前软件的使用方式有很大关系,当前的Bezier路径功能决定了我们只能手动操作。

将一个形状转换为另一个形状可能会浪费我们在创建第一个形状时所做的大部分工作。这增加了时间成本,很明显这是不应该的。就好像我们想去邻居家时,不需要穿过整个城镇一样。

算法允许设计者以他们的设计直觉为指导,而不受到特定工具某种特定功能的限制。我们使用的这种方法,并不会阻碍设计师去掌控他们的设计,它只是去掉了上一代设计工具在操作过程中强行附加给设计师的操作行为。这样可以让设计师更专注于设计本身,而不是局限在设计工具的实现上。

描述式设计

到目前为止,我们讨论的界面非常类似于传统意义上的地图。就像其他任何地图一样,如果你愿意,可以在上面添加文字标签。这使得我们可以用命令语言改变设计,例如:“给我一片枫叶”。当结果呈现给我们之后,也可以这样说:“让它变得更接近橡树叶。”这种功能已经非常强大了。但事实上,我们可以思考得更深入。

2013年 Tomas Mikolov 等人发表了一系列论文,描述了一系列用于生成不同词汇之间概念关系的低维图谱技术。就像我们上面讨论的地图一样,在这个词汇图谱中,现实中用法密切相关的单词也会放置在一起。我们也可以对现实世界中的概念进行代数运算,例如,他们发现采用下面的表达方式:

“马德里 – 西班牙+法国”

比任何其他单词组合形式更加接近“巴黎”。

同样的:

“国王 – 男人+女人”的组合形式则最接近“女王”

这个迷人的机制提供了一种全新的设计工具思维方式。它允许我们在视觉或语言上运用视觉概念,而无需使用辅助的抽象概念和控制系统。

例如,如果我们想要查找与毕加索的作品相似的东西,但是不包含他在立体主义时期的作品,我们可以这样做:

同样的,我们可以在语音信息或任何其他媒体上做类似的事情。在过去的几年中,包括“Style Transfer”和“Neural Doodle”在内的类似技术进一步扩展了这些机制。

这些技术已经在照片共享类应用程序中实现 – 它们并不像是设计工具中的功能,而是作为一种新颖的照片滤镜,与Instagram或Photoshop的滤镜类似。

正如20世纪90年代Photoshop的“filter bubble”功能那样,这种新功能的新颖表现很快迎合了大众的趣味,但是对概念化或扩展设计过程并没有多少意义。

但作为一个更大、更全面的设计框架的组成部分,这些技术提供了一种强大的机制,它们允许我们通过直接操纵概念空间去探索和构思想法。

然而,正如技术具有变革性一样,我认为这些技术还存在一些缺陷。每个设计师都知道,设计最难的事情并不是做出个人决策,最困难的部分是协调许多组成部分的决策,以产生一个有凝聚力的整体。

作为设计师,我们必须在多个组成部分的决策之间来回切换,同时将整体牢记在心。有时候这些组成部分的决策之间也可能是彼此冲突的。

就像魔方一样,我们不能简单地解决一个面,然后再去解决下一面。这会浪费我们之前做的一些工作。我们必须同时解决所有面。这可能是一个非常复杂的过程,但学会如何从整体上处理这种事情是成为一名合格设计师的核心所在。

虽然之前讨论过的机器学习技术可以帮助简化这些组成部分的决策,但它们并没有完全解决设计的最困难部分。为了帮助设计师建立这种专业认知,我们来探讨另外两个概念。

过程组织与对话接口

机器学习系统理解只传达一个独立的命令或者信息点的简单表达式要比理解复杂、多信息的的表达式容易得多。然而,在设计一个事物的过程中最难的点之一就是思考如何拆分一个复杂的系统,使其变成简单易懂的概念。

设计工具能帮助设计者的最重要一点也就是在这个简化过程中。

工具可以帮助设计者通过创建接口和工作流来创建简洁的表达式,这些界面和工作流程通过一系列简单的体验和决策来引导用户,而每个决策点都是处理一个更大更复杂任务的其中一方面。

这种方法的一个很好的例子是20q,也就是电子版的游戏二十问。像传统的问答游戏一样,20Q让用户思考一个物体或者一个名人,然后提供一系列相应的多选题来发现用户到底在想什么。

通常在这个系统中首先询问的问题是“它是一个动物,植物,矿物或者一个概念吗?”

接下来的问题就是试着去区分和用户提供的信息有更深层次区别的一些选项举个例子,如果第一个问题的答案是“动物”那么接下来的问题就会是“是一个哺乳动物吗?”如果第一个问题的答案是“蔬菜”那么接下来的问题就会是“它通常是绿色的吗?”每一个随后的问题都可以用“是”、“否”、“有时”或“不相关”来回答。

20Q系统在20个问题后猜对正确的人、地点或事物的概率是80%,而在25个问题后,概率就到了98%。

这个系统使用了一种叫做学习决策树的机器学习算法,这种算法能帮助机器通过最少的步骤与问题猜对用户给出的信息。

通过利用用户与系统交互时产生的数据,该算法会研究每个问题的相对值,以便删除尽可能多的不正确选项,以此保证它能够首先向用户提出最重要的问题。

举个例子,如果已经知道了用户脑子里想的是一个名人,那么接下来的问题问这个名人是否还健在就要比问这个人是否写过书要有用的多,因为只有一小波历史人物现在还健在,但是许多名人却都出版过书。

虽然没有一个独立的问题能全部涵盖用户所想,但相对较少的经过精心挑选的问题还是能以令人惊奇的速度揭开正确答案的。

除了能帮助系统理解用户的表达,这个系统还能让用户更清楚、更有目的地表达自己的想法。其核心是,这个系统可以被看作是一个通过大量相关决策发现最佳路径的机制。

每一个问题以及答案都起到了一个翻译向导的作用。使用户更接近她或他想要表达的意思,同时还帮助用户探索了可能想思考和表达的方方面面。

这种机制还能拓展到设计界面领域,能够帮助用户通过回答一系列问题来设计出其期望的形式。同时基于更自然的交互模式,这些问题还可以直接用口头来回答……或者是姿势,这样用户根本不需要学习复杂的菜单系统或者工具。

基于机器学习的最新进展,机器越来越有可能回答出用户复杂的、具有关联性的设计问题。

例如,用户可以提出一些能帮助他或她去评价设计在实际用户中的适用性的真实问题。

这种对话将模拟人类对话的形式,同时机器的背后有着海量关于这个设计问题的数据。可以帮助用户更好的解决遇到的问题。

这还有可能关联到机器能模拟现实世界中相关约束的能力,如物质、物理或化学等方面。

通过在实时交互中嵌入这种能力,架构师可以快速排除不靠谱的想法,并产出一些丰硕的成果,这样可以节省大量的时间。

除了“真实世界的约束”,用户给出的交互指令经常不是明确的—或者因为机器的知识有限,或者就是因为用户没有表达清楚。

预期给出“最佳猜测”,这个系统可以提供更多的问题或替代方案以弄清用户的真实想法。

因此,这种会话既能有效的澄清用户的真实意图,又可以构建完善的机器知识库。

同时这还是一种更自然的记录机制,它可以保存用户想法的迭代更新过程,这种方式也比传统的“行动历史”更容易被审查和分析。

通过将流程线性铺开,查阅“信息流”,用户可以检查她或他思维的整个过程,并能轻松的回到任意一个节点,并在保存其他设计的同时向一个新方向努力。

结论

许多人似乎很担心人工智能会取代我们的工作,让我们失业。我却看到了一个更乐观的未来的可能性,在未来,我们仍将发挥重要作用。事实上,我们仍是更强大的。

在这样的未来,我们不会与物体竞争,我们会利用他们来拓展我们所能做的事情,就像过往历史一样。但要做到这一点,我们需要时刻提醒自己工具的本质是什么。工具不单单意味着使我们生活的更轻松。他们的目的是给我们一个杠杆,让我们看到更远更美的景色。通过工具可以举起石头,但人却能造出大教堂。

相关文章

机器学习时代的体验设计(上)-对创造人类行为学习系统的设计师和数据学家的启示

机器学习时代的体验设计(下)-对创造人类行为学习系统的设计师和数据学家的启示


原文作者:Patrick Hebron

原文链接:

https://medium.com/artists-and-machine-intelligence/rethinking-design-tools-in-the-age-of-machine-learning-369f3f07ab6c

译文仅作学习用途,转载请注明:本文来自UXC原创翻译,如有其他用途请联系作者

作者:百度MUX
原文地址:对机器学习时代设计工具的再思考, 感谢原作者分享。

发表评论