智能校对-人工智能写作正在成为极为重要的研究工具!

编辑:果妹        日期:2020-08-20

波士顿今年六月举办的@party上, MIT的程序写作专家 Nick Montfort向参加者介绍了计算机书籍制作的现状,程序写作(Program Writing)与计算机文学(Computer-Generated Literary Art)并不完全等同,计算机文学(Computer-Generated Literated Literary, Art)与大众理解的人工智能写作写作(Generated Art)相结合,形成了一个交叉学科,使之受到网络文学、乌力波、信息主义等文学现象的影响,而人工智能写作,也正成为该领域极为重要的研究工具。

讲课中展示的书籍都是用计算机程序编写的

there is no answer to this order of reasoning, except to advise a little wider perception, and extension of the too narrow horizon of habitual ideas. (or there is an answer to this order of reasoning.)

"这类推理除了提出更广泛的感知和扩大狭隘的既有概念视野之外,没有答案"(也许这一问题会得到解决)

-特定算法

NaNoGenMo: Dada2.0

今年初,《华尔街日报》发表了一篇文章,其中有一个互动工具条,其中包含了一系列金融投资研究报告的片段。该网站将提醒读者,摘录是由机器人完成的,哪些摘录是由人类完成的。的确,《华尔街日报》倾向于文风简洁,这使得挑战变得更为可行。有一句话是这样说的:“第二季度的现金余额为8.3亿美元,也就是说,在第一季度减少了1.4亿美元后,第二季度又增加了8000万美元。”这句话(Q2 cash balance expectation of$830 m implies~$80 m of cash burn inQ2 after a$140 m reduction in cash balance inQ1),事实上它只包含三个数据点,并且用特定的语法将它们结合起来,并且没有任何巧合因素。象新闻工作者这样的白领也许还不一定需要担心他们的饭碗(至少现在是…),因为新的自然语言生成(NLG)算法已经能够以叙述式的方式很好地表达结构数据了,但是目前还不够完美。它确实是一个非常强大的功能,因为对我们而言,从数据中获取观点的能力往往取决于数据的表现(比如,用图表显示的数据可能会让我们忽略某些数据行或列)。而且这也远远超出了创造一个世界所需要的那种勇气。

在某种形式上,自然语言生成算法通常会被归类为“人工智能写作”或“机器智能写作”,因为它们的工作方式——例如撰写体育新闻或天气预报稿件,或者像我在快进实验室(Fast Forward Labs)的同事们所做的原型一样——在此之前只有人类才能完成。(在其他文章中,我将探讨人工智能写作的历史,以及相对概念, Nancy Fulda等人也支持过)。

就像《华尔街日报》的文章中所说的那样,大多数人对自然语言生成算法的评价与安德烈·巴钦的评价相似:从写实作品的角度看它缺乏技巧,而从算法艺术的角度看它却不够自动化。商品化将使自然语言生成算法朝着更真实的方向发展,因为像投资银行和福布斯这样的新闻机构不会花钱购买机器智能写作来生成奇怪的文风。相反地,因为我们用人类的观点来评价机器的智能写作,所以将使开发人员朝着接近人类文风的方向前进。

但如果我们设定目标,用另一种方式机器生成文本,会怎样?抑或我们不以人的标准来判断(由机器产生的文本),而以其区别来判断?事实上,机器可能会产生我们人类不能创造的东西,或者自己也不能创造,以致不能利用算法。自动化写作会不会像什克洛夫斯基(Shklovsky,俄国形式主义学派的创始人)在《作为技巧的艺术》(Art as Device)中描述的那样,颠覆我们对自动化的理解并为我们的创造力提供新的载体?

Liza Daly,2014年 NaNoGenMo参赛作品《Seraphs》

这个使用自动化工具寻找新奇体验的过程正是 NaNoGenMo (National Novel Generation Month)这个全国性小说创作者的魅力所在, NaNoGenMo是由网络艺术家 Darius Kazemi于2013年11月灵光乍现创建的写作机器人峰会。考虑到文学形式, Kazemi戏谑地沿用了《国家小说月刊》(National Novel Writing Month)中的两条规则:作品必须在30天内完成(11月),写够5万字。这一不加限制的要求激发了新的创作尝试:既然你能写出能写出小说的算法,那为什么还要自己写小说?他在 Twitter上发表了这个想法,并创建了一个新的 GitHub (基于 Web的软件开发协作工具)社区。

NaNoGenMo的官方Github:National Novel Generation Month

类似于 NaNoWriMo,它向所有人开放,唯一的限制条件是对5万字的字数要求,也正因为如此, NaNoGenMo逐渐变成了一个使用算法测试文学形式的复合艺术运动。这个群体身份的形成,部分是因为他们反对外界的批评,很多评论家把他们的作品称为“入不了出版商的法眼”的“混乱的机器脚本”。一位参与者在去年自嘲道:“向普通人解释我们的所作所为是徒劳的。”从积极的方面看,他们正通过分享高质量的关键资源来建立群体认同。约翰·奥诺(别名为enkiv2)发表了一篇代码,可以生成六段诗、俳句和同义词。此外, Allison Parrish (别名 aparrish)还分享了它在卡耐基梅隆大学语音词典(Carnegie Mellon Pronouncing Dictionary)上开发的一个界面,该界面可以为特定单词生成押韵词字典。最后, Isaac Karth (又名 ikarth)向成员们揭示了这一以既有文本为基础的诗作背后的理性根源——达达主义, William Burroughs的剪切技巧,以及以约束为导向的 Oulipo (constraint-oriented)。在我与 Kazemi讨论这个项目时, Kenneth Goldsmith的“无创意写作”引发了他对如何让 NaNoGenMo挑战人们对创造和创意的传统认识的思考。

这一技术上的局限解释了为什么诺根莫需要结合诗学中的自我与意境重构(recontextualization)和重组。事实上,真正的自然语言生成算法,就是那些能够生成单词和语法,并且切片能够随着时间的推移变得更聪明的算法,还处在非常早期的阶段,大部分2014年的作品都是通过创造性的规则来转换现有文本,这也导致了作品的相似性。

搜索器, Github链接: thricedotted/theseeker

2014年,至少有两部作品使用了梦幻的方式来探索机器智能写作的奇妙之美。《搜寻者》(The Seeker)是一部试图“通过阅读 WikiHow了解人类行为”的机器自传。这个工作充满了视觉美感,每一个算法运算的循环都被抽象的雨点和类似的“想象没有一样东西是没有方向的。”在诸如 imagine not one thing could be undirected.等格言中标注。正如 Cottashal在“跳屋”游戏中的暗喻一样,这些格言鼓励读者去感知随机数据(Thricedotted的网站账户经常提到“脑补”(apophenia))中有意义的部分。计算机算法周而复始地重复着“工作,扫描,想象”的循环,不断地抓取 WikiHow的内容,并针对在工作中遇到的概念搜索完全由文本组成的记忆,从而建立一系列梦境,或者说“抽象概念”(univision),以理解它所不知道的概念。这类观念包含着最令人惊奇的诗作,其美感来自于读者不自觉地从中获得的片断式意境。

火龙果智能写作是全球第一款中英双语语法校对产品,运用人工智能写作技术进行错别字文本校对,除错别字以外,还可以对语法、标点等进行校对。

火龙果智能写作官网 https://www.mypitaya.com

积极拥抱变化,才能更好的应对这个时代

语法检查-人工智能写作是否真的具有广阔的前景?