GPT时代的创意写作
AI帮我击败莫言?
最开始的时候,排名第一的是莫言发表在《十月》杂志上的小说《等待摩西》。可到了最后一天,《小说界》选送了我与AI共同创作的《出神状态》。结果在AI评委的眼中,这篇小说以0.0001分的优势反超登顶。就这样,我成了“打败”莫言的男人。
2017年,我与前Google同事工程师王咏刚一起开始一场写作实验,用CNN(Convolutional Neural Networks,卷积神经网络)与LSTM(Long Short-Term Memory Network,即长短期记忆网络)训练能够模仿人类创意写作的算法模型。机器写作并不是新鲜事,早在上世纪90年代,自动化程序便能以拼贴组合的统计学方式写诗,抓取实时资讯生成结构性新闻等等,但是作为高度复杂的叙事文本——小说所要求的逻辑性、自然语言理解能力,以及对于人物、情节、结构、文法的不同层面的要求,之前的AI尚未达到这样的能力。
我们用CNN对小说文本进行特征提取,然后将输出的特征图谱(feature map)映射为序列矢量输入到LSTM网络,便可训练出能够模仿人类写作的算法模型,然后通过调整参数,也就是所谓的fine tuning,让它写出来的东西尽量接近我们现有对于文学的理解和审美。学习了上百万字我的作品之后,AI程序“陈楸帆2.0”可以通过输入关键词和主语,来自动生成每次大约几十到一百字以内的段落,我与它共同创作的作品《出神状态》,甚至还赢得了一座由AI评委评出的奖杯。
最开始的时候,排名第一的是莫言发表在《十月》杂志上的小说《等待摩西》。大家觉得算法挺靠谱,诺奖得主得奖,那还能有错?可到了最后一天,《小说界》选送了我与AI共同创作的《出神状态》。《出神状态》的灵感来源是智利作家罗贝托·波拉尼奥的短篇小说集《地球上最后的夜晚》,故事记录了主人公去上海图书馆还书途中的见闻思想,深入探究通讯中断与紧急状态下的人与社会。结果在AI评委的眼中,这篇小说以0.0001分的优势反超登顶。就这样,我成了“打败”莫言的男人。这次比科幻还要更科幻的惊喜也让我醒觉到,未来的机器将更深入地卷入人类创作中,未来的内容版图也会变得更加复杂、暧昧而有趣。
巧合的是,2017年也正是Google发布重注意力机制与Transformer算法,并开启了机器学习在自然语言处理(NLP, Natural Language Process)领域狂飙突进的历史性时刻。之后,我们见证了OpenAI推出的GPT(Generative Pre-Trained Transformer)模型不断进化,挑战人类对于智能、意识以及创造力的理解边界。
如何实现人机共舞
未来的作品,读者或许根本分辨不出到底哪部分是人写的、哪部分是AI写的,因为这里包括非常多不同层次的修改和润色。AI提供给我们非常强大的工具,创意的工具、写作的工具、设计的工具,同时也让我们思考到底原创性的边界在哪里,人类的主观能动性在哪里,包括知识产权,包括怎么尊重被采集数据的作者,他们是否也拥有一定的权利。
2022年11月30日,在我的生日这天,OpenAI推出基于GPT-3.5的ChatGPT——一个能够回答问题、写作小说、论文甚至代码生成的对话式AI,在全球掀起现象级热潮。它从0到获得100万用户只用了不到5天,而Twitter用了两年,Facebook用了300天,Instagram用了75天。相比于之前的GPT-3模型,ChatGPT增加了“依据人类反馈进行强化学习”(RLHF, Reinforcement Learning with Human Feedback)的概念,能够更好地理解文本更深层次的复杂含义,无论是连续流畅的对话,还是对于错误想法的纠正,甚至能够质疑不合理前提或者干脆拒绝恶意提问,足以让对话者产生“以假乱真”的幻觉。
如果说2017年的“陈楸帆2.0”语言模型还是混沌不堪的“随机鹦鹉”,简单的人称都搞不清楚,人物关系里面谁是谁、彼此的联系是什么,写着写着它就搞混或者颠倒了。但到了GPT-3.5和ChatGPT,它的写作能力已经超乎想象。在一个序列里,你给它一个环境或背景去做续写,你能看到它前后的连贯性保持得非常好,甚至还能给出一些你意想不到的转折,有一些甚至令我觉得带有更深层的文学意味。
现在我花非常多的时间探索怎么跟ChatGPT合作,这肯定不是我们原来想象的简单粗暴的“复制粘贴”的过程,它是一个非常复杂的人跟机器共生的、共同写作的过程。在这个过程中我会对自己的写作有非常多的反思,它让你理解到你作为人类的边界、惯性在哪里。
我会用它来进行头脑风暴,或者生成一些对某个陌生场景非常细致的描写,甚至把一段话输入进去,让它调节整体风格,变得诙谐一点,或者严肃一点,也可以模仿某个作家的写作风格。几秒钟之内,AI就可以给你生成一段接近你要求的内容。但这是一个反复迭代的写作过程,它跟我们传统的、人文主义的写作是完全不一样的,我觉得这非常有意思,它会在可见的未来改变很多领域,写作也会是其中之一。
最近我正在写一个儿童科幻小说,写一个非常懂AI的城市女孩去一个原始村落,遇到另一个少数民族女孩的故事。我会让ChatGPT帮我描绘一下未来的AI城市是什么样的,这个女孩一天的生活场景是怎么样的,它写出来的非常像《小灵通漫游未来》,我把文本再回输进去,要求它再增加一点文学性,再增加一点哲学的思考、一些生动的比喻,它就会再修改。我甚至曾经要求它用科马克·麦卡锡的笔触来写一个海啸的场景,出来的文字不一定全都能用,但能给你一些感觉。
它也会生成一些我原来在大纲里没有涉及的情节,比如两个女孩第一次见面,会有一些防备心理。那我可以顺着这个防备心理的线索再去发展。和ChatGPT一起写作就像一个开放的写作实验,你不需要做任何预设,由意象展开成场景,再加上人物,借由ChatGPT,人物和场景之间发生的故事就不在你预先的设计范围内了。你就跟着它走,看它怎么把每个机器生成的模块结合在一起,最后用你人类的审美、文学性的判断标准再做统一修改。未来的作品,读者或许根本分辨不出到底哪部分是人写的、哪部分是AI写的,因为这里包括非常多不同层次的修改和润色。
机器所理解的文学性、哲学性,也是基于语言模型,抽象出很多文学作品里所谓的文学性,有时候会过度修饰,比如你让它加点比喻,它恨不得每句话都来个比喻,你就知道了,机器把握不好这个平衡,而文学性的微妙恰恰在于取舍,在于留白,在说与不说之间,这部分机器还没有那么智能。它对情节灵活性的掌握,来源于已经学习了非常多历史上的文学套路,让它能跳脱出人类作家的惯性。人类写作很多时候还是会受限于以前的创作路径,但AI可以从整个人类的数据库里抽象出非常多的原型,无限多地在原型里做排列组合,去生成无限多的分支结构。
我也尝试过用ChatGPT去翻译,真的比我以前用过所有的翻译软件都好。它的流畅程度达到了一个新的高度。但我觉得有一些更微妙的东西,包括文化上的符号、引用的历史典故等等,包括有时候有一些多义性的处理,AI还做不到人类译者的水平。
甚至包括封面和插画也可以让AI参与创作。我马上要出的一本小说集《赢家圣地》,封面就是我用另一个AI工具Midjourney生成的。当时我看了出版社请设计师做的方案,觉得跟我想象的还是有点距离,就想自己来,在很短时间内生成了数十个版本,筛选之后,让设计师加上字体——以后可能连这一步都可以由AI代劳。
五年的时间,AI就已经进化成了现在这样。技术的进步确实远远超过我们的预期,这一点是最可怕的。它的进步不是我们习惯的线性增长,而是一个指数性的增长,而且这个增长才刚刚开始。AI提供给我们非常强大的工具,创意的工具、写作的工具、设计的工具,同时也让我们思考到底原创性的边界在哪里,人类的主观能动性在哪里,包括知识产权,包括怎么尊重被采集数据的作者,他们是否也拥有一定的权利。所有这些问题都在一团迷雾当中尚待被理清和讨论。
我们是否将迎来
真正意义上的“文学已死”
如果科技真的到了我们无法分辨人类与机器的地步,哪怕只是语言层面上,都足以颠覆绝大部分行业及社会生活的面貌,因为人类无法离开语言进行思考、表达与交流。许多人类的职业会被替代,企业会高度自动化。机器能够无穷尽地生产出供人类娱乐的个性化内容,不输历史上任何经典的文学、影像或游戏。我们是否将迎来真正意义上的“文学已死”?
用AI写作之后,我有一个非常明显的感觉,就是人也好,机器也好,创作的过程其实没有太大区别。
我们写作、思考、交流,表达全都是用语言,那创作的本质到底是什么?可能就是把你读过的东西、你的体验、你的思考,重新排列组合成一种新的文字组合形式并表达出来,而机器是用一种数学模型来做它的排列组合。人可能要更加复杂,用大脑神经结合情感体验等等。但我觉得从根本上来讲,这两者的生成过程是非常相似的。就像人的写作很多时候也是从模仿开始,只不过人的大脑的“算法”是一个更内隐的过程,更像一个黑盒子,会被赋予一种神秘感,一种类似于灵魂的光晕,就是本雅明所说的Aura。而当我们真的试图去理解GPT到底怎么建出来的,你会发现非常多工程学上的具体实施细节,我们都不知道它的原理是什么,只是通过非常多的试错来达成。所以,AI跟人的大脑一样,我们都不知道它的底层逻辑是什么,都是黑匣子,只不过一个是碳基、一个是硅基。
当你看到一个机器,它用这么简单粗暴的训练方式,也能写出让你觉得“有一些东西”的文字时,就会开始回过头想,那么多作家、画家、诗人,这些艺术创作过程里到底有什么人类的独特性?我现在的答案是,可能并没有那么的独特,也没有那么的不可替代。
随着AI不断以这种指数级的速度自我进化、自我迭代,接下来,非常多人类本体的定义、人本主义的基础会被动摇,这是一个更深刻的东西,可能现在还没有被讨论得特别充分。我观察到人文学者,包括一些传统作家,他们面对新的事物还是比较保守,甚至很多会有一种拒斥心理。他会觉得这东西无非就是排列、组合、拼贴,从那么多东西里这儿抄一点、那儿抄一点,但我觉得这个东西可能没有他们想象的那么简单。原来大家会质疑AI无法创造新的东西,但现在意识到,人类创造的东西,很多也是通过原有的知识经验打碎重组,放到新的场景里去运用。
对于我来说,现在写作中最花力气的地方反而是在最不花力气的地方。这么说可能有点玄,它不在收集信息、理解科技、编排人物与拿捏故事原型,而是在于不经过理性思考判断,从潜意识层面涌现的直觉,也就是“非计算性”的部分。你无法控制它的到来,很多时候只能等待,只能祈祷。这或许是AI尚未通过语言模型学会的部分。
最新的ChatGPT及各种变体已经能够以超乎想象的流畅程度与人类进行对话以及进行特定领域的写作,比如财经新闻、体育报道、法律文书、论文摘要……甚至模仿历史上不同的作家风格进行创作。尽管生成内容的质量还不够稳定,且时常会犯一些常识性的错误,但目前也有科学家尝试教会机器理解我们所身处的“世界模型”。可以说,我们已经生活在这样的科幻现实中。如果科技真的到了我们无法分辨人类与机器的地步,哪怕只是语言层面上,都足以颠覆绝大部分行业及社会生活的面貌,因为人类无法离开语言进行思考、表达与交流。许多人类的职业会被替代,企业会高度自动化。新一代儿童会更习惯与机器进行交流,相比之下,人类的交流笨拙而低效,充满了误解。机器能够无穷尽地生产出供人类娱乐的个性化内容,不输历史上任何经典的文学、影像或游戏。我们是否将迎来真正意义上的“文学已死”?
发展人工智能,也是在认识人类自己,最后你也会去思考智能的本质是什么,意识的本质是什么,存在的本质是什么,它是否也是由语言、符号来定义的,它是否也是从一个混沌海量的数据里面,涌现出来的一种秩序感?而最后的最后,我们不得不质疑意识与智能的本质,因为从表征上已无法区分人与机器,那么,二者的界限在哪里?
如果从人类中心论的角度,未来无疑不站在我们这一边。但如果将机器也视为我们文明延续的产物,那么我希望,新的智能生命能够建立起更可持续发展的文明形态,并平等地尊重所有物种,包括非生命的环境本身。按照卡达肖夫指数(Kardashev Scale)对文明的分类,人类连全面利用行星级能源的一级文明都没有达到,我们没有任何理由自大甚至自恋,而应该以开放心态接受人类作为通往更高级文明形态(在詹姆斯·拉夫洛克看来是纯硅基生命的“新星世”)过渡期的命运。
彼得·沃茨的《盲视》以及最新一季《爱死机》里面的“虫群”,其实说的就是这样的无意识集群智能文明,自我意识对于它们来说是一种低效无用的冗余功能,就像盲肠一样。但我同样认为,在那样一种文明形态中会有不同水平的意识涌现,也许是宇宙级别的分布式意识,它成为塑造时空与不同维度现实的基础,而我们现在人类所谓的意识与文明,只不过是其中渺如烟尘的分型与投射。但仍然,人类有自己的命运,有自己的旅程,就像古希腊神话《奥德赛》一样,奥德修斯历经磨难,战胜了巨人与怪物,最后衣锦回乡,但他已经不再是原来的自己,他回到的也并不是原来的故乡。他领悟到更大的使命与归属,那种崇高感或许是跨越了一切物种与文明界限的终极意义。
而文学,毫无疑问正是承载这种文明崇高感与人类乡愁的意识织体。它将伴随着我们一直航向历史的尽头,无论掌舵者究竟是人类,还是机器。