炼数成金 门户 商业智能 自然语言处理 查看内容

用神经网络续写《权力的游戏》,这个脑洞有点大

2017-9-29 16:15| 发布者: 炼数成金_小数| 查看: 19795| 评论: 0|原作者: Sam Hill|来自: 权游迷妹
摘要: Winter is coming……“权力的游戏”第七季史诗结局了,但是听说这个系列的最后六集最早要等到2019年春天的时候才会播出。不过,这部剧进行到这里的最大赢家恐怕就是上图这位囧雪同学,毕竟他除了在剧里复活了,在剧 ...
网络 工具 模型 神经网络 商业智能
Winter is coming……
“权力的游戏”第七季史诗结局了,但是听说这个系列的最后六集最早要等到2019年春天的时候才会播出。

不过,这部剧进行到这里的较大赢家恐怕就是上图这位囧雪同学,毕竟他除了在剧里复活了,在剧外还和女野人“火吻”耶哥蕊特的扮演者露丝·莱斯利(Rose Leslie)订婚啦❤


吃完狗粮,说说该剧原著小说《冰与火之歌》的事。

冰火系列小说的第五部 《与龙共舞》在2011 年出版之后,作者乔治·雷蒙德·理查德·马丁(George R.R. Martin)一直在为第六部《凛冬的寒风》而努力,但发布时间一直遥遥无期

而且你还拿作者没有办法,


由于没有新的创作素材,电视剧的制作人士自第六季以来一直被迫想方设法将故事向前推进,因为催更的群众囊括世界。


因为厌倦了苦等,一位全栈软件工程师Zack Thoutt正在训练一个循环神经网络(RNN)来预测未完成的第六部小说的情节。他让神经网络学习《冰与火之歌》前五部5000页的文本内容,然后续写了接下来的剧情。

只需给神经网络提供一个角色名字作为中心词,它就能创作出一个章节!


“我是‘权力的游戏’原著和电视剧的铁杆粉丝。”Thoutt说,

神经网络是一类仿照人脑的机器学习算法,循环神经网络是其中一个子类,它可以很好地处理数据序列,比如文本。

“使用vanilla神经网络,你可以接收输入数据集合,将其传递到神经网络中,并得到一个输出集合。”

“为了训练这些模型,你要预测这些模型的输出,这通常被称为标签或目标变量。神经网络通过比较它输出的数据和目标变量来更新神经网络,从而使得学习结果更符合目标预期。“

而Thoutt正在使用具有更好记忆力的“长短时记忆(LSTM)”RNN结构,这正是训练一个神经网络记录数千个字前的情节点的关键。

理论上说,这种记忆力应该可以防止神经网络重复已经发生的事件,从而让生成的书籍是一个连贯的剧情,而不是一个已经发表的作品的替代版本。

在这个意义上,神经网络正试图写出真正的续集,尽管很明显它会不时地出点差错。

例如,在某些情况下,它还是会写已经死亡的角色。

“它正在试图写一本新书,一个完美的模型将会考虑到书中发生的一切事情,而不是把一些在两本书前去世的人物当做现在还活着去写,”

Thoutt说,
“现实情况是,这个模型还做不到这点。如果这个模型有那么好的话,作者们可就麻烦大了。这个模型正在努力写一本新书,把所有的东西都考虑进去,但它犯了很多错误,因为目前还不存在可以用来训练一个完美到能够从数百万个单词中记住复杂情节的文本生成器的技术。”

在将该系列的前五本书的5376页添加到神经网络之后,Thoutt已经“创作”了五个预测的章节,并在GitHub上发布了该项目。

“我开始创作一个章节的时候,会提供给神经网络一个中心词——一个角色的名字,并告诉它在此之后要有多少单词生成,”

“这样,生成文本将像原作一样每章围绕一个人物展开,除了提供第一个中心词给神经网络之外,无需其他的操作。”

Thoutt训练出的AI生成的文本具有相当可读性,友情提示,以下包括AI预测及粉丝脑洞,剧透预警!!

例如神经网络预测,Sansa Stark实际上是House Baratheon的一份子。AI书里写道:

“我害怕Sansa Stark,”Ser Jamie提醒了她。“她是拜拉席恩家族的一员,你的洋葱妃的次子们。”



“这是它创造的第一句话,我觉得它很有趣,”Thoutt说。Sansa有可能其实是King Robert 的私生女,像John Snow一样被stark 家族养大,隐藏身份。

在原书系列中,次子军团是向龙母效忠的军队。至于“洋葱妃”是个什么鬼??我们必须等AI创作更多的章节出来才能了解更多的信息。


这个神经网络还创建了一个名叫Greenbeard的新角色:

"Aye, Pate." the tall man raised a sword and beckoned him back and pushed the big steel throne to where the girl came forward. Greenbeard was waiting toward the gates, big blind bearded pimple with his fallen body scraped his finger from a ring of white apple. It was half-buried mad on honey of a dried brain, of two rangers, a heavy frey.

“这显然不是完美的。这个故事很短,有语法错误,但是神经网络能够展现出基本的英语语言能力,并在模仿老爷子的语言风格,”Thoutt说。

并不是所有的预测都完全脱离了基础。

据神经网络预测,詹米最后会杀死他的恋人和姐姐——瑟后,囧雪会骑上龙,瓦里斯会对龙妈下毒。

这是所有电视剧的粉丝们都做过的臆测——

Jaime killed Cersei and was cold and full of words, and Jon thought he was the wolf now, and white harbor......

“我认为这验证了在权力的游戏中,“凡人皆有一死”。我没有从粉丝们在网站上臆测的那里向神经网络提供任何东西,只有这些书。”Thoutt说。

小说里出现了大约32,000个单词,这使得训练神经网络变得更加困难。

“马丁的文字极富表现力,额外的副词、头衔和虚构的地点让训练神经网络更难了。”

另外,这五卷小说的文字实际上是一个相对较小的数据集。训练一个循环神经网络更理想的资源是这个系列100倍大、仅仅包含儿童书的词汇水平的语料库。

Thoutt已经考虑为数据集添加额外的文本,例如电视剧的脚本,但这可能让生成的文本失去老爷子的写作风格。

谁知道谜一样的绿胡子(Greenbeard)会不会在第八季的开头从天而降,夺走铁王座呢

原文链接:https://motherboard.vice.com/en_us/article/evvq3n/game-of-thrones-winds-of-winter-neural-network

Github链接,可以生成你自己的冰火新章节哦:https://github.com/zackthoutt/got-book-6

欢迎加入本站公开兴趣群
商业智能与数据分析群
兴趣范围包括各种让数据产生价值的办法,实际应用案例分享与讨论,分析工具,ETL工具,数据仓库,数据挖掘工具,报表系统等全方位知识
QQ群:81035754

鲜花

握手

雷人

路过

鸡蛋

相关阅读

最新评论

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

  GMT+8, 2017-12-15 08:49 , Processed in 0.248762 second(s), 25 queries .