人工智能写作指南v10
时间:2021-01-21 23:45

  这是一个机器人写稿的时代,智能写手应用的行业涉及非常广,有新闻业、业、广告业、自行业等等,跟文字生产有关的都有所应用。

  其实不然,目前,新闻机器人主要用于以数据为基础的报道领域,例如公司年报、股票市场、地震报道和体育报道等等数据类的新闻。

  主要是使用机器学习、深度学习等算法来生成文章或辅助写作。应用有写稿机器人、写作辅助工具、智能写诗、写春联等。

  主要用于写新闻报道,甚至能够对事实进行评论。比如在体育报道方面,它能够充分理解“反败为胜”“团队努力”之类的专业术语,同时根据自己的判断对体育比赛最重要的方面进行报道。它不会单纯地复述事实,而是会给文章加入一些不同的元素。

  通常缩写成IF,指在软件模拟的中,读者通过输入纯文字命令来控制人物和影响,从而完成故事讲述。通俗一点的理解,可以将它看作是文字版的冒险或RPG游戏。

  由于是涉及到文学作品的生成、创作,计算机、人工智能改变了以往的叙事逻辑,我们可以技术的帮助下,进行非线性的叙事创作。

  使用创新的创作技巧撰写非凡的文本,专注于新的写作方法,而不是传统的抒情或叙事手法。下面分别从新闻生产、新内容生成、文学作品、书籍内容生成来介绍。

  来源于《纽约时报》研究与发展实验室提出的「Particles理论」,这套理论核心是:给新闻编码。

  从而,所有的资讯内容都为了可供拼装的“颗粒”,每个部分都被重新编码,添加标签,而且是可以被嵌入的。

  用机器完成内容的生成,思来源于一款叫「新闻七点钟News at Seven」的应用,利用现有的网络资源、外部文本、多资料库和用户偏好,来为用户创建个性化的音频和视频内容。

  第四,输出一个在线Flash短片,用人物形象模仿传统的晚间新闻形式,来向用户播放内容。

  这部分是来源于Wikibook-bot的一项技术,是由以色列内盖夫本古里安大学的沙哈尔阿德马蒂Shahar Admati 及其同事开发的;

  第四,文章清洗,规则类似于pagerank的原理,文章通常通过超链接指向其他文章,在网络上搜集出通过点击超链接三次以内得到的所有文章作为优质的文章。每本人工维基教科书都有自己的网络结构,其决定因素包括,引用该文的文章链接数量、指向其他文章的链接数量、所包含文章的页面排名列表等。

  第六,每一个类别主题对应的文章的再次清洗,该算查看每一篇给定主题筛选出来的文章,接着判断如果将其添加到维基教科书中是否会使该书的网络结构与人工创作的书籍更相似。如果不相似,那么该文章就会排除在外。

  第七,将每一个类别主题对应的文章组织成章节。主要借助聚类算法,结合由整组文章组成的网络,找出如何将其划分为连贯的集群。

  第八,确定文章在每个章节中的出现顺序。使用的是枚举,然后排序的思,通过给文章成对分组,对所有文章枚举所有组合,然后使用网络模型来计算排序逻辑,最终计算出更为理想的文章顺序以及章节顺序。

  为了实现写作类的应用,需要对文本进行大量的处理,NLP是一种让机器能够像我们平常那样阅读和理解语言的技术。常常会结合知识图谱来使用,以提升产品效果。

  Grammarly是一款全自动英文写作工具, 可以实时检查语法,一边写一边改,语法问题和修改意见会以标注的形式显示在文档的右侧,方便用户去一一查看,而且在每条批注下面都会配有详细的解释,告诉用户哪里错了,为什么要这样修改。

  百度人工智能写作辅助平台“创作大脑”,智能助手可以为人类创作者提供纠错、提取信息等各种辅助工作。

  通过各种各样的关键词,结合文章要求,分析词汇,辅助语句,以及整篇文章的思维逻辑,能够自动智能化的进行写作。

  一款基于人工智能与认知科学的中文写作辅助工具,开智团队研发。内置数百万条错误规则,可迅速检查各类文本错误。同时,写匠还融合古典风格、广告法写作规则,为用户提供细致指导。

  2009年,美国西北大学研发的StatsMonkey「统计猴子」系统就撰写了一篇关于美国职业棒球大联盟季后赛的新闻;

  在2014年,与Automated Insight公司达成协议,成为机器人记者的早期的采用者。

  2014年3月,第一条完全由计算机程序生产的新闻报道产生。作为首家“聘用”机器人记者的主流,《时报(LA Times)》在地震发生后3分钟就发布了首条相关新闻。

  我们需要知道「机器人记者」并不是真正的职业记者,而是一种新闻报道软件,拥有自动撰写新闻故事的功能。相类似的概念有算法新闻、自动新闻。

  一般都会形象地,描述机器人记者在单位“上班”,机器人具备“真人记者”所有的采编功能,不会出错,不用休息,所写的文章不仅时效性强,质量也高,工作效率比“真人记者”高出好几倍。

  由美国叙述科学公司Narrative Science发明的写作软件;这个软件拥有自动撰写新闻故事的功能。

  基于选题和新闻热点追踪,通过平台授权,结构化采集、处理、分类、分析原始数据素材,快速抓取,生成新闻关键词或线索,然后,利用文本分析和信息抽取技术,以模板和规则知识库的方式,自动生成完整的新闻报道。

  记者彼得•奥尔德乌斯Peter Aldhous,开发了这个项目,他使用了机器学习——特别是「随机森林random forest」算法,从大量的飞机飞行数据中,建立了一个模型,可以根据以下数据:

  「快笔小新」的写稿流程由数据采集、数据分析、生成、编发四个环节组成,这一机器人适用于体育赛事、经济行情、证券信息等快讯、类的写作。

  腾讯在2015年9月推出了一个叫 Dreamwriter 自动化新闻写作机器人。最开始,这项技术主要用在财经领域,现在它在体育赛事的快速报道中也有很成功的应用案例了。

  2016年里约奥运会期间,Dreamwriter 就自动撰写了3000多篇实时战报,是奥运报道团的“效率之王”。

  在“2017腾讯+峰会”现场,Dreamwriter 平均单篇成文速度仅为0.5秒,一眨眼的时间就写了14篇。

  Heliograf机器人记者,在报道2016年夏季奥运会和2016年选举时证明了它的有用性;

  还帮助《邮报》在一年一度的全球大中获得了「巧妙使用机器人Excellence in Use of Bots」

  2014年,英国《 Guardian》进行了纸质测试计划,安排“机器人”统计分析社交网络上的共享热点和注意力加热,然后内容过滤、编辑排版和打印,最后制作一份。

  应用于金融投资研究报告片段的摘录,网站会提醒读者那一段摘录是由机器人完成的,哪些是由人类完成的。主要摘录类似于以下的文字:

  《时报》靠「机器人写手」,第一时间报道了美国2014年3月18日当地时间早晨发生4.4级地震;

  还应用机器人编辑Blossom预测哪些文章有可能会在社交网站上引起,相应地给版面责任编辑提出;

  2011年,开始使用叙述科学公司 Narrative Science 的自动写稿程序来撰写新闻;

  应用机器人系统Cyborg,帮助记者在每个季度进行大量的文章撰写,数量达到数千篇,包括各公司的财报文章等。机器人可以在财报出现的一瞬间就对其进行详细的剖析,并且提供包含这些相关事实和数据的实时新闻报道,速度非常迅速。

  从2014年7月开始使用语言大师 Wordsmith 软件,利用自动化技术来写公司财务报表。几毫秒的时间,软件就能写出一篇风格的完整报道。

  结合硬件,还有人形机器人版本的机器人记者的出现,例如中国智能机器人佳佳作为特约记者越洋采访了美国著名科技观察家凯文·凯利。

  按照美国新艺术理论家马诺维奇(Lev Manovich)在《新语言》一书中对新技术所下的定义:

  他撰写了大量互动小说文章,发布在博客Grand Text Auto上,同时也开发了许多数字诗和文本生成器。他最近的着作是「The Future」和「The Truelist」,有兴趣可以去了解下他的研究。

  人工智能应用于文学创作领域,为文学作品带来了新鲜血液,与文学作品的结合还增添了作品的互动性,与游戏、电影产生了跨界交融。

  其产品包括匹配创作者和读者的机器写作,识别故事“趋势”,根据主题进行创意写作等;还开发了视频讲故事的应用「Raccoon」;

  这是一个故事版的YouTube,专注于非虚构的,基于视频的,连接全球各地愿意分享、观看视频故事的用户。作者用视频的形式讲一段故事,用户可以收藏或分享。

  对社交上信息的重组,从而产生了新的文学形式。这时候机器类似于记者,采编社交上的用户发言,而生成报道。

  它搜索类似“这是 + 点 + 分 + 上午/下午 + 和 + ”这类结构的句子,构成一份包含全球日常活动的日记。

  把推特中的内容,按照奥斯汀原文中的对话的风格,来重新生成。原理是替换相似内容的用词,让对话看起来“更接地气”:

  它是根据同名科幻小说改编的互动版,虽然开头部分与原小说非常类似,但随着故事的开展。及用户的参与,出现了很多新的故事情节和从而产生了各种不同的结局。

  是一款漫画风格的互动故事书式的手机游戏,出自《谷》首席设计师之手,讲述了女主人公Florence Yeoh的初恋故事。

  凭借互动版《黑镜》,Netflix再次向世界证明自己“用技术打破传统、引领内容创新”的价值观。

  观众用触屏、鼠标、遥控器等就可以自己控制剧情和主角命运;选择不同,每个观众看到的内容就不同、故事结局也因人而异。

  编写的程序从「Project Gutenberg古腾堡项目」的侦探小说中搜寻包含下列一系列单词的语句:问题、凶手、证人、目击、场景、杀手、武器、线索、、。

  随后,程序用采集的每个语句检索Flickr,并把图像拼接成漫画的形式,合成对话框,最后以一个怪异而神秘的黑色故事作为结尾。

  我们已潜移默化地理解机器的工作方式,用机器所习惯的语言与机器沟通。例如,我们在适用搜索的时候,是不是跟我们日常的语言所不一样,我们习惯了不断变换关键字,不断组合关键字来与机器沟通。

  以文章是否读起来像人类作品作为评判电脑作品的依据是迂腐的,因为什么样的语言能够被称作“自然语言”的标准是相对的,而不是绝对的。

  机器生成文章,以人类作家的标准去评判,是目前大众所认为的“正确”的事,然而,正是由于是机器生成的,有机器自身的独特风格,那有没有一种评判标准,脱离人类的评判标准,但符合机器的特点?

  The Seeker的每次运行都是独一无二的,因为它依赖于外部随机性(在本例中为WikiHow)。

  作者使用了情绪分析算法,根据文本的情绪特征对其进行分级,并据此规则改写Gustavus Hindman Miller的《10000个梦的解释》。

  这是Kazemi在2015年的NaNoGenMo作品中加入这种新的人机交流形式,让人和算法一起“合作”写小说;