A股上市公司传智教育(股票代码 003032)旗下技术交流社区北京昌平校区

 找回密码
 加入黑马

QQ登录

只需一步,快速开始

本帖最后由 长沙-小知姐姐 于 2020-1-16 11:18 编辑

一、垃圾文字生成器介绍
最近在浏览GitHub的时候,发现了这样一个骨骼清奇的雷人项目,而且热度还特别高。

项目中文名:狗屁不通文章生成器
项目英文名:BullshitGenerator
根据作者的介绍,他是偶尔需要一些中文文字用于GUI开发时测试文本渲染,因此开发了这个废话生成器。但由于生成的废话实在是太过富于哲理,所以最近已经被小伙伴们给玩坏了。

他的文风可能是这样的:


你发现,引经据典,头头是道,说好的狗屁不通在哪里呢?

还有这样的:



而且,同一个主题,每次点击生成,都会出现完全不同的文字。

二、垃圾文字生成器的来历
垃圾文字生成器的来历也很有意思,据作者说,最开始源于他在逛知乎的时候,发现有网友在退出学生会的时候,需要写6000字的退会申请。因为作者以前挺擅长写这类“狗屁不通”的文章。结果写了几句,突然想到还是写个程序生成吧。于是,狗屁不通文字生成器就诞生了。

目前,由于项目过于火爆,有一位同学,把生成器移植到了telegram上,获得了一只充满哲思的机器人。

当被问及“今天中午吃什么”这样一个世纪难题的时候,机器人回复了整整两屏幕信息:



也有一些同学,则致力于把这个项目推向国际。于是,英文版和日本版就诞生了。



还有些同学,开发出了手写体版本:



三、狗屁不通文章生成器是怎么实现的?
简单翻了一下源码,真的是特别简单,一点简单的废话语料库,一点字符串拼接语句就生成了华丽丽的几千字,我们来欣赏一下源码:

名人名言废话语料库,167行代码,这个只要添加更多的废话,就能生成更丰富的内容:



js版本生成算法:



py版本:



可以看出,没有用任何高级技术,不取巧,作者声明如下:

鄙人才疏学浅并不会任何自然语言处理相关算法. 而且目前比较偏爱简单有效的方式达到目的方式. 除非撞到了天花板, 否则暂时不会引入任何神经网络等算法. 不过欢迎任何人另开分支实现更复杂, 效果更好的算法. 不过除非效果拔群, 否则鄙人暂时不会融合.

这个文字细细读起来,还是挺有哲理的。

额,其实就是一本正经地说废话的那种感觉。你懂的。。。

四、最后,放上链接
狗屁不通文章生成器:
https://github.com/menzi11/BullshitGenerator

网页版:
https://suulnnka.github.io/BullshitGenerator/index.html
————————————————

原文链接:「十步杀一人_千里不留行」 https://blog.csdn.net/m0_37609579/article/details/103054993

0 个回复

您需要登录后才可以回帖 登录 | 加入黑马