文章原创度检测通常包括以下两大步骤:
此外,文中还提到了一种将文章手搓成 Token 炸弹的有趣玩法,包括编码和解码的方法。例如,在特定网站进行操作,将按钮切换到“Decode”可解码,切换到“Encode”可编码,输入隐藏信息并选择表情或字母,然后复制生成的内容。由于 Unicode 的特性,隐藏信息跨平台时不会被格式化,但在微信发送时有 1.5 万个 token 左右的极限值,超过则无法发送。在爬虫和不同系统中也有不同的表现,如在 Windows 系统导出 txt 文件会出现乱码,而在 Mac 系统打开则基本正常。这种 Token 炸弹玩法还可以用于躲避信息审核员、传输信息或当作数字水印。
之前给大家介绍了让ChatGPT根据已存在的文字反推提示词的逆向提示词方法,可以解决绝大部分静态文本生成问题,比如模仿某位特定作家的写作风格。[回顾:Prompt逆向工程:让ChatGPT模仿任何作家](http://mp.weixin.qq.com/s?__biz=MzkyODUzNTM2Mg==&mid=2247484376&idx=1&sn=3ede96b5c5f0c60c29290235fa0038c5&chksm=c21605f5f5618ce389375879b554c330aef3b298e9c631a429781d0bca1bae9d6b451a8f6d52&scene=21#wechat_redirect)今天,我要分享的是“对抗性演练”的逆向提示词技巧。这种方法是让ChatGPT扮演两个截然不同的角色,让他们展开激烈的辩论。通过多轮的辩论,我们可以整合两个角色的争论点,从而形成一个更为全面和精准的提示词。最近社群的朋友们讨论过一个文章原创度问题,非常适合作为这个技巧的示例:如何避免用AI写的文章,会被平台定义为低原创度而下架。那我们到底该如何看待文章的“原创性”呢?如何通过提示词技巧提高文章的原创性,今天一起来深入探讨一下。文章原创度检测过程,简单来说包括两大步骤:步骤1:从互联网或文章库中定位相似内容:1.文章被细分为小句或段落,使之更便于逐个对照。2.接着从每个细分内容中提炼关键词或词组,在网络或专业数据库中搜寻可能的相似内容。步骤2:评估文章与搜索出的内容的相似程度评估原创度
文章讨论了AI在软件运维中的潜力及其超越人类能力的决策力、准确性和一致性。文章举出了AI在数据驱动决策方面的能力,如它在国际象棋中的成功,以及它比人类处理和分析数据的速度快100倍。文章还强调了AI明显低于人类的错误倾向,以及软件运维中减少人类判断的需要。文章认为,AI可以解放人类从单调的任务,为创造力和想象力开辟出未知的领域。[heading2][人工智能计算指数报告](https://www.stateof.ai/compute)[content]AI报告计算指数跟踪公共、私人和国家高性能计算(HPC)集群的大小,以及AI研究论文中各种AI芯片的利用情况。作为训练和运行AI模型的主要基础,计算集群的大小和特定芯片的流行程度可以帮助我们对AI系统的发展进度进行热度检测。[heading2][Google Gemini吞噬世界-Gemini以5倍的速度击败GPT-4](htt[content]文章讨论了谷歌的Gemini模型,预计到今年年底,它的预训练FLOPS将比GPT-4提高5倍。文章还讨论了访问计算资源的双模分布,一些公司拥有大量GPU,而其他公司则拥有较少的GPU。文章认为,重点应该放在在共享基础设施上有效地服务多个微调模型,而不必付出小批量大小的成本惩罚。文章还提到,模型评估已经崩溃,对LLMs的排行榜化有不健康的痴迷。最后,文章建议,由于缺乏大量投资能力和选择保持GPU穷困的原因,欧洲初创公司和政府支持的超级计算机正在落后于竞赛。
把文章里我埋彩蛋的“n????????????????????︊????????????????????????????????︊︊?????????????????????︊︊︊︊???????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????︊︊︊????????????????????????????????︊︊?????????????????????︊︊︊︊???????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????︊︊”直接复制到第一个网站,点击“Decode”按钮,即可进行解码。你可以发现,其实我往这个单词里面,藏了《双城记》英文版的一整章。。。说完了解码,那如何编码呢?也就是如何把隐藏信息灌进字母里。还是在这个网站操作。把按钮切换到Encode,把想藏的信息输入进上面的文本框,然后在下面任意选一个表情or字母即可。之后你就可以复制最下面文本框里的表情or字符,用微信发给朋友或者存在word文档等平台了。而且,因为Unicode的特性,实测下来,隐藏信息并不会因为跨平台而被格式化掉。你还是可以把编码玩的字母,发给微信的朋友,就能给微信页面干死机。或者会显示输入文字过长,无法发送。我大概测了下,这个极限值是1.5万个token左右,超过就在微信里面发不出去了。爬虫也一样。我用Trae写了一段爬虫,把那篇文章给爬下来了。稍微一运行这段代码,在下面的终端界面里,只要是我埋的token炸弹的位置,全部一片空白。如果用windows系统导出txt文件,就会全部是乱码。如果是Mac打开这个txt文件的话,显示的内容就像右图,倒也基本正常。但是其实这个token炸单,还是保留的。真的非常非常好玩。你甚至还能用这种暗号躲过信息审核员,把它放到网站上,传输信息。甚至还能把它,当数字水印用。