admin管理员组文章数量:1439800
我把我的文章手搓成了Token炸弹,发现这样居然还能防AI洗稿。
今天给大家看个新东西,聊一聊我在怎么防AI洗稿。。。
对于我这种内容创作者来说,最怕的洗稿方式是什么?
不是全抄,全抄的话很好举报,而是一帮AI抄袭缝合怪。
经常会有人,复制我文章里的某一段话,然后用AI重写后,贴到他们的文章里去。
主要,这玩意儿还很难举报,因为根本没法管。
我曾经想过用一些手段,来防止洗稿,但是没什么用。
直到之前,我往回翻的时候,看到了一篇帖子。
这是OpenAI的创始成员Karpathy之前发的推文。
这个帖子的大概意思就是,它在一个emoji藏了很多信息,而这些信息,是你看不见的。
然后直接把DeepSeek R1干懵逼了10分钟。
你可能会非常好奇,往emoji里面藏信息,跟洗稿有啥关系。
最开始的时候我也没想到有啥关系,直到我把尝试了一下,在一篇文章中中用这种方式埋了Token,看到这篇文章在公众号后台的正文字数从2000字变成了将近3w字。
我悟了。
于是我几天前写了一篇关于Claude 3.7的文章,在这篇文章里,就埋下了这个菜单,昨天关于Manus的那篇也埋了。
你们可以去试一试,把这篇文章复制到word里。(有死机风险,谨慎)
但是如果你们看完全篇的话,会发现,文章满打满算也就2500字。
而这多出来的1w多字,就是我用Karpathy说的方法,往文章里埋的彩蛋。
你我都不会看见,但是字数统计会发现。
而现在一般的国产AI产品里,会有一个很有趣的设定。
就是token限制。
如果你把这篇文章,发给一些改写工作流的智能体,你就会发现。
而发给一些AI Chat呢。
Gemini也自己截断了。
GPT 4o也懵逼了。
这个时候,其实就用一种非常原始、非常粗暴、非常智障的方式,能限制洗稿,因为根本输不进去。
直接变成Token炸弹。
当然,坦率的讲,对于一些推理模型来说,防不住,这个我是真没招。
而对于做RAG和知识库来说,却并没有任何影响,可以正常问答。
所以也可以避免,误伤友军。
这里,我也给大家举个通俗易通的例子,来讲下这玩意原理是个啥,以及怎么做我文章里的这种Token炸弹。
我们全世界的人在系统上,能看到统一文字,主要得益于Unicode,你可以理解为这是一本全球大字典,把地球上所有国家、所有民族用到的文字、符号和表情,统统都收进来了。
然后每个字符,都给它安排了一个固定的、不会重复的编号。
比如:字母「A」的编号是U+0041,汉字「你」的编号是U+4F60,表情符号「
本文标签: 我把我的文章手搓成了Token炸弹,发现这样居然还能防AI洗稿
版权声明:本文标题:我把我的文章手搓成了Token炸弹,发现这样居然还能防AI洗稿。 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.betaflare.com/biancheng/1747685383a2743292.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论