daily.zhihu.com

如何处理图片才能避免图中文字被 OCR 识别? (opens in new tab)

井韶子,microcosm 查看知乎原文 【三更】:有人私信韶子说建议删除代码,如果有人用它干坏事的话,可能会有法律风险。就……反正多一事不如少一事,删了。大家想测试的话,应该随便找一个大语言模型都能写出来,韶子这里就不放了。 【二更】:大家检测的时候注意,前面《临江仙》的例子是大字藏小字,检测出《中国社会各阶级的分析》才算成功;后面“xxxx 全国包过……”的例子是小字藏大字,检测出“xxxx 全国包过……”才算成功。手机端图片似乎有压缩,电脑端应该能获取原图。手机端可以试试文章开头这两张竖版的。(p.s.话说知乎怎么上传不了原图) 【一更】修改了一下藏字的逻辑,从全局由上至下由左至右的顺序改为大字逐字填充的顺序,降低了人眼识别小字时的难度,识别起来更方便了。代码同步更新放在文末了。 大字 300 像素,小字 12 像素,行间距 1 像素,字间距 1 像素 大字 400 像素,小字 30 像素,行间距 0 像素,字间距 0 像素 【以下是原回答】 太简单了。 正所谓堵不如疏。想让 OCR 识别不出文字的最好方法,就是让他识别出文字,用识别出的文字来迷惑模型,使它认为这个位置已经...

Read the original article
Sign in to keep reading the full article.

Keyboard Shortcuts

Navigation

Next / previous post
j/k
Open post
oorEnter
Preview post
v

Post Actions

Love post
a
Like post
l
Dislike post
d
Undo reaction
u
Save / unsave
s

Recommendations

Add interest / feed
Enter
Not interested
x

Go to

Home
gh
Interests
gi
Feeds
gf
Likes
gl
History
gy
Changelog
gc
Settings
gs
Discover
gb
Search
/

General

Show this help
?
Submit feedback
!
Close modal / unfocus
Esc

Press ? anytime to show this help