LizLiz
← Articles

骗子是最诚实的市场研究员

2026-05-26

3k 字

9 min read

调研了 15+ 个 X 黄推屏蔽工具之后,我发现真正缺的不是又一个 Chrome 扩展。

骗子是最诚实的市场研究员

一、万达广场

中文 X 的热帖评论区,一层又一层色情引流号、诈骗号、营销 bot。年轻女性头像,几句模板话术,点进主页就是陷阱。

最经典的一句:

有万达广场附近的吗?

这句话恶心——但它设计得很准。

「万达广场」不是随机选词。它是一个中国城市居民几乎都知道的商业地标。有人流、灯光、监控、电影院——听起来不像骗子会出没的地方。

「附近」又足够模糊。无论你在哪个城市,这句话都能成立。骗子不用知道你在哪,只要借一个全国高密度品牌,制造"她好像就在我旁边"的错觉。

主页里再写「距离 1 公里」,诱饵就完整了。太远懒得动,太近假得离谱——1 到 3 公里刚好落在"值得去一趟"的心理安全区。

这不是随手乱写。骗子是最诚实的市场研究员。他们不为表达自我而选词,只为转化率负责。当一个群体开始反复使用某个词,这个词在大众认知里已经有了稳定信用。

屏蔽黄推因此不是一个伪需求。用户不是在屏蔽单个账号,而是在对抗一套会迭代、会 A/B test、会低成本污染注意力分发渠道的自动化系统。

但真需求,不等于值得从零做一个新产品。

二、沉默的那几秒

我一开始的直觉是:需求这么大,肯定没人认真做。

调研之后发现完全相反。做的人不少,而且有些人做得很好。好到我在 Chrome Web Store 看到下面这两个数字时,沉默了几秒。

Twitter 鸟盾。评分 4.5★,556 人评分。做了三年。

我深入看了它的能力。远不止"屏蔽"——它有一套完整的表达式 DSL:用户可以写 followers_count<100 & created_date<1m & tweet_text*=约 来匹配黄推 bot。支持 block/filter/mark 三种处理动作、正则、模糊匹配、数值比较、日期比较、黑名单订阅。它还附带界面优化、视频下载、搜索助手、用户备注。开发者维护着一个 Discord 社群。

它是闭源的——GitHub 仓库只有 logo、README、和一个空目录。但它的用户量很可能是这个市场的第一名。

6551 推文过滤器。评分 4.1★,514 人评分。

WASM + JSON 远程加载规则,账号/关键词/用户名三种过滤方式。支持手动上报、误报反馈、白名单管理。开源。

两个产品加起来,一千多人愿意给评分。实际安装量估计数万。这不是小众市场。

还有更多。

Make X Great Again (MXGA)。罗磊——前阅文集团高级前端、独立开发者/YouTuber——做了一个五功能的 X 增强工具。当前只有反 spam 上线(Pillar 01),KOL 评分浮卡、Profile 摘要、社交图谱信号、数据导出都列在 Roadmap 里。AGPL-3.0 开源,API 公开含 evidence_text/reasons/reporters 等字段,治理体系(GOVERNANCE.md + 审核台 + 白名单 + 多签 + 每 6h Git 审计同步)在同类项目中是最透明的。2026-05-25 发布,stars 75。

PureTwitter。2023 年上架的黄推屏蔽扩展,曾被小众软件推荐,关键是——在 2023 年就有人在做了。

X Fraud Scanner。Greasy Fork 上的 Tampermonkey 脚本,专注中文诈骗/色情引流。它的规则集让我意识到这块已经有人深耕到什么程度:心形 emoji 检测(甚至处理了 Twemoji img alt 为空时失效的 edge case)、夸克/UC 网盘链接识别、ASCII partial match 防误报("dd" 不匹配 "daddy")、两阶段全量扫描(先等动态加载再从底部上扫)。版本号 4.7。

mass-block-twitter。GitHub 57 stars,Chrome+Firefox+Edge 全平台,社区共享屏蔽名单。

X Filter Pro。商业产品,免费+$2/mo Pro 订阅,主打 engagement threshold——点赞数低于 5 的回复直接隐藏。

另外至少还有七八个一键 block/关键词过滤/按地区屏蔽/互fo 折叠/大外宣屏蔽的扩展和脚本。

这轮调研里,真正有价值的不是我多聪明,而是把直觉交给外部证据打了一遍:Chrome Web Store、GitHub、Greasy Fork、项目文档、以及 Claude Code + Exa 的交叉审计。翻到一半,我意识到一个问题。

三、问题变了

不是我一开始想的"这个需求有没有人要"。也不是"我要不要也做一个"。

而是:这些人做得怎么样?他们没做好什么?我做那个没做好的东西,需要多长时间?

我仔细看了鸟盾的表达式手册,看了 MXGA 的 API 响应,看了 X Fraud Scanner 的 changelog。

结论是:

规则,已经有人在写了。 鸟盾有 DSL,MXGA 有 AI 模型,X Fraud Scanner 有经过 4.x 迭代的中文诈骗检测逻辑。

数据,已经有人在存了。 MXGA 的 API 返回 1434 条记录,每条含 verdict_label/confidence/reasons/evidence_text/reporters。鸟盾有用户互相订阅的黑名单体系。

治理,基础形态已经有了。 MXGA 有 GOVERNANCE.md、审核台(review desk)、白名单(39 条)、多签确认(multi-sig)、完整操作日志每 6 小时同步到 GitHub——任何变更都可以被审计。

那么漏了什么?

如果鸟盾、MXGA、6551 都装好,打开同一条热门中文推文的评论区——

  • 鸟盾会标记一些账号(基于 DSL 规则匹配)
  • MXGA 会标记一些账号(基于 AI 判定 + 置信度)
  • 6551 会标记一些账号(基于远程规则和用户反馈)
  • 三个工具标记的账号不完全重叠
  • 而且没有人告诉你在同一批样本上谁的命中率更高、谁的误伤率更低

这就是那条缝。

不是"缺规则/数据/benchmark/治理层"——那是排比句,不是分析。缺的是可比较的、可公开获取的、告诉你"到底谁更准"的那一层

缺一个人把鸟盾、MXGA、6551 装好,打开同一批中文推文的评论区,记录三个工具的判定结果,做一个人工标注作为 ground truth,算两个数字——精确率和误伤率——然后公开。

这件事不需要写一行代码。

四、三件事,不写代码

我不建议写一个新的 Chrome 扩展。理由很简单:写不过鸟盾三年的功能积累,也写不出 MXGA 的 AI pipeline。拿产品热情对抗已有分发——向 556 个评分发起自杀式冲锋——胜率不高。

但可以做一个不用写任何新扩展却比那些扩展更有价值的东西:信息差。

一小时:做对比测试。

安装鸟盾、MXGA、6551。找 3 条热门中文推文(回复数 > 50),各取前 20 条回复,总共 60 条。记录:鸟盾判定结果、MXGA 判定结果、6551 判定结果、你自己的人工判定(黄推/正常/边界)。

产出:一张四列对比表。

这张表的价值在于——在它之前,没人知道这三个工具在中文黄推场景下谁更准。它可以直接变成一篇博客、一条推文线程、或者 MXGA / 6551 的 GitHub issue。

如果这张表发出去没人看——那说明这个市场小到连一篇对比文章都传播不出去。那更不值得写代码。关掉,干净利落。

半小时:抓鸟盾的数据源。

打开 Chrome DevTools → Network → 刷新 X 页面,找鸟盾扩展发起的网络请求。看它从哪个 URL 下载黑名单数据。

如果找到了——鸟盾 556 个用户的贡献数据可以做一个桥梁接到 MXGA 的公榜,两家用户的名单资产都能增值。

如果找不到——鸟盾的闭源壁垒成立,放弃"兼容鸟盾"的方向。不要做"birdshield-to-mxga 转换器"——你连转换的源数据在哪都不知道,写什么转换器。

如果前两件事是绿灯:提 PR。

给 MXGA 提一个 PR,不是泛泛的"中文规则包",而是 20 条经过你手动验证的中文黄推账号 + 证据文本 + 为什么 MXGA 的 AI 没抓到。

不需要另起一个"x-spam-rules-cn"项目。直接送到现有用户面前。

五、还要补的纠偏和延展

这篇文章的判断已经比第一版实,但还不能写得像终局结论。几个边界要补清楚:

第一,6551 不能只当背景板。 既然它有 514 个 Chrome Store 评分,下一轮对比就不该只测鸟盾和 MXGA,而要把 6551 一起装上。否则文章又会犯同一个错误:被更会讲故事的项目吸引,漏掉真正有用户采用的产品。

第二,Chrome Store 评分不是安装量。 它只是比 GitHub stars 更接近终端用户采用的信号。556 个评分不等于 556 个用户,也不自动等于产品最好;它只能说明:这个产品已经越过了"玩具项目"阶段,新进入者不能假装市场空白。

第三,鸟盾的数据源还没验证。 现在能说的是:鸟盾有订阅、黑名单、表达式 DSL 和长期用户沉淀。不能直接说它的数据可以导出、可以兼容 MXGA、可以转成公共规则。这个判断必须等 DevTools 抓到真实请求之后再写。

第四,X 帖和微信文章适合作为入口,不适合作为证据终点。 它们能告诉我中文社区正在讨论什么、谁在做、用户痛点是什么;但平台内容抓取不稳定,正文不可访问时,不能把它们包装成已验证事实。最终事实要落到项目文档、商店页、代码、API、评论、可复现实测。

第五,如果对比测试跑出来,最好先发布 benchmark,而不是产品。 一个公开的样本表、标注规则、命中/误伤统计、复测方法,比一个没人安装的新扩展更容易获得反馈。真要收费,也应该等 benchmark 证明你确实比现有工具更准、更省心、更可信。

六、底线

很多产品调研的结论是"可以做"或"不要做"。

我的结论是:先别判断要不要做。先用一个下午验证你是不是这个市场里唯一愿意做对比的人。

如果别人已经做了对比,而且做得好——读他们的结论,省下 80 小时开发时间。

如果没人做过——那你花一个下午做完对比的那一刻,你就已经在这个市场里有了一个别人没有的东西。

信息差。比一个没人安装的 Chrome 扩展值钱得多。

References

原始线索:

延展调研对象:

  • Twitter 鸟盾 / Bird Shield:Chrome Web Store、Edge Add-ons、项目公开文档与 GitHub 数据分发仓库
  • 6551 推文过滤器:Chrome Web Store 与 6551Team/6551-plugin
  • PureTwitter:Chrome Web Store 与小众软件推荐线索
  • X Fraud Scanner:Greasy Fork 脚本与 changelog
  • rxliuli/mass-block-twitter
  • slarkvan/Block-Pornographic-Replies
  • merginit/x-spam-sweeper.extension
  • X Filter Pro

本文基于 2026-05-26 的市场调研,覆盖 Chrome Web Store、GitHub、Greasy Fork、Exa OPINT 与 Claude Code 交叉审计。X 帖和微信文章主要作为线索入口;在正文不可稳定抓取时,不把它们当作事实终点。商店评分、项目功能和 API 字段以当日可访问页面为准,仍可能随项目更新变化。