骗子是最诚实的市场研究员

2026-05-26

3k 字

9 min read

调研了 15+ 个 X 黄推屏蔽工具之后，我发现真正缺的不是又一个 Chrome 扩展。

骗子是最诚实的市场研究员

一、万达广场

中文 X 的热帖评论区，一层又一层色情引流号、诈骗号、营销 bot。年轻女性头像，几句模板话术，点进主页就是陷阱。

最经典的一句：

有万达广场附近的吗？

这句话恶心——但它设计得很准。

「万达广场」不是随机选词。它是一个中国城市居民几乎都知道的商业地标。有人流、灯光、监控、电影院——听起来不像骗子会出没的地方。

「附近」又足够模糊。无论你在哪个城市，这句话都能成立。骗子不用知道你在哪，只要借一个全国高密度品牌，制造"她好像就在我旁边"的错觉。

主页里再写「距离 1 公里」，诱饵就完整了。太远懒得动，太近假得离谱——1 到 3 公里刚好落在"值得去一趟"的心理安全区。

这不是随手乱写。骗子是最诚实的市场研究员。他们不为表达自我而选词，只为转化率负责。当一个群体开始反复使用某个词，这个词在大众认知里已经有了稳定信用。

屏蔽黄推因此不是一个伪需求。用户不是在屏蔽单个账号，而是在对抗一套会迭代、会 A/B test、会低成本污染注意力分发渠道的自动化系统。

但真需求，不等于值得从零做一个新产品。

二、沉默的那几秒

我一开始的直觉是：需求这么大，肯定没人认真做。

调研之后发现完全相反。做的人不少，而且有些人做得很好。好到我在 Chrome Web Store 看到下面这两个数字时，沉默了几秒。

Twitter 鸟盾。评分 4.5★，556 人评分。做了三年。

我深入看了它的能力。远不止"屏蔽"——它有一套完整的表达式 DSL：用户可以写 followers_count<100 & created_date<1m & tweet_text*=约 来匹配黄推 bot。支持 block/filter/mark 三种处理动作、正则、模糊匹配、数值比较、日期比较、黑名单订阅。它还附带界面优化、视频下载、搜索助手、用户备注。开发者维护着一个 Discord 社群。

它是闭源的——GitHub 仓库只有 logo、README、和一个空目录。但它的用户量很可能是这个市场的第一名。

6551 推文过滤器。评分 4.1★，514 人评分。

WASM + JSON 远程加载规则，账号/关键词/用户名三种过滤方式。支持手动上报、误报反馈、白名单管理。开源。

两个产品加起来，一千多人愿意给评分。实际安装量估计数万。这不是小众市场。

还有更多。

Make X Great Again (MXGA)。罗磊——前阅文集团高级前端、独立开发者/YouTuber——做了一个五功能的 X 增强工具。当前只有反 spam 上线（Pillar 01），KOL 评分浮卡、Profile 摘要、社交图谱信号、数据导出都列在 Roadmap 里。AGPL-3.0 开源，API 公开含 evidence_text/reasons/reporters 等字段，治理体系（GOVERNANCE.md + 审核台 + 白名单 + 多签 + 每 6h Git 审计同步）在同类项目中是最透明的。2026-05-25 发布，stars 75。

PureTwitter。2023 年上架的黄推屏蔽扩展，曾被小众软件推荐，关键是——在 2023 年就有人在做了。

X Fraud Scanner。Greasy Fork 上的 Tampermonkey 脚本，专注中文诈骗/色情引流。它的规则集让我意识到这块已经有人深耕到什么程度：心形 emoji 检测（甚至处理了 Twemoji img alt 为空时失效的 edge case）、夸克/UC 网盘链接识别、ASCII partial match 防误报（"dd" 不匹配 "daddy"）、两阶段全量扫描（先等动态加载再从底部上扫）。版本号 4.7。

mass-block-twitter。GitHub 57 stars，Chrome+Firefox+Edge 全平台，社区共享屏蔽名单。

X Filter Pro。商业产品，免费+$2/mo Pro 订阅，主打 engagement threshold——点赞数低于 5 的回复直接隐藏。

另外至少还有七八个一键 block/关键词过滤/按地区屏蔽/互fo 折叠/大外宣屏蔽的扩展和脚本。

这轮调研里，真正有价值的不是我多聪明，而是把直觉交给外部证据打了一遍：Chrome Web Store、GitHub、Greasy Fork、项目文档、以及 Claude Code + Exa 的交叉审计。翻到一半，我意识到一个问题。

三、问题变了

不是我一开始想的"这个需求有没有人要"。也不是"我要不要也做一个"。

而是：这些人做得怎么样？他们没做好什么？我做那个没做好的东西，需要多长时间？

我仔细看了鸟盾的表达式手册，看了 MXGA 的 API 响应，看了 X Fraud Scanner 的 changelog。

结论是：

规则，已经有人在写了。 鸟盾有 DSL，MXGA 有 AI 模型，X Fraud Scanner 有经过 4.x 迭代的中文诈骗检测逻辑。

数据，已经有人在存了。 MXGA 的 API 返回 1434 条记录，每条含 verdict_label/confidence/reasons/evidence_text/reporters。鸟盾有用户互相订阅的黑名单体系。

治理，基础形态已经有了。 MXGA 有 GOVERNANCE.md、审核台（review desk）、白名单（39 条）、多签确认（multi-sig）、完整操作日志每 6 小时同步到 GitHub——任何变更都可以被审计。

那么漏了什么？

如果鸟盾、MXGA、6551 都装好，打开同一条热门中文推文的评论区——

鸟盾会标记一些账号（基于 DSL 规则匹配）
MXGA 会标记一些账号（基于 AI 判定 + 置信度）
6551 会标记一些账号（基于远程规则和用户反馈）
但三个工具标记的账号不完全重叠
而且没有人告诉你在同一批样本上谁的命中率更高、谁的误伤率更低

这就是那条缝。

不是"缺规则/数据/benchmark/治理层"——那是排比句，不是分析。缺的是可比较的、可公开获取的、告诉你"到底谁更准"的那一层。

缺一个人把鸟盾、MXGA、6551 装好，打开同一批中文推文的评论区，记录三个工具的判定结果，做一个人工标注作为 ground truth，算两个数字——精确率和误伤率——然后公开。

这件事不需要写一行代码。

四、三件事，不写代码

我不建议写一个新的 Chrome 扩展。理由很简单：写不过鸟盾三年的功能积累，也写不出 MXGA 的 AI pipeline。拿产品热情对抗已有分发——向 556 个评分发起自杀式冲锋——胜率不高。

但可以做一个不用写任何新扩展却比那些扩展更有价值的东西：信息差。

一小时：做对比测试。

安装鸟盾、MXGA、6551。找 3 条热门中文推文（回复数 > 50），各取前 20 条回复，总共 60 条。记录：鸟盾判定结果、MXGA 判定结果、6551 判定结果、你自己的人工判定（黄推/正常/边界）。

产出：一张四列对比表。

这张表的价值在于——在它之前，没人知道这三个工具在中文黄推场景下谁更准。它可以直接变成一篇博客、一条推文线程、或者 MXGA / 6551 的 GitHub issue。

如果这张表发出去没人看——那说明这个市场小到连一篇对比文章都传播不出去。那更不值得写代码。关掉，干净利落。

半小时：抓鸟盾的数据源。

打开 Chrome DevTools → Network → 刷新 X 页面，找鸟盾扩展发起的网络请求。看它从哪个 URL 下载黑名单数据。

如果找到了——鸟盾 556 个用户的贡献数据可以做一个桥梁接到 MXGA 的公榜，两家用户的名单资产都能增值。

如果找不到——鸟盾的闭源壁垒成立，放弃"兼容鸟盾"的方向。不要做"birdshield-to-mxga 转换器"——你连转换的源数据在哪都不知道，写什么转换器。

如果前两件事是绿灯：提 PR。

给 MXGA 提一个 PR，不是泛泛的"中文规则包"，而是 20 条经过你手动验证的中文黄推账号 + 证据文本 + 为什么 MXGA 的 AI 没抓到。

不需要另起一个"x-spam-rules-cn"项目。直接送到现有用户面前。

五、还要补的纠偏和延展

这篇文章的判断已经比第一版实，但还不能写得像终局结论。几个边界要补清楚：

第一，6551 不能只当背景板。 既然它有 514 个 Chrome Store 评分，下一轮对比就不该只测鸟盾和 MXGA，而要把 6551 一起装上。否则文章又会犯同一个错误：被更会讲故事的项目吸引，漏掉真正有用户采用的产品。

第二，Chrome Store 评分不是安装量。 它只是比 GitHub stars 更接近终端用户采用的信号。556 个评分不等于 556 个用户，也不自动等于产品最好；它只能说明：这个产品已经越过了"玩具项目"阶段，新进入者不能假装市场空白。

第三，鸟盾的数据源还没验证。 现在能说的是：鸟盾有订阅、黑名单、表达式 DSL 和长期用户沉淀。不能直接说它的数据可以导出、可以兼容 MXGA、可以转成公共规则。这个判断必须等 DevTools 抓到真实请求之后再写。

第四，X 帖和微信文章适合作为入口，不适合作为证据终点。 它们能告诉我中文社区正在讨论什么、谁在做、用户痛点是什么；但平台内容抓取不稳定，正文不可访问时，不能把它们包装成已验证事实。最终事实要落到项目文档、商店页、代码、API、评论、可复现实测。

第五，如果对比测试跑出来，最好先发布 benchmark，而不是产品。 一个公开的样本表、标注规则、命中/误伤统计、复测方法，比一个没人安装的新扩展更容易获得反馈。真要收费，也应该等 benchmark 证明你确实比现有工具更准、更省心、更可信。

六、底线

很多产品调研的结论是"可以做"或"不要做"。

我的结论是：先别判断要不要做。先用一个下午验证你是不是这个市场里唯一愿意做对比的人。

如果别人已经做了对比，而且做得好——读他们的结论，省下 80 小时开发时间。

如果没人做过——那你花一个下午做完对比的那一刻，你就已经在这个市场里有了一个别人没有的东西。

信息差。比一个没人安装的 Chrome 扩展值钱得多。

References

原始线索：

延展调研对象：

Twitter 鸟盾 / Bird Shield：Chrome Web Store、Edge Add-ons、项目公开文档与 GitHub 数据分发仓库
6551 推文过滤器：Chrome Web Store 与 6551Team/6551-plugin
PureTwitter：Chrome Web Store 与小众软件推荐线索
X Fraud Scanner：Greasy Fork 脚本与 changelog
rxliuli/mass-block-twitter
slarkvan/Block-Pornographic-Replies
merginit/x-spam-sweeper.extension
X Filter Pro

本文基于 2026-05-26 的市场调研，覆盖 Chrome Web Store、GitHub、Greasy Fork、Exa OPINT 与 Claude Code 交叉审计。X 帖和微信文章主要作为线索入口；在正文不可稳定抓取时，不把它们当作事实终点。商店评分、项目功能和 API 字段以当日可访问页面为准，仍可能随项目更新变化。