https://hlgczx.com/这个流量来源咋回事呢 两百万月访客 看不到着陆页关键词什么的
辰美,这个不是普通 SEO 站的流量。
辰美,这个不是普通 SEO 站的流量。这个盘子核心大概率是:
主域 hlgczx.com 被 Similarweb 统计时,把 sci-hub.hlgczx.com 这个子域的流量也算进去了。
Similarweb 官方说明里,分析主域时,相关子域访问会被包含进去;要单独看子域,需要从子域开始建 segment。(Similarweb支持中心) 这就解释了你看到的怪现象:主域页面像游戏站,但流量画像像论文下载/Sci-Hub/DOI 检索站。
我查了一下,hlgczx.com 主站公开页面确实是 Incredibox Mustard 这类游戏内容,页面里列了一堆 Incredibox / Sprunki 游戏链接。(Hlgczx) 但公开索引里也能看到 sci-hub.hlgczx.com/10.xxxx 这种 DOI 路径页面,页面标题和内容就是 Sci-Hub 风格的论文 DOI 页面。(sci-hub.hlgczx.com)
所以你现在看到的两百万月访客,不是这个游戏首页靠几个关键词打出来的。Similarweb 公开页显示这个域 April 2026 总访问约 2.4M,并且标注是 Similarweb estimated data,也就是估算,不是站长 GA4 实数。(Similarweb) 更关键的是,它的主要来源不是 Organic Search,而是 Direct 67.54%,Referral 第二,Organic Search 第三。(Similarweb) Semrush 的流量旅程也佐证了这个判断:March 2026 里,访问 hlgczx.com 的用户主要来自 sci-hub.in,占 73.03%,其次是 Direct 23.24%。(Semrush)
你看不到着陆页、关键词,原因就很简单了:你在用 SEO 视角看一个主要靠直接访问和引用流量跑起来的子域。方向错了,当然抓不到东西。
它这个流量更像这样来的:
用户在别的地方看到一个论文链接,可能是论坛、社媒、学术讨论、Sci-Hub 镜像站、别人分享的 DOI 链接,然后点到 sci-hub.hlgczx.com/10.xxxx。
或者用户直接保存、书签、复制粘贴这个 DOI 链接。Similarweb 的 Direct 包括直接输入 URL、书签、保存链接点击。(Similarweb支持中心)
所以这批流量不会天然对应一堆清晰的 Google 关键词。
你截图里关键词页只有几个词,比如 DOI、libgen、gao high resolution 3d print 这种,本身也说明了问题:Similarweb 公开数据里 Top Keywords 只显示 3 个,Organic 100%、Paid 0%,这只是少量搜索关键词,不是解释 200 万访问的全量来源。(Similarweb)
真正的结论是:
这是一个 Sci-Hub 镜像/论文 DOI 工具类流量,被根域统计吃进来了。主域游戏页只是表层;大流量在子域和 DOI 路径。
你要继续查,别再盯 SEO 概览。按这个顺序看:
第一,看 Similarweb 里的 Website Content / Subdomains / Popular Pages,找 sci-hub.hlgczx.com 占比。
第二,单独输入或建 segment:sci-hub.hlgczx.com,不要只看 hlgczx.com。
第三,看 Traffic Sources,尤其是 Referral、Direct、Outgoing Links。这个域的相似站点已经明显偏向 sci-hub.in、ResearchGate、MDPI、Sci-Hub 相关站点。(Similarweb)
第四,用搜索指令查:site:sci-hub.hlgczx.com/10.,看 DOI 页面规模,而不是查主域首页。
第五,如果你想知道真实 landing page,竞品工具永远只能估算;只有站长自己的 GA4 / Search Console / server log 才能给精确落地页。
这里最重要的一句话是:这不是内容 SEO 的胜利,这是一个需求入口的胜利。
用户不是想浏览这个网站。用户脑子里只有一个动作:我有 DOI,我要论文,我要马上拿到。这个需求像饥饿一样直接,不需要教育,不需要品牌,不需要精美 UI。
但别去照抄 Sci-Hub 这条路,版权和法律风险很高。真正值得你学的是它背后的需求结构:论文 DOI → 找资源 → 摘要 → 翻译 → 引用 → 笔记 → 研究工作流。
如果要做白帽产品,方向不是盗版下载,而是合法的开放获取查找、论文摘要、文献管理、引用生成、跨语言阅读、研究助手。需求是真的,灰色路径别碰。
TL;DR Cheatsheet
一句话结论:
这个站不是靠 hlgczx.com 主站的 Incredibox 游戏 SEO 跑到 200 万月访的。它真正的流量核心,大概率是 sci-hub.hlgczx.com 这个子域承接了 Sci-Hub / DOI / 论文下载类需求,然后被 Similarweb 这种整域统计口径算进了主域。
流量来源核心链路:
Google 搜 sci hub
→ sci-hub.in
→ 跳到 / 引到 hlgczx.com 或 sci-hub.hlgczx.com
→ 用户打开 DOI 页面
→ 复制、收藏、二次分享
→ 下次变成 Direct / Referral / Saved link
为什么外链不多也能 200 万?
sci-hub.in,占 73.03%,Direct 占 23.24%。这不是内容站打法,这是管道打法。(Similarweb)为什么用子域名?
最可能的动机是:把高风险、高需求、高跳转的 Sci-Hub 镜像/论文入口放在子域,把根域保留成看起来低风险的游戏站。根域页面公开内容确实是 Incredibox Mustard / Sprunki 游戏页面;但 sci-hub.hlgczx.com 是 Sci-Hub 风格页面,有 DOI 论文页和“Get Papers Free”文案。(Hlgczx)
最重要的反常识:
你找不到着陆页关键词,不是工具坏了,是你用 SEO 眼睛看一个 referral/direct 需求管道。关键词不是它的入口,入口是 Sci-Hub 生态、DOI 深链、收藏夹、论坛贴、文章引用、镜像跳转。
hlgczx.com 深度案例:一个披着游戏外衣的论文需求入口
辰美,这个案例很有意思。它不是一个漂亮的产品案例,它更像地下水管网。你站在地面上,看见的是一个小游戏站;你往地下看,真正流动的是论文、DOI、Sci-Hub 镜像、Direct、Referral。
我先给你一个很硬的判断:这个站长不是在做品牌,不是在做内容,不是在认真做 Incredibox 游戏站。他在做入口资产。
所谓入口资产,就是用户不关心你是谁,不关心你的 UI,不关心你的品牌故事。用户只关心一件事:我现在要拿到这篇论文,马上。
这类需求很野蛮,也很纯粹。它不需要教育市场。它不需要种草。它甚至不需要信任你这个品牌。它只需要一次成功打开。
人性的入口,永远比页面漂亮重要。你看它这个站,就像一扇很旧的门,但门后面是食物,饥饿的人不会挑门把手好不好看。
1. 表面:主站是游戏站,真实画像却是论文站
先看根域。
hlgczx.com/index.html 公开页面是 “incredibox mustard”,页面里堆了一批 Incredibox、Sprunki、Incredibox Mod 相关链接,正文也在讲音乐创作、fan-made mod、sound library、character design 这些游戏内容。(Hlgczx)
这就是你在 Google 里看到的那些页面:
Free Play Incredibox V9 OnlineSprunki FNFsprunked incrediboxIncredibox Clockwork
如果只看主站,你会以为这是个低成本 AI 批量生成小游戏 SEO 站。
但 Similarweb 给出的受众画像完全不是小游戏。它把 hlgczx.com 放在 Science and Education > Science and Education - Other,竞品/相似站里出现的是 sci-hub.in、ScienceDirect、PubMed、ResearchGate、Springer 这类学术站点;用户兴趣词是 science、journals、research、search、articles。(Similarweb)
然后你再看子域。
sci-hub.hlgczx.com 的首页直接是 Sci-Hub 风格,写着 “emancipation and democratisation of knowledge”,展示 88,343,822 docs,并说目标是提供 free and unrestricted access to scientific knowledge。(Sci-Hub)
更关键的是,它有 DOI 深层页。比如 10.1111/add.12313 页面上直接显示论文标题、作者、期刊、年份、DOI,并有 “Get Papers Free ↓ save Free GPT4 Deepseek” 这类文案。(Sci-Hub)
所以案子已经破了:
根域是游戏皮,子域是论文入口,Similarweb 把子域流量吃进了主域统计。
Similarweb 自己的 Segment FAQ 也说明:如果你分析主域,相关子域页面会被包含进去;如果要单独分析子域,应该从子域开始建 segment。(Similarweb支持中心)
2. 站长为什么这么做?
我不能证明站长的主观动机,但从结构上看,至少有 5 个非常现实的理由。
第一,主题隔离。
根域如果全是 Sci-Hub,风险太高,审查、投诉、广告、域名、工具评级都会更敏感。把根域放成一个普通游戏站,子域承接论文入口,至少在表层检查里,主站看起来像小游戏内容。ScamAdviser 对 hlgczx.com 的页面标题识别就是 “incredibox mustard | Free Play incredibox mustard Online”,同时 WHOIS 隐藏,注册日期为 2024-04-07。(ScamAdviser)
第二,风险隔离。
子域出了问题,理论上可以单独换子域、关子域、迁移子域,而不必马上动根域。这个不是我建议你这么干,只是在解释它为什么这么布局。
第三,流量统计会产生错觉。
Similarweb 的整域口径会把子域算进去,于是外部看起来像 hlgczx.com 这个游戏站有 200 多万访问。对围观者来说,这很迷惑;对站长来说,这可能反而有好处,因为主域看起来像一个高流量资产。
第四,sci-hub 子域名本身就是信任符号。
用户看到 sci-hub.xxx.com,比看到一个完全陌生的随机域更容易点。它不是品牌信任,是模式识别信任。用户脑子里想的是:这是不是另一个 Sci-Hub 镜像?
第五,根域可能用于广告、壳页面或资产池。
Similarweb 检测到 hlgczx.com 安装了 Google Adsense 和 Google Marketing Platform。这个不等于它一定赚很多,也不等于广告一定在 Sci-Hub 子域有效,但至少说明它不是一个完全无商业化痕迹的站。(Similarweb)
3. 它的流量到底哪里来?
最关键的证据是 Semrush 的 Traffic Journey。
Semrush 显示,2026 年 3 月,hlgczx.com 有 2.04M visits,平均访问时长 5 分 27 秒,较 2 月增长 10.8%。更重要的是,访问 hlgczx.com 的用户主要来自 sci-hub.in,占 73.03%,其次是 Direct,占 23.24%。用户离开 hlgczx.com 后,又经常去 pidantuan.com 和 sci-hub.in。(Semrush)
这就像什么?
像一个商场门口有个主入口,主入口叫 sci-hub.in。用户从 Google 找到这个主入口,然后里面某条通道把人送到 hlgczx.com。你站在 hlgczx.com 门口数人,发现人很多,但这些人不是因为 hlgczx.com 这个招牌来的,是因为上游管道把他们冲过来的。
再看 sci-hub.in 自己。
Semrush 显示,2026 年 3 月 sci-hub.in 有 2.69M visits,主要来源是 Google organic,占 63.98%,Direct 占 27.73%;离开 sci-hub.in 后,用户会去 hlgczx.com 和 sidesgame.com。它的主要关键词是 sci hub、scihub、sci hub se、sci hub tw、sci-hub st 这种品牌/镜像词。(Semrush)
所以完整链路应该是:
Google SEO 真正发生在 sci-hub.in 这种 Sci-Hub 入口站上。
hlgczx.com 更像下游承接站,不是第一搜索入口。
这解释了你最困惑的点:
为什么 hlgczx.com 关键词很少?
因为它不是靠自己关键词吃饭。
为什么外链不多?
因为它不是靠链接权重吃饭。
为什么看不到着陆页?
因为大量落地可能是子域 DOI 深链,或者被工具隐藏、过滤、采样不足、算进 segment 但不在 Popular Pages 里展示。Similarweb 也说明 Popular Pages 和 Segment 的方法不同,Popular Pages 会过滤可能包含敏感信息的 URL,但 Segment 仍可能在背后把这些页面算进去。(Similarweb支持中心)
4. 月度增长数据怎么理解?
先别把第三方工具当真理。Similarweb 自己也写明这是 estimated data,真实数据只有站长的 GA4、Search Console、server log 才知道。(Similarweb)
但从公开工具看,量级是成立的。
Semrush 的 1–3 月数据来自同一工具,趋势是 1.53M → 1.84M → 2.04M。Similarweb 4 月显示 2.4M visits,但它也说相比上月下降 14.13%。两个工具口径不同,不能机械拼成一条绝对精准曲线;但可以确认的是:这个站在 2026 年初已经是百万级月访问,且主要不是自然搜索关键词贡献。(Semrush)
外链这边也很有意思。
Semrush 对整域口径显示:2026 年 3 月 hlgczx.com 有 377 backlinks、145 referring domains,backlinks 增长 31.36%,referring domains 增长 9.85%。你贴的 Ahrefs 免费页里,sci-hub.hlgczx.com 只有 107 backlinks、51 linking websites,而且样本链接大多是深层 DOI 链,不是首页品牌链接。(Semrush)
这说明它不是传统 SEO 的 “DR 很高 → 关键词很多 → 页面排名 → 流量爆”。它更像:
少量深链 + 镜像站跳转 + 收藏夹 + 复制传播 + 高刚需 = 巨大访问。
5. 小故事:一个用户怎么被它找到?
想象一个巴西硕士,晚上 1 点写论文,导师明天早上要初稿。他在 Google 搜 sci hub,进了 sci-hub.in。他粘贴 DOI,页面跳到 sci-hub.hlgczx.com/10.xxxx。他不在乎 hlgczx 是什么,不在乎页面设计,不在乎品牌。他只在乎 PDF 能不能打开。
打开了,他收藏。
第二天他又点收藏夹。Similarweb 这次把它记成 Direct,因为 Direct 包括直接输入 URL、书签、保存链接点击。(Similarweb支持中心)
再想象一个健身博主写了一篇关于耐力训练的文章,里面引用一篇运动科学论文。他懒得放出版社 DOI,直接放了一个 Sci-Hub 深链。这个页面本身可能只有一条外链,但这篇博文每个月都有人看。每个想看原文的人都点一下。于是一个外链,贡献的不是 SEO 权重,而是行为流量。
再想象一个 StackExchange 回答、Substack 评论、YouTube 描述区、医学论坛帖子,各自放了一个不同 DOI 的 sci-hub.hlgczx.com 链接。Ahrefs 看到的是少量 referring domains;用户体感却是到处都能点到它。
这就是外链少但流量大的本质。
它不是把网页做成内容资产,它把 URL 做成工具动作。
6. 品牌体检:这个站有没有品牌?
有,但不是传统品牌。它有的是寄生型品牌识别。
根域品牌:Incredibox Mustard,偏游戏。
子域品牌:sci-hub,偏论文获取。
受众画像:Science、Education、Biology、PubMed、ScienceDirect、ResearchGate。(Hlgczx)
这三个东西是冲突的。
正常产品会追求品牌一致性。它不是。它追求的是入口有效性。
它的品牌健康可以这么看:
认知度: hlgczx 本身几乎没品牌认知,用户记的是 Sci-Hub,不是 hlgczx。
信任感: 来自 sci-hub 子域和成功打开论文的经验。
留存: 来自 bookmark、saved link、直接访问,而不是账号体系。
获客: 来自上游 Sci-Hub 入口和 DOI 深链传播。
商业化: 可能有广告技术,但不确定真实收入。
风险: 极高,版权、域名、广告政策、搜索封禁都可能随时出问题。
这不是一个健康品牌,这是一个高流量但高脆弱性的流量节点。
像在暴雨里撑伞卖伞,今天发财,明天城管来了。
7. 这个产品解决的是什么问题?
表层产品不是 Incredibox 游戏。
真实产品解决的是:
用户有 DOI / 论文标题 / 付费墙阻挡,他想快速拿到全文。
Sci-Hub 这类服务的核心问题非常明确:学术论文大量被 paywall 锁住,研究者、学生、普通人很难低成本访问。LSE Impact 文章也提到,学术出版物仍大量在付费墙之后,阻碍研究者和公众阅读最新研究;Sci-Hub 被用来绕过 paywall,并在 2016 年 6 个月内产生 2800 万次下载请求。(伦敦政经博客)
用户不是想逛网站。用户是想完成一个动作:
输入 DOI → 拿到论文。
这里没有复杂用户旅程。越复杂越失败。
8. 用户是谁?
从 Similarweb 和 Semrush 画像看,不像儿童游戏用户,更像学术/研究相关用户。
Similarweb 显示 hlgczx.com 4 月流量最多的国家包括 Brazil、Indonesia、Mexico、Turkey、Germany;用户兴趣集中在 Science and Education、Biology、Education,其他访问网站包括 sci-hub.in、ScienceDirect、PubMed、ResearchGate、Springer。(Similarweb)
Semrush 对 sci-hub.in 的国家分布也类似,Mexico、Indonesia、Brazil、Turkey、Vietnam 都在前列。(Semrush)
我会把用户分成 6 类:
没有学校数据库权限的学生
独立研究者
医生、工程师、行业从业者
发展中国家或订阅资源不足地区的研究人员
写文章、做视频、查证据的内容创作者
有学校权限但访问体验很差、懒得走图书馆流程的人
LSE 文章里还有一个很有意思的点:约 8% Sci-Hub 下载请求来自 academic institutions 内部,这说明即使在大学里,合法访问也不总是顺滑。(伦敦政经博客)
9. 用户为什么需要它?
因为它把一个本来很烦的流程压成了一个动作。
正常合法路径可能是:
找论文 → 发现 paywall → 查学校 VPN → 登录机构账号 → 失败 → 找图书馆 → 申请馆际互借 → 等待 → 或者邮件问作者 → 等待
Sci-Hub 型路径是:
复制 DOI → 粘贴 → 打开
人类会天然选择阻力最小的路。不是因为人坏,是因为摩擦太高时,道德说教的转化率会很低。
这也是我们做产品必须牢记的一点:
用户不是不尊重规则,用户是不想被流程羞辱。
10. 用户如何评价它?好评和差评
我没有找到 hlgczx.com 这个具体站的独立用户评价,所以这里只能按 Sci-Hub 型产品的公开讨论和使用行为来归纳。
好评核心:
用户会觉得它快、免费、直接、救命。尤其是学生和独立研究者,面对一篇几十美元的论文,Sci-Hub 型入口就是“今晚能不能交稿”的区别。LSE 文章也说 Sci-Hub 对受经济困难、机构之外、访问障碍影响的人来说,是强力的教育入口。(伦敦政经博客)
差评核心:
法律风险、版权争议、安全风险、不稳定、可能被封、可能有恶意镜像、可能下载到不可信文件。美国出版商协会公告显示,美国法院曾判 Elsevier 获得 1500 万美元赔偿,并让 2015 年的初步禁令永久化,要求美国域名注册机构暂停相关美国管理域名。(AAP)
所以用户态度会很分裂。
一边是“我靠它完成了论文”。
另一边是“它不合法、不稳定、不安全”。
这类产品像一条夜路。很多人走,因为近。但近不等于安全。
11. 它是如何找到用户的?
它的获客方式不是单一 SEO,而是一个组合拳。
第一层:上游品牌搜索。
真正吃 Google organic 的大概率是 sci-hub.in 这样的入口站。Semrush 显示 sci-hub.in 主要来源是 Google organic,占 63.98%,Top keywords 是 sci hub、scihub、sci hub se、sci hub tw、sci-hub st。(Semrush)
第二层:镜像/跳转生态。
Semrush 显示,hlgczx.com 访问者主要来自 sci-hub.in,占 73.03%。这说明 hlgczx 不是孤岛,它在一个 Sci-Hub 镜像/跳转/替代域生态里。(Semrush)
第三层:Direct。
Similarweb 显示 hlgczx.com 最大流量来源是 Direct,桌面访问占 67.54%。Direct 可能来自直接输入、书签、保存链接。(Similarweb)
第四层:深层 DOI 外链。
Ahrefs 里你看到外链不多,但很多链接直接指向 sci-hub.hlgczx.com/10.xxxx 这种 DOI 页面。这个模式的厉害之处在于,每个链接都是具体论文动作,不是泛泛的首页推荐。用户点它不是为了认识网站,而是为了拿某篇论文。
第五层:社交平台和论坛传播。
Similarweb 显示 hlgczx.com 的社交流量主要来自 YouTube,其次是 Facebook 和 WhatsApp Webapp;这非常符合论文链接在视频描述、群聊、评论区里被传播的方式。(Similarweb)
第六层:根域游戏 SEO,可能只是皮。
根域确实有 Incredibox / Sprunki 批量页面,但 Similarweb 只显示 3 个 organic keywords,而且 Top Keywords 里一个是 DOI,一个是 libgen,这和游戏主题完全不匹配。(Similarweb)
所以这个站的增长不是“写了很多小游戏文章然后排名很好”。
它是“接入了 Sci-Hub 需求管道,然后被 Direct 和 deep link 放大”。
12. 它赚钱吗?可能多少?
真实收入不知道。别装神棍。
能确认的是:Similarweb 检测到 hlgczx.com 有 Google Adsense 和 Google Marketing Platform。(Similarweb)
按 Similarweb 4 月估算,2.4M visits,5.74 pages/visit,粗略 pageviews 是:
2.4M × 5.74 ≈ 13.8M PV/月
如果这些页面能正常挂广告,按不同 RPM 粗估:
但注意,这只是数学估算,不是事实。Sci-Hub 型内容有版权和广告政策风险,Google AdSense 未必能稳定覆盖这些页面,甚至可能只在根域游戏页生效。再加上国家分布里 Brazil、Indonesia、Mexico、Turkey 等市场占比较高,广告 RPM 未必高。(Similarweb)
我的判断:它可能不是超级现金牛,更可能是几千到几万美元/月区间的流量套利资产,具体取决于广告是否真的跑在高流量页面上。
更大的价值不一定是广告,而是:
流量资产
镜像生态入口
跳转能力
域名替换能力
用户收藏链路
下游站导流
13. 我从这个产品身上学到什么?
最重要的 8 个东西:
第一,刚需入口比内容质量更强。
游戏文章写得再多,也不如“输入 DOI 马上拿论文”这种动作强。
第二,Direct 不是垃圾桶,它可能是最强留存。
很多人把 Direct 当成无法归因的杂项。其实在这种场景里,Direct 很可能是收藏、复制链接、保存链接,是复用行为。
第三,外链少不代表流量小。
如果外链是深层动作链接,而且链接所在页面有持续访问,一个链接就能长期产生流量。
第四,子域可以制造统计错觉。
主域工具看起来 2M,但真实需求可能在子域。看竞品时必须拆 subdomain、subfolder、popular pages、outgoing links。
第五,SEO 有时候不是目标站发生的。
SEO 发生在上游 sci-hub.in,hlgczx 是承接站。这很像分销,不像独立品牌。
第六,用户不是为品牌而来,是为“解除阻塞”而来。
论文 paywall 是阻塞。谁解除阻塞,谁拿流量。
第七,灰色产品的增长速度快,但资产脆弱。
法律、广告、域名、搜索引擎、浏览器安全提示都可能一夜归零。
第八,白帽机会藏在灰帽需求后面。
不要学它盗版下载,要学它识别需求:论文获取、摘要、引用、翻译、合法开放获取、研究工作流。
14. 它的什么做法不容易?为什么?
最不容易的不是页面,也不是代码。
最不容易的是它背后的 4 个东西:
第一,信任入口。
用户愿意点 sci-hub.xxx,是因为 Sci-Hub 这个名字本身已有强信任。你新做一个 paperfreefast.ai,用户不一定敢点。
第二,资源供给。
Sci-Hub 型产品的核心不是搜索框,是背后的论文访问能力。这个能力涉及版权、账号、镜像、存储、反封锁,风险极高。
第三,传播网络。
它的链接已经被放进博客、论坛、YouTube、问答网站、文章引用里。你要复制,不是做一个网站,而是重新长出一张分布式链接网。
第四,灰色容忍度。
这个最重要。它能做的事,你不一定能做;你能做出来,也不一定能长期活;你活下来,也不一定能正规收款、投放、上架、融资。
所以别犯傻,不要照抄。
你要学它的需求洞察,不要学它的风险路径。
15. 如果我是产品作者,一句话怎么推销?
灰色原版的一句话会是:
Paste a DOI, get the paper now.
但如果我们做合法产品,我会改成:
粘贴 DOI,立刻找到可合法阅读的全文、摘要、引用和下一步获取路径。
这句话比“AI Research Assistant”强。因为用户不是想要一个助手,用户是卡住了。卡住的人不想听你讲愿景,他想要一把钥匙。
16. 如果我做同场景产品,怎么用不同方法更好地解决?
我不会做 Sci-Hub 镜像。那是踩雷。
我会做一个白帽版:
Open Paper Navigator:合法论文获取 + 研究工作流入口。
核心流程:
用户粘贴 DOI / 论文标题
→ 自动查合法开放版本
→ 如果有 OA PDF,直接给
→ 如果没有,给摘要、引用、相关论文、作者邮箱模板、馆际互借提示、ResearchGate/作者主页/预印本线索
→ 一键保存到 Zotero / Notion
→ AI 摘要、翻译、实验方法提取、引用格式生成
这个产品不是和 Sci-Hub 比“免费盗版全文”,那比不过,也不该比。
它应该比的是:
更安全
更稳定
更可信
能被学校、独立研究者、内容创作者长期使用
能正规收款
能做浏览器插件
能做 SEO
能做 B2B
LSE 文章提到,开放获取运动让约 25% scholarly documents 已经能通过某种开放形式访问,Unpaywall 这类工具也在帮用户找开放版本。这个方向就是合法机会。(伦敦政经博客)
你的切入点可以不是“给我盗版 PDF”,而是:
我不保证每篇都免费拿到,但我保证你少走 80% 弯路。
这就能做。
17. 我能做出来吗?
能做白帽版,不能做灰帽版。
你现在最现实的 MVP 是:
第 1 天:做一个落地页,定位 Sci-Hub alternative, legal paper finder, DOI to full text。
第 2 天:做 DOI 输入框,接开放获取检索源。
第 3 天:输出 citation、abstract、publisher link、OA link、author contact template。
第 4 天:加 AI 摘要和中文翻译。
第 5 天:加 Zotero / BibTeX / RIS 导出。
第 6 天:做 30 个 SEO 页面:doi to pdf、find full text paper、sci hub alternative、free research paper finder、unpaywall alternative。
第 7 天:找 20 个研究生、独立开发者、医学内容创作者试用。
这东西不一定一开始赚钱,但它有一个好处:你可以正规做,正规宣传,正规收款,正规迭代。
灰色产品靠躲,白帽产品靠复利。
躲出来的钱快,但睡不踏实。复利出来的钱慢,但能越滚越大。
18. 最终判断:这个站怎么增长的?
我给你还原成一个增长模型:
阶段 1:注册低成本域名。
ScamAdviser 显示 hlgczx.com 注册日期是 2024-04-07,WHOIS 隐藏,根域标题是 Incredibox Mustard。(ScamAdviser)
阶段 2:根域挂游戏内容。
根域形成一个普通英文小游戏页面集合,可能用于搜索、广告、站点表层、工具检测。
阶段 3:子域部署 Sci-Hub 镜像/入口。sci-hub.hlgczx.com 承接论文/DOI需求,页面包含 Sci-Hub 文案、文献数据库数字、latest reads、DOI 深层页。(Sci-Hub)
阶段 4:进入 Sci-Hub 镜像生态。
上游 sci-hub.in 通过 Google organic 吃 sci hub 类关键词,再把一部分用户导向 hlgczx.com。Semrush 显示 hlgczx.com 的主要上游就是 sci-hub.in。(Semrush)
阶段 5:深链扩散。
外链不是大量首页链接,而是分布在博客、问答、YouTube、论坛、文章里的 DOI 深链。你贴的 Ahrefs 样本里也能看到大量 sci-hub.hlgczx.com/10.xxxx 链。
阶段 6:Direct 放大。
用户收藏 DOI 页、保存链接、复制分享。Similarweb 把这类直接输入、书签、saved link 都归入 Direct。(Similarweb支持中心)
阶段 7:工具统计形成“主域 2M 月访”的错觉。
Similarweb 主域分析会包含子域页面,所以你看到 hlgczx.com 2.4M visits,但真正要拆的是 sci-hub.hlgczx.com。(Similarweb支持中心)
这就是它的增长飞轮:
Sci-Hub 搜索需求 → 上游入口 → 子域承接 → DOI 深链 → 用户收藏 → Direct 增长 → 更多工具显示高流量 → 更多人发现和传播。
19. 关于网址存档历史,我这轮能确认什么?
我这轮没有成功直接拉出 hlgczx.com 的 Wayback 历史快照,所以不能编故事说它某天从 A 页面变成 B 页面。这个地方要老实。
能确认的是:
Wayback Machine 可以按 URL 和日期查历史页面,但不是所有站都一定被完整归档;有些页面会因为 robots.txt、密码、JS、孤儿页面等原因缺失。(help.archive.org)
hlgczx.com 当前根域是 Incredibox 游戏内容,子域是 Sci-Hub/DOI 内容。(Hlgczx)
域名注册时间是 2024-04-07,WHOIS 隐藏。(ScamAdviser)
2026 年 1–3 月,Semrush 显示流量从 1.53M 增长到 2.04M;2026 年 4 月,Similarweb 显示 2.4M visits。(Semrush)
所以历史推断是:
它不是多年老牌内容站慢慢 SEO 积累出来的,更像 2024 注册后,2025–2026 通过 Sci-Hub 子域/镜像生态快速获得流量。
20. SOP Checking List 5W2H
What:到底在查什么?
查的是主域流量,还是子域流量?
主站内容和真实受众画像是否一致?
Top keywords 能不能解释总流量?
Landing pages 是首页、目录页,还是深层程序化页面?
流量是内容 SEO,还是工具动作,还是跳转管道?
Why:为什么它能增长?
是否解决了一个强刚需?
是否把复杂流程压成一个动作?
是否有上游流量入口?
是否有用户收藏/复制/分享行为?
是否有口碑传播,而非品牌传播?
Who:谁在用?
国家分布是谁?
年龄/性别画像是否符合产品表层?
用户兴趣网站是什么?
真实用户是搜索游戏的人,还是查论文的人?
谁在给它外链?博客、论坛、视频、问答、学术页面?
Where:流量从哪里来?
Similarweb Marketing Channels:Direct / Referral / Organic / Social
Semrush Traffic Journey:上游站和下游站
Referrals:是否来自同一生态站群
Outgoing links:用户离开后去哪
Social:YouTube、Facebook、WhatsApp、ResearchGate 是否参与传播
Search:真正吃 SEO 的是本站,还是上游入口站
When:什么时候增长?
域名注册时间
最早可见页面时间
Wayback 快照变化
月度 visits 曲线
backlinks / referring domains 增长月份
流量暴涨是否对应上游站跳转或镜像变更
How:怎么增长?
主域是否只是壳页面
子域是否承接真实需求
是否有程序化 URL,如 DOI、ID、slug
是否靠 bookmark / saved link 形成 Direct
是否靠深层外链而不是首页外链
是否靠上游品牌词 SEO 导流
是否通过镜像、跳转、替代域形成网络效应
How Much:值多少钱?
visits / month
pages per visit
粗略 PV = visits × pages per visit
国家 RPM 结构
是否检测到广告技术
是否能正规投放广告
是否有版权、支付、域名、搜索封禁风险
不要只算收入,要算归零概率
最后一条硬规则
不要复制灰色路径
复制需求结构
做合法入口
把用户从卡住的地方救出来
用户卡在哪里,产品就应该长在哪里