7 个数据源
一次运行覆盖 GitHub、Hacker News、Reddit、YouTube、Product Hunt、X/Twitter 和 6 个中文科技平台。
AI 模型的知识有截止日期,但世界不会停下来。Info Pipeline 每天自动抓取 GitHub、HackerNews、Reddit 及中文技术平台的最新动态,让你的 Agent 永远用今天的信息做决策。
概览
Info Pipeline 每天聚合 7 个来自英文和中文科技平台的数据源。每条内容经过关键词过滤、相关性评分和去重处理后,序列化为统一 JSON Schema——直接供 AI 研究员 Agent 消费。
实时情报
数据来自 2026年2月25日 · 每周更新
每天自动更新,你的 Agent 比你更早知道发生了什么。
能力
一次运行覆盖 GitHub、Hacker News、Reddit、YouTube、Product Hunt、X/Twitter 和 6 个中文科技平台。
每条内容根据可配置关键词列表进行评分。只有高信噪比内容通过——无噪音。
跨源去重确保同一故事在多个平台出现时只在报告中显示一次。
所有 7 个采集器输出相同的 JSON Schema(标题、URL、来源、分数、摘要、标签),便于下游处理。
一切配置在 config.yaml——关键词、每源限制、分数阈值、启用平台。无需改代码即可调整行为。
流水线输出结构化 Markdown 报告,直接供 AI 研究员 Agent 进行进一步分析。
架构
每个采集器独立运行,使用 config.yaml 中的参数从各平台获取原始内容。
内容与全局关键词匹配并进行相关性评分。低信噪比内容在进入存储前被丢弃。
基于 URL 和标题相似度的去重消除跨源重复——同一故事不会出现两次。
所有存活内容被规范化为单一 JSON 结构:标题、URL、来源、分数、发布时间、摘要、标签。
结构化 Markdown 报告写入 reports/——直接供 AI 研究员 Agent 进行进一步分析。
数据源
英文主流科技媒体 + 中文生态——一次流水线运行全覆盖。
代码仓库
按主题(LLM、AI Agent、RAG、MCP、扩散)筛选的热门仓库,按星数和时效性过滤。
讨论
按分数阈值过滤的热门故事——捕捉科技社区今日热议。
社区
多 subreddit 覆盖:r/LocalLLaMA、r/MachineLearning、r/artificial、r/ChatGPT、r/ClaudeAI 等。
视频
顶级 AI 频道的最新上传——Karpathy、Yannic Kilcher、Two Minute Papers、3Blue1Brown、Fireship。
产品发布
每日 AI、开发者工具和生产力新品——按投票和主题过滤。
社交
英文科技社区 AI/LLM 讨论的关键词搜索。
多平台
知乎 · 36氪 · 掘金 · 少数派 · InfoQ · B站科技区——通过 trends-hub MCP 集成。
为什么重要
GPT-4、Claude、Gemini——所有模型都冻结在过去的某个时间点。问它上个月发布的库,它会一本正经地胡说。
Info Pipeline 按 cron 计划运行。你的 Agent 每天醒来时,就已经有了昨晚 GitHub 热榜和今晨 HN 头条的简报。
Agent 每天阅读最新研究,答案就越来越精准。你的 AI 与其他 AI 的差距,随着时间推移会越来越大。
监控范围
AI 与科技研究所需的每种内容类型——每日一次运行全覆盖。
GitHub 仓库
星数、Fork 数、话题、时效性
HN 讨论
分数、评论数、域名
Reddit 帖子
多 subreddit,按票数过滤
YouTube 视频
精选 AI 创作者频道
产品发布
每日 PH 榜单,投票阈值过滤
推文
关键词搜索,近期时间线
中文科技资讯
知乎 / 36氪 / 掘金 / B站 / InfoQ / 少数派
即将上线
第一时间获知此插件上线。