ALL About RSS

关于 #RSS 技术的 #应用 #周边 #介绍 #方法 #教程 #指南 #讨论 #观点 #技巧

RSS = Really Simple Syndication / Rich Site Summary

推特：https://twitter.com/aboutrss
频道 RSS Feed：https://feeds.feedburner.com/ALLAboutRSS
频道 bot：@channelmcbot
群组：@allaboutrss (福利：推特账号的 Retweet 会自动发至群组)

18:10 · Apr 17, 2020 · Fri

基于RSS Feed的 #搜索引擎 #介绍

我始终忘不了被这些月经贴支配的恐惧：「你必读的RSS源有哪些」、「求推荐优质的RSS Feed」。即便在信息搜整能力Top Level的RSS玩家中，Feed的发现依然那么困难。因此个人打理的 #聚合应运而出，却又各自独立为战、疲于维护，特别是体量渐大之后。我已有两次（1、2）提及过，这事没法靠个人完成。

有一种办法是举全RSS玩家之力。比如公开大家的订阅列表，就像此前提到的 #FeedsPub 和 #FeedBase。可看榜单，可找长尾。接着，还可以在此基础上搞搜索，就像 Feedly、Feedspot和 Inoreader 等RSS阅读器做的那样。可惜的是被阅读器当成了高端功能，目前只有付费用户才能享受。

还有一种就是举爬虫之力了。试想，当人们想找到需要的网页时，人们发明了「搜索引擎」；那当人们想找到需要的Feed时，人们自然去发明了基于RSS Feed的「搜索引擎」。当然，这绝不是新鲜事情了，上古时期这领域的选手还挺多的（特别是 Google Feed API 还在的时候），只是坚持下来的寥寥无几。以前的事就不提了，那么现在能用的搜索 Feed 的引擎有哪些呢？

1️⃣ ~~DatoRSS~~
#开源，基于 feedi #API 。经与作者咨询，其Feed的评分来源于 OpenRank 。

2️⃣ The Ukora™ News Search Service
至少从14年就存在了。有榜单。注册后，可以订阅搜索出来的Feed（例：少数派），并生成一个看板。但不能直接通过Feed地址来订阅。官方简介了所用到的技术或架构。

2.5 RSS Micro
为什么是“2.5”呢？因为这个站历史悠久，但目前处于半死不活的状态。能不能用有点看人品，经常报受限于API。有榜单。

感谢它们为「发现优质Feed」迈出了一大步。不过，目前来说还有些「小步」也可以迈。以个人为例，在找到Feed后我还会继续去关注下这些指标：全文与否、平均文章字数、更新频度、主题分类（可基于RSS <category> element实现）、条目数、建站时间。这些暂时都未集成在上述搜索引擎中，使得它们离“好用”的搜索引擎还有段距离，但未来可期。

注：上述引擎对中文内容的索引和检索中文关键词的能力都十分有限。

搜索引擎介绍聚合 FeedsPub FeedBase 开源 API

22:24 · Apr 3, 2020 · Fri

#FeedBase #介绍

上回说到 Feeds.Pub 的社会化方面和RSS之父一款产品比较像，它就是 FeedBase.io 。这是Dave这两年在开发的一款产品，有在Github开源，是一个给大家上传自己的 #OPML 文件来管理并将之公开的地方。像其所述，FeedBase有两重功用：

1️⃣ 降低OPML文件的打理难度

Dave觉得开个编辑器给OPML文件增删代码这事儿太不优雅了。所以，在FeedBase上传OPML后，在页面上直接添加Feed url或点掉对勾即可实现OPML条目的管理，新OPML文件实时动态生成。不过话说回来，你在任何阅读器都可以管理自己的订阅条目，干吗非要上FeedBase这儿来，还得上传？这就是Dave想要的第二功用：

2️⃣ 基于大家上传的OPML积累Feeds并构建订阅关系网

一个Feed被多少人订阅就是它的订阅数。一般是阅读器在干这事儿。但Dave想把这套关系网从阅读器里独立出来，就转变为计算一个Feed在多少人的OPML里出现过。所以FeedBase首页就是订阅榜，你还能看到一个Feed都哪些用户订阅了（例）。

我也传了个OPML上去，在这里。有两点tips：在FeedBase上传的OPML是完全公开的；有些OPML文件的outline里只含type、text、xmlUrl三个字段，上传会报错。必须还有htmlUrl才能上传成功。

相关阅读：
「Subscribing to A list of feeds using Feedbase.io and Liferea」

FeedBase 介绍 OPML