rsshub
Version:
Make RSS Great Again!
100 lines (87 loc) • 3.24 kB
text/typescript
import { Route } from '@/types';
import cache from '@/utils/cache';
import got from '@/utils/got';
import { load } from 'cheerio'; // cheerio@1.0.0
import { parseDate } from '@/utils/parse-date';
import timezone from '@/utils/timezone';
const noticeType = {
whxx: { title: '上海大学 - 文化信息', url: 'https://www.shu.edu.cn/xnrc/whxx.htm' },
xsbg: { title: '上海大学 - 学术报告', url: 'https://www.shu.edu.cn/xnrc/xsbg.htm' },
};
export const route: Route = {
path: '/xykd/:type?',
categories: ['university'],
example: '/shu/xykd/xsbg',
parameters: { type: '分类,默认为学术公告' },
features: {
requireConfig: false,
requirePuppeteer: false,
antiCrawler: false,
supportBT: false,
supportPodcast: false,
supportScihub: false,
},
radar: [
{
source: ['www.shu.edu.cn/'],
target: '/xykd',
},
],
name: '校园看点',
maintainers: ['GhhG123'],
handler,
url: 'www.shu.edu.cn/',
description: `| 文化信息 | 学术报告 |
| -------- | --------- |
| whxx | xsbg |`,
};
async function handler(ctx) {
const type = ctx.req.param('type') ?? 'xsbg';
const rootUrl = 'https://www.shu.edu.cn';
// 发起 HTTP GET 请求
const response = await got({
method: 'get',
/* headers: {
'user-agent': UA,
cookie: await getCookie(ctx),
}, */
url: noticeType[type].url,
});
const $ = load(response.data);
const list = $('div.xsbg_list ul li') // 定位到HTML结构中的li元素
.toArray()
.map((el) => {
const item = $(el); // 使用Cheerio包装每个li元素
const rawLink = item.find('a').attr('href');
const dateParts = item
.find('div.sj p')
.toArray()
.map((p) => $(p).text().trim()); // 提取日期部分
return {
title: item.find('p.bt').text().trim(), // 获取标题
link: rawLink ? new URL(rawLink, rootUrl).href : rootUrl, // 生成完整链接
pubDate: timezone(parseDate(`${dateParts[1]}-${dateParts[0]}`, 'MM-DD'), +8), // 拼接并解析日期
description: item.find('div.zy').text().trim(), // 提取简要描述
};
});
const items = await Promise.all(
list.map((item) =>
cache.tryGet(item.link, async () => {
const detailResponse = await got({
method: 'get',
url: item.link,
}); // 获取详情页内容
const content = load(detailResponse.data); // 使用cheerio解析内容
item.description = content('#vsb_content_500 .v_news_content').html() || item.description; // 提取内容区详情
return item; // 返回完整的item
})
)
);
return {
title: noticeType[type].title,
description: noticeType[type].title,
link: noticeType[type].url,
image: 'https://www.shu.edu.cn/__local/0/08/C6/1EABE492B0CF228A5564D6E6ABE_779D1EE3_5BF7.png',
item: items,
};
}