bilibili-video-helper
SKILL.md
Bilibili Video Helper
本技能通过 B 站公开 API 实现视频搜索、信息挖掘、字幕/评论/弹幕提取。
API Cookie 需求一览
| 功能 | API | 需要 Cookie |
|---|---|---|
| 搜索视频 | /x/web-interface/search/type |
❌ |
| 视频详情 | /x/web-interface/view |
❌ |
| 评论列表 | /x/v2/reply |
❌ |
| 字幕列表 | /x/player/v2 |
✅ |
| 弹幕 | yt-dlp |
✅ |
说明:搜索、视频详情、评论这三个功能不需要 Cookie,可以直接调用。字幕和弹幕需要 Cookie。
前置准备:Cookie(仅字幕和弹幕需要)
如果需要获取字幕或弹幕,引导用户提供 Cookie:
请登录电脑浏览器 B 站,按 F12 打开开发者工具,切换到 网络 (Network) 标签,刷新页面后点击任意请求,在右侧 请求标头 (Request Headers) 中复制 cookie: ... 整段内容发给我。
保存为环境变量:
COOKIE='用户提供的完整cookie内容'
核心工作流
1. 搜索视频(无需 Cookie)
API: GET /x/web-interface/search/type
curl -s "https://api.bilibili.com/x/web-interface/search/type?keyword=AI&page=1&page_size=10&search_type=video" | \
jq '.data.result[] | {title: .title, author: .author, play: .play, duration: .duration, bvid: .bvid}'
参数说明:
keyword: 搜索关键词page: 页码(从 1 开始)page_size: 每页数量(最大 50)search_type=video: 搜索类型(视频)
返回字段:
title: 标题(含<em class="keyword">高亮标签)author: UP 主play: 播放量duration: 时长(如 "13:28")bvid: 视频 BV 号
2. 获取视频详情(无需 Cookie)
API: GET /x/web-interface/view
BVID="BV1hNFdz4EZp"
curl -s "https://api.bilibili.com/x/web-interface/view?bvid=$BVID" | \
jq '.data | {title, bvid, aid, cid, owner: .owner.name, desc, duration, stat}'
返回字段:
| 字段 | 说明 |
|---|---|
title |
标题 |
bvid |
BV 号 |
aid |
AV 号 |
cid |
视频分 P 的 CID |
owner.name |
UP 主 |
desc |
简介 |
duration |
时长(秒) |
stat.view |
播放量 |
stat.like |
点赞数 |
stat.coin |
投币数 |
stat.favorite |
收藏数 |
stat.share |
分享数 |
stat.danmaku |
弹幕数 |
stat.reply |
评论数 |
注意:以上所有元数据(播放量、点赞、投币、收藏、分享、弹幕、评论)均无需 Cookie 即可获取。
3. 获取评论(无需 Cookie)
API: GET /x/v2/reply
步骤 1: 获取 AID
AID=$(curl -s "https://api.bilibili.com/x/web-interface/view?bvid=$BVID" | jq -r '.data.aid')
步骤 2: 获取评论列表
curl -s "https://api.bilibili.com/x/v2/reply?type=1&oid=$AID&sort=1&ps=30" | \
jq '.data.page, (.data.replies | length)'
提取热门评论:
curl -s "https://api.bilibili.com/x/v2/reply?type=1&oid=$AID&sort=1&ps=20" | \
jq -r '.data.replies | sort_by(-.like) | .[] | "【\(.member.uname)】\(.content.message[:100])... [👍\(.like)]"'
参数说明:
type=1: 视频类型oid: 视频 AIDsort=0: 按时间排序;sort=1: 按热度排序;sort=2: 按回复数排序ps: 每页数量(最大 49)pn: 页码
4. 获取字幕(需要 Cookie)
API: GET /x/player/v2
步骤 1: 获取 CID
CID=$(curl -s "https://api.bilibili.com/x/web-interface/view?bvid=$BVID" | jq -r '.data.cid')
步骤 2: 获取字幕列表
curl -s "https://api.bilibili.com/x/player/v2?bvid=$BVID&cid=$CID" \
-H "Cookie: $COOKIE" \
-H "Referer: https://www.bilibili.com/video/$BVID" | \
jq '.data.subtitle.subtitles[] | {lan: .lan, lan_doc: .lan_doc, url: .subtitle_url}'
返回示例:
{"lan": "ai-zh", "lan_doc": "中文", "url": "//aisubtitle.hdslb.com/..."}
{"lan": "ai-en", "lan_doc": "English", "url": "//aisubtitle.hdslb.com/..."}
步骤 3: 下载字幕内容(无需 Cookie)
SUBTITLE_URL="https://aisubtitle.hdslb.com/bfs/ai_subtitle/prod/xxx"
curl -s "$SUBTITLE_URL" | jq -r '.body[].content'
字幕语言代码:
ai-zh: 中文(AI 生成)ai-en: English(AI 生成)ai-ja: 日本語(AI 生成)ai-es: Español(AI 生成)ai-pt: Português(AI 生成)ai-ar: العربية(AI 生成)
提示:B 站会自动为视频生成 AI 字幕,即使 UP 主没有上传字幕,也可能有 AI 生成的字幕可用。
5. 获取弹幕(需要 Cookie)
弹幕 API 返回 protobuf 格式,解析复杂。推荐使用 yt-dlp:
yt-dlp --add-header "Cookie:$COOKIE" --write-sub --sub-lang danmaku --skip-download -o "/tmp/%(id)s.%(ext)s" "https://www.bilibili.com/video/$BVID"
弹幕保存为 XML 格式,提取纯文本:
cat /tmp/${BVID}.danmaku.xml | sed 's/<d /\n<d /g' | grep -oP '>[^<]+<' | tr -d '<>' | grep -v '^$'
访问受限处理 (412 Precondition Failed)
如果遇到 B 站 412 错误,说明当前环境被风控。需要用户重新获取 Cookie。
6. 获取 UP 主视频列表(无需 Cookie)
API: GET /x/space/wbi/arc/search
UID="12345678"
curl -s "https://api.bilibili.com/x/space/arc/search?mid=$UID&ps=30&pn=1&order=pubdate" \
-H "User-Agent: Mozilla/5.0" | \
jq '.data.list.vlist[] | {bvid: .bvid, title: .title, play: .play, created: .created, length: .length}'
参数说明:
mid: UP 主 UIDps: 每页数量(最大 50)pn: 页码(从 1 开始)order: 排序方式,pubdate(最新)或click(最多播放)
批量翻页示例:
for pn in 1 2 3; do
curl -s "https://api.bilibili.com/x/space/arc/search?mid=$UID&ps=30&pn=$pn&order=pubdate" \
-H "User-Agent: Mozilla/5.0" | \
jq -r '.data.list.vlist[].bvid'
sleep 1.5
done
7. 无字幕时 ASR 兜底转录(需要 Cookie + SiliconFlow API Key)
当视频没有 AI 字幕时,可下载音频后调用 ASR 获取文本。
步骤 1: 用 yt-dlp 下载音频
BVID="BV1xx411c7mD"
yt-dlp --add-header "Cookie:$COOKIE" \
-f bestaudio \
--extract-audio --audio-format mp3 \
-o "/tmp/%(id)s.%(ext)s" \
"https://www.bilibili.com/video/$BVID"
步骤 2: 调用 SiliconFlow ASR 转录
AUDIO_FILE="/tmp/${BVID}.mp3"
SILICONFLOW_API_KEY="your_api_key"
curl -s "https://api.siliconflow.cn/v1/audio/transcriptions" \
-H "Authorization: Bearer $SILICONFLOW_API_KEY" \
-F "file=@${AUDIO_FILE};type=audio/mpeg" \
-F "model=FunAudioLLM/SenseVoiceSmall" | \
jq -r '.text'
决策优先级:
- 优先尝试获取 B 站 AI 字幕(免费、快)
- 字幕不存在时,才走 ASR 兜底(消耗 API 额度)
8. 可选数据持久化
提取到的内容(字幕/评论/元数据)由 AI 判断用户是否需要存储。表结构由用户自行维护,此处仅提供参考模板。
参考表结构
CREATE TABLE IF NOT EXISTS bili_videos (
bvid VARCHAR(20) PRIMARY KEY,
title TEXT,
up_name VARCHAR(255),
up_mid BIGINT,
duration INTEGER, -- 秒
view_count INTEGER,
like_count INTEGER,
coin_count INTEGER,
pub_time TIMESTAMP,
content TEXT, -- 字幕或 ASR 转录文本
source VARCHAR(20), -- 'subtitle' 或 'asr'
created_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP
);
存储示例
psql $DATABASE_URL -c "
INSERT INTO bili_videos (bvid, title, up_name, up_mid, pub_time, content, source)
VALUES ('BV1xx411c7mD', '视频标题', 'UP主名', 12345678, '2024-01-01', '字幕文本...', 'subtitle')
ON CONFLICT (bvid) DO UPDATE SET content = EXCLUDED.content;
"
存储决策原则:
- 用户明确说"保存"、"存库"、"记录下来"时才执行写入
- 默认只展示内容,不自动写库
- 数据库连接串从用户环境变量
DATABASE_URL读取
访问受限处理 (412 Precondition Failed)
如果遇到 B 站 412 错误,说明当前环境被风控。需要用户重新获取 Cookie。
注意事项
- 默认不下载视频:仅提取信息。
- 依赖检查:确保环境已安装
jq和yt-dlp。 - Cookie 需求:只有字幕、弹幕、ASR 音频下载需要 Cookie,搜索、视频详情、评论均无需 Cookie。
- API 限制:搜索 API 有频率限制,避免短时间内大量请求;批量翻页时每页间隔 1.5s 以上。
- 字幕优先:B 站会自动生成 AI 字幕,优先检查是否有可用字幕,无字幕再走 ASR。
- 存储解耦:持久化是可选动作,不与任何固定表结构绑定,用户自己管理数据库。
Weekly Installs
3
Repository
hwj123hwj/custom-skillsFirst Seen
3 days ago
Security Audits
Installed on
amp3
cline3
opencode3
cursor3
kimi-cli3
codex3