【应-17-1·简】HTML a 标签文本提取 - 星空OJ

140. 【应-17-1·简】HTML a 标签文本提取

简单 Python 2s 256MB

通过 0/0

📋 题目描述

爬虫从一段 HTML 里抓"链接文本"是最常见的需求。给你 N 行 HTML 文本（可能含其他标签），请把所有 `<a ...>X</a>` 中的 `X` 按出现顺序输出。

保证 a 标签不嵌套，标签拼写以 `<a` 开头（属性可有可无），开闭标签都在同一行内。

📥 输入描述

第一行整数 N（1<=N<=200）。
接下来 N 行 HTML 文本。

📤 输出描述

按出现顺序，每行一个 a 标签的内部文本。

输入样例

2
<a href="x">Home</a> <a href="y">About</a>
More <a>raw</a>

输出样例

Home
About
raw

提示：正则 `<a[^>]*>(.*?)</a>` 即可（开属性可有可无，`.*?` 取最短匹配）。把 N 行用 `\n` 拼成一段再 findall 最方便。

请登录后提交代码

讨论区 0

请登录后参与讨论

还没有讨论，来发表第一条吧！