140. 【应-17-1·简】HTML a 标签文本提取

简单 Python 2s 256MB
通过 0/0

📋 题目描述
爬虫从一段 HTML 里抓"链接文本"是最常见的需求。给你 N 行 HTML 文本(可能含其他标签),请把所有 `<a ...>X</a>` 中的 `X` 按出现顺序输出。 保证 a 标签不嵌套,标签拼写以 `<a` 开头(属性可有可无),开闭标签都在同一行内。
📥 输入描述
第一行整数 N(1<=N<=200)。 接下来 N 行 HTML 文本。
📤 输出描述
按出现顺序,每行一个 a 标签的内部文本。
输入样例
2
<a href="x">Home</a> <a href="y">About</a>
More <a>raw</a>
输出样例
Home
About
raw
提示:正则 `<a[^>]*>(.*?)</a>` 即可(开属性可有可无,`.*?` 取最短匹配)。 把 N 行用 `\n` 拼成一段再 findall 最方便。

登录后提交代码

讨论区 0
登录后参与讨论

还没有讨论,来发表第一条吧!