140. 【应-17-1·简】HTML a 标签文本提取
简单
Python
📋 题目描述
爬虫从一段 HTML 里抓"链接文本"是最常见的需求。给你 N 行 HTML 文本(可能含其他标签),请把所有 `<a ...>X</a>` 中的 `X` 按出现顺序输出。
保证 a 标签不嵌套,标签拼写以 `<a` 开头(属性可有可无),开闭标签都在同一行内。
📥 输入描述
第一行整数 N(1<=N<=200)。
接下来 N 行 HTML 文本。
📤 输出描述
按出现顺序,每行一个 a 标签的内部文本。
输入样例
2 <a href="x">Home</a> <a href="y">About</a> More <a>raw</a>
输出样例
Home About raw
提示:正则 `<a[^>]*>(.*?)</a>` 即可(开属性可有可无,`.*?` 取最短匹配)。
把 N 行用 `\n` 拼成一段再 findall 最方便。
请登录后提交代码