每日一题17:Pandas:布尔索引之文章浏览 I

发布于:2024-05-20 ⋅ 阅读:(167) ⋅ 点赞:(0)
一、每日一题 

Views 表:

+---------------+---------+
| Column Name   | Type    |
+---------------+---------+
| article_id    | int     |
| author_id     | int     |
| viewer_id     | int     |
| view_date     | date    |
+---------------+---------+
此表可能会存在重复行。(换句话说,在 SQL 中这个表没有主键)
此表的每一行都表示某人在某天浏览了某位作者的某篇文章。
请注意,同一人的 author_id 和 viewer_id 是相同的。

请查询出所有浏览过自己文章的作者

结果按照 id 升序排列。

查询结果的格式如下所示:

示例 1:

输入:
Views 表:
+------------+-----------+-----------+------------+
| article_id | author_id | viewer_id | view_date  |
+------------+-----------+-----------+------------+
| 1          | 3         | 5         | 2019-08-01 |
| 1          | 3         | 6         | 2019-08-02 |
| 2          | 7         | 7         | 2019-08-01 |
| 2          | 7         | 6         | 2019-08-02 |
| 4          | 7         | 1         | 2019-07-22 |
| 3          | 4         | 4         | 2019-07-21 |
| 3          | 4         | 4         | 2019-07-21 |
+------------+-----------+-----------+------------+

输出:
+------+
| id   |
+------+
| 4    |
| 7    |
+------+

解答:

import pandas as pd

def article_views(views: pd.DataFrame) -> pd.DataFrame:
    
    # 过滤 author_id 与 viewer_id 相同的行
    self_view = views[views['author_id'] == views['viewer_id']]
    
    # 获取唯一的 author_id 并排序
    self_view_authors = self_view.drop_duplicates
    (subset = ['author_id']).sort_values("author_id")
    
    result = self_view_authors.rename(columns={ 'author_id': 'id'})
    return result[["id"]]

题源:Leetcode 

二、总结

本题考察drop_duplicates()的用法,详细用法参考另一篇博客

本题考试rename的用法,详细用法参考另一篇博客

2024.5.20


网站公告

今日签到

点亮在社区的每一天
去签到