暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

【python数据分析刷题】-N07.合并

原创 IT邦德 2022-08-15
927

在这里插入图片描述

📢📢📢📣📣📣
哈喽!大家好,我是【IT邦德】,江湖人称jeames007,10年DBA工作经验
一位上进心十足的【大数据领域博主】!😜😜😜
中国DBA联盟(ACDU)成员,目前从事DBA及程序编程
擅长主流数据Oracle、MySQL、PG 运维开发,备份恢复,安装迁移,性能优化、故障应急处理等。
✨ 如果有对【数据库】感兴趣的【小可爱】,欢迎关注【IT邦德】💞💞💞
❤️❤️❤️感谢各位大可爱小可爱!❤️❤️❤️

文章目录

前言

Python实际针对数据分析的学习是库,用库来解决一系列的数据分析问题

🐴 DA37 统计运动会项目报名人数

🚀 描述

某公司计划举办一场运动会,现有运动会项目数据集items.csv。 包含以下字段: item_id:项目编号; item_name:项目名称; location:比赛场地。 有员工报名情况数据集signup.csv。包含以下字段: employee_id:员工编号; name:员工姓名; sex:性别; department:所属部门; item_id:报名项目id 请你统计各类型项目的报名人数。

📖 输入描述

数据集可以从当前目录下items.csv、signup.csv读取。
items.csv
在这里插入图片描述
signup.csv
在这里插入图片描述
📖 输出描述:
只输出报名人数不为0的项目及其对应的报名人数。以上数据集的输出如下:

在这里插入图片描述
🍌🍌 答案

import pandas as pd signup = pd.read_csv('signup.csv') items = pd.read_csv('items.csv') new=pd.merge(items,signup, on='item_id') print(new.groupby('item_name').employee_id.count())

在这里插入图片描述

🐴 DA38 统计运动会项目报名人数(二)

🚀 描述

某公司计划举办一场运动会,现有运动会项目数据集items.csv。 包含以下字段: item_id:项目编号; item_name:项目名称; location:比赛场地。 有员工报名情况数据集signup.csv。包含以下字段: employee_id:员工编号; name:员工姓名; sex:性别; department:所属部门; item_id:报名项目id 请你统计各类型项目的报名人数。

📖 输入描述

数据集可以从当前目录下items.csv、signup.csv读取。
items.csv
在这里插入图片描述
signup.csv
在这里插入图片描述
📖 输出描述:

输出items.csv中所有项目的报名人数(没有人报名的项目的报名人数输出为0即可)。
以上数据集的输出如下:

在这里插入图片描述
🍌🍌 答案

import pandas as pd signup = pd.read_csv('signup.csv') items = pd.read_csv('items.csv') a=pd.merge(items,signup,on='item_id',how='left') print(a.groupby('item_name')['employee_id'].count())

在这里插入图片描述

🐴 DA39 多报名表的运动项目人数统计

🚀 描述

某公司计划举办一场运动会,现有部分运动会项目数据集items.csv。 包含以下字段: item_id:项目编号; item_name:项目名称; location:比赛场地。 有员工报名情况数据集signup.csv。包含以下字段: employee_id:员工编号; name:员工姓名; sex:性别; department:所属部门; item_id:报名项目id。 另有signup1.csv,是education部门的报名情况,包含字段同signup.csv。 请你将signup.csv与signup1.csv的数据集合并后,统计各类型项目的报名人数。

📖 输入描述

数据集可以从当前目录下items.csv、signup.csv、signup1.csv读取。
items.csv
在这里插入图片描述
signup.csv
在这里插入图片描述
signup1.csv
在这里插入图片描述
📖 输出描述:
只输出报名人数不为0的项目及其对应的报名人数。
以上数据集的输出如下:

在这里插入图片描述

🍌🍌 答案

import pandas as pd signup = pd.read_csv('signup.csv') signup1 = pd.read_csv('signup1.csv') items = pd.read_csv('items.csv') signup2=pd.concat([signup,signup1],axis=0) result1=pd.merge(items,signup2,how='inner',on='item_id') result=result1.groupby('item_name') print(result.size())

在这里插入图片描述

🐴 DA40 统计职能部分运动会某项目的报名信息

🚀 描述

某公司计划举办一场运动会,现有运动会项目数据集items.csv。 包含以下字段: item_id:项目编号; item_name:项目名称; location:比赛场地。 有员工报名情况数据集signup.csv。包含以下字段: employee_id:员工编号; name:员工姓名; sex:性别; department:所属部门; item_id:报名项目id 请你统计职能部门(functional)中报名标枪(javenlin)的所有员工的员工编号(employee_id)、姓名(name)及性别(sex)。

📖 输入描述

数据集可以从当前目录下items.csv、signup.csv读取。
items.csv
在这里插入图片描述
signup.csv
在这里插入图片描述
📖 输出描述:
输出职能部门(functional)中报名标枪(javenlin)的所有员工的员工编号(employee_id)、姓名(name)及性别(sex)。
以上数据集的输出如下(注意:结果中行标签从0开始顺序排序):

在这里插入图片描述
🍌🍌 答案

import pandas as pd signup = pd.read_csv('signup.csv') items = pd.read_csv('items.csv') df = pd.merge(signup,items,on="item_id") df1 = df[(df["department"] == "functional") & (df["item_name"] == "javelin")] df2 = df1[["employee_id","name","sex"]] print(df2)

在这里插入图片描述

在这里插入图片描述

「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论