近日,《隐秘的角落》上线,不久即成为话题焦点,之后随着剧情的展开,网络评分居高不下,引发话题不断,还带火了“爬山梗”“秃头梗”等热门词汇。

很多小伙伴,忙于学习、忙于工作,没有时间去看这部好看的国产剧,但是精彩哪能错过,接下来就让用python带你来了解一下比剧情更精彩的弹幕吧!
一、数据来源
本来想去自己爬一下,但是意外发现了现成的数据,有20多万条弹幕,本着节约时间,并且不给爱奇艺添麻烦的理念,就用现成的吧,哈哈!

import pandas as pd
data = pd.read_csv('dan_mu.csv')
print(data.shape) # 查看数据维度
print(data.duplicated(['contentsId']).value_counts()) # 查看重复值
print(data.isnull().sum(axis=0)) # 查看缺失值
print(data.head()) # 查看一下数据(前5行)

OK,我们可以看到,数据很完美,一共有20多万条数据,没有缺失值和重复值。感谢大佬的无私奉献!
ps:pycharm虽说强大,但是数据展示效果真的是跟spyder差远了,可惜现在电脑上没装spyder.凑合看吧!
二、弹幕分析
- 被点赞最多的弹幕TOP 10
data_top = data.sort_values(by=['likeCount'], ascending=[False])
print(data_top.head(10))

“好秃然”、“秦昊:爬山吗?一秒下山的那种”、“就不能整点阳间的BGM吗”,果然,弹幕往往比剧情更加精彩!!!
"秦昊:爬山吗?一秒下山的那种"出现在第一集,而剧情正是第一集:秦昊扮演的角色张东升,带岳父母去爬山拍照时,一把推下了他们,被誉为史上最恐怖的影视剧第一集。
- 每集最秀弹幕
第一集最秀弹幕非“秦昊:爬山吗?一秒下山的那种”莫属,那么我们一起看看,每集最秀的弹幕是啥吧!(莫名有点小激动.)
data_tvtop = data[data.groupby(['tv_name'])['likeCount'].rank(method="first", ascending=False) == 1].reset_index()[['tv_name', 'contents', 'likeCount']]
print(data_tvtop)

真是秀儿无处不在!!!你们这么秀,我东哥还有机会秀吗? 东哥不要面子的???

- 那么多演员,到底谁是你眼中的”大哥“
# 建立名字对应字典
name_dict = {'张东升': '东升|秦昊|张老师|东哥|升哥', '朱朝阳': '朝阳', '严良': '严良', '普普': '普普', '朱永平': '朱永平', '周春红': '春红|大娘子', '王瑶': '王瑶', '徐静': '徐静|黄米依', '陈冠声': '王景春|老陈|陈冠声', '叶军': '叶军|皮卡皮卡', '马主任': '主任|老马', '朱晶晶': '晶晶', '叶驰敏': '叶驰敏'}
# 判定每个弹幕,是否包含这些名字
for key, value in name_dict.items():
data[key] = data['contents'].str.contains(value)
# 将名字与被弹幕包含的次数对应起来
name_count = pd.Series({key: data.loc[data[key], 'contentsId'].count() for key in name_dict.keys()}).sort_values(ascending=False)
画个图看一下:

你”东哥“到底还是你”东哥“,”东哥“的面子还是要给足!
比较意外的是,”朝阳“为啥出现那么少???二十多万条弹幕就22条?我去快速过了一下数据,果然是真的没看到朝阳。你们这样朝阳会伤心的,气得朝阳要去写日记啦!
- 一眼看尽20万弹幕
弹幕20多万条,我来告诉你到底说的啥!

”孩子“:该剧改编自推理小说家紫金陈的原著《坏小孩》,剧版之所以没有沿用原著的名字,可能的原因是,我们并不会在剧中直接感受到小孩有多坏,或者说,当我们随着剧情展开,一点一点见证小孩是如何“变坏”的之后,就很难再去单纯指责孩子的坏了。
”爬山“:张东升:一起去爬山吗?另外,剧中的山是”六峰山“,其实风景还是很不错滴,十一长假可以去打个卡。
”演技“:演技这个词这么大的,看来大家对这部剧的演技十分关注,局我听说的零碎来推断,应该是演技很不错。
”严良“:这个人名出现次数仅次于张东升,朱朝阳不应该是主角吗?咋严良那么多的相关弹幕?咱也没看,也不知道,咱也不敢问!
OK,就分析到这里吧,最后,希望大家都生活在真正的干净、纯洁的精神世界中,不要试图触碰那本不该有的”隐秘的角落“。





