暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

科大讯飞:水泵故障监测 baseline

Coggle数据科学 2023-09-28
705
  • 赛题名称:水泵状态监测与故障诊断
  • 赛题类型:数据挖掘
  • 赛题链接👇:

https://challenge.xfyun.cn/topic/info?type=water-pump&option=ssgy&ch=vWxQGFU

赛事背景

水泵常被用于液体的输送或者液压的提升,在工业和农业应用中非常多,广泛用于农业灌溉及排涝系统,随着制造业的发达,水泵也被应用于水利、石油、化工等行业,在城市生活领域也有涉及,排水、暖通空调、输送工艺水、高温水等等方面都发挥着非常重要的作用,水泵系统运行状况的好坏直接影响着各类生产能否正常运行。

随着运行时间的积累,水泵内部会逐渐产生问题。如果能在故障发生之前检测出来,及时做好维护,将事后的维修变成事前的预防,这样就能避免设备停摆造成的损失。因此,对水泵的运行状态进行有效的实时在线状态监测和故障诊断,可以尽快发现问题,及时提供水泵维修的科学方法,有助于缩短维修时间,节约维修费用,降低能源消耗,提高设备运行的安全可靠性,真正实现水泵系统运行状态的专业化、网络化、科学化管理,是一项极具现实意义的工作。

赛事任务

本次比赛任务是根据来自水泵的传感器数据,通过训练数据训练模型,预测测试集所属状态类别。目标分为0和1,即正常和异常两种状态。

数据集介绍

赛题数据由训练集、测试集据组成,包含22个字段,其中target字段为预测目标。

特征字段字段描述
id样本标识id
x0-x 50传感器字段, 0-50
target预测目标, 状态标识0和1

解题思路

赛题是一个典型的数据挖掘赛题,因此可以考虑直接训练模型进行:

import pandas as pd
import numpy as np
from lightgbm import LGBMClassifier
from sklearn.model_selection import cross_val_predict
from sklearn.metrics import classification_report

train_data = pd.read_csv('水泵状态监测与故障诊断挑战赛公开数据/train.csv')
test_data = pd.read_csv('水泵状态监测与故障诊断挑战赛公开数据/test.csv')

model = LGBMClassifier().fit(train_data.drop(['id''target'], axis=1), train_data['target'])
pred = model.predict(test_data.drop(['id'], axis=1))

pd.DataFrame({'id': test_data['id'], 'target': pred}).to_csv('a.csv', index=None)

完整代码见👇:

https://github.com/datawhalechina/competition-baseline/tree/master/competition/%E7%A7%91%E5%A4%A7%E8%AE%AF%E9%A3%9EAI%E5%BC%80%E5%8F%91%E8%80%85%E5%A4%A7%E8%B5%9B2023

 竞赛交流群 邀请函  #

△长按添加竞赛小助手

每天大模型、算法竞赛、干货资讯

与 36000+来自竞赛爱好者一起交流~

文章转载自Coggle数据科学,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论