赛题名称:水泵状态监测与故障诊断 赛题类型:数据挖掘 赛题链接👇:
https://challenge.xfyun.cn/topic/info?type=water-pump&option=ssgy&ch=vWxQGFU
赛事背景
水泵常被用于液体的输送或者液压的提升,在工业和农业应用中非常多,广泛用于农业灌溉及排涝系统,随着制造业的发达,水泵也被应用于水利、石油、化工等行业,在城市生活领域也有涉及,排水、暖通空调、输送工艺水、高温水等等方面都发挥着非常重要的作用,水泵系统运行状况的好坏直接影响着各类生产能否正常运行。
随着运行时间的积累,水泵内部会逐渐产生问题。如果能在故障发生之前检测出来,及时做好维护,将事后的维修变成事前的预防,这样就能避免设备停摆造成的损失。因此,对水泵的运行状态进行有效的实时在线状态监测和故障诊断,可以尽快发现问题,及时提供水泵维修的科学方法,有助于缩短维修时间,节约维修费用,降低能源消耗,提高设备运行的安全可靠性,真正实现水泵系统运行状态的专业化、网络化、科学化管理,是一项极具现实意义的工作。

赛事任务
本次比赛任务是根据来自水泵的传感器数据,通过训练数据训练模型,预测测试集所属状态类别。目标分为0和1,即正常和异常两种状态。
数据集介绍
赛题数据由训练集、测试集据组成,包含22个字段,其中target字段为预测目标。
| 特征字段 | 字段描述 |
|---|---|
| id | 样本标识id |
| x0-x 50 | 传感器字段, 0-50 |
| target | 预测目标, 状态标识0和1 |
解题思路
赛题是一个典型的数据挖掘赛题,因此可以考虑直接训练模型进行:
import pandas as pd
import numpy as np
from lightgbm import LGBMClassifier
from sklearn.model_selection import cross_val_predict
from sklearn.metrics import classification_report
train_data = pd.read_csv('水泵状态监测与故障诊断挑战赛公开数据/train.csv')
test_data = pd.read_csv('水泵状态监测与故障诊断挑战赛公开数据/test.csv')
model = LGBMClassifier().fit(train_data.drop(['id', 'target'], axis=1), train_data['target'])
pred = model.predict(test_data.drop(['id'], axis=1))
pd.DataFrame({'id': test_data['id'], 'target': pred}).to_csv('a.csv', index=None)
完整代码见👇:
https://github.com/datawhalechina/competition-baseline/tree/master/competition/%E7%A7%91%E5%A4%A7%E8%AE%AF%E9%A3%9EAI%E5%BC%80%E5%8F%91%E8%80%85%E5%A4%A7%E8%B5%9B2023
# 竞赛交流群 邀请函 #

每天大模型、算法竞赛、干货资讯





